Development of Semantic Web Application Architecture
       for Natural Language Based Querying

     Ceren Ocal Tasar1[0000-0002-0652-7386], Murat Komesli2[0000-0002-8240-5540],
                   Murat Osman Unalir3[0000-0003-4531-0566]
                   1
                       Yasar University, Software Engineering Department
                       Universite Cad. 35, 35100, Bornova, Izmir, Turkey
                               ceren.ocal@yasar.edu.tr

           2
               Yasar University, Management Information Systems Department
                     Universite Cad. 35, 35100, Bornova, Izmir, Turkey
                          murat.komesli@yasar.edu.tr

                   3
                       Ege University, Computer Engineering Department
                       Universite Cad. 9, 35100, Bornova, Izmir, Turkey
                          murat.osman.unalir@ege.edu.tr


   Abstract. With the developing technology and increased demand on practical
   usage of knowledge, users require to interact with systems by using natural lan-
   guage. Researchers discover the necessity of natural language queries should be
   converted to machine understandable format to meet the requirement of users.
   The necessity of the conversion triggered the researches on studies on question
   answering systems that is one of the systems mostly interact with natural lan-
   guage queries. For question answering systems that utilizes structural knowledge
   sources, understanding user intention accurately consists of the processes of nat-
   ural language processing, representing the user intention and forming structured
   query to generate the answer. A technique and an architecture to convert natural
   language query to ontology query language by utilizing from both linguistic and
   semantic technologies are proposed in this study. Automatic conversion of an
   unstructured natural language query to a structured ontology query language
   SPARQL and process of producing answer over linked data are explained in the
   proposed technique and architecture. A different approach other than the related
   studies is followed in terms of defining a “Query Semantization” layer in the
   proposed architecture and developing a natural language aware ontology for the
   technique proposed. Contribution to the literature is expected by combining nat-
   ural language processing technique and semantic web technologies with a differ-
   ent approach.


   Keywords: Natural Language Processing, Ontology Development, Semantic
   Web Application Architecture.
2


      Doğal Dil Tabanlı Sorgulama İçin Anlamsal Web
           Uygulama Mimarisinin Geliştirilmesi

       Özet. Gelişen teknoloji ve giderek artan bilginin pratik kullanım ihtiyacı doğrul-
       tusunda kullanıcıların sistemler ile doğal dil kullanarak etkileşime geçme ihtiyacı
       doğmuştur. Bu ihtiyacın karşılanması için doğal dil sorgularının makine tarafın-
       dan anlaşılır bir yapıya dönüştürülmesi gerekliliği araştırmacılar tarafından
       gözlemlenmiştir. Bu gereklilik doğal dil sorgusu ile en çok etkileşime geçen sis-
       temlerden biri olan soru cevaplama sistemleri alanındaki birçok araştırmayı teti-
       klemiştir. Yapısal bilgi kaynakları kullanan soru cevaplama sistemleri için
       kullanıcının bilgi ihtiyacının doğru olarak anlaşılması süreci doğal dil sorgusu-
       nun işlenmesi, kullanıcının bilgi ihtiyacının temsili ve yapısal sorgu üretilerek
       cevabın oluşturulması süreçlerini kapsamaktadır. Bu çalışmada doğal dil sor-
       gusunun, hem dilbilimsel, hem de anlamsal teknolojilerden yararlanılarak on-
       toloji sorgu diline çevrilmesi için bir yöntem ile mimari önerilmiştir. On-
       tolojilerin bilgi kaynağı olarak kullanıldığı önerilen yöntem ve mimaride, yapısal
       olmayan doğal dil sorgusunun otomatik olarak yapısal bir sorgu dili olan
       SPARQL’a dönüştürülmesi ve üretilen sorgu ile bağlı veri üzerinden cevap
       üretilmesi süreçleri açıklanmıştır. Önerilen mimaride açıklanan “Sorgu An-
       lamsallaştırma” katmanı, bu katmanda tanıtılan işlemler ve doğal dil farkında bir
       ontoloji geliştirilerek tasarlanan yöntem ile ilgili çalışmalardan farklı bir yak-
       laşım izlenmiştir. Doğal dil işleme teknikleri ve anlamsal web teknolojilerinin
       birleştirilerek tasarlanan bu farklı yaklaşım ile literatüre katkı hedeflenmektedir.


       Anahtar Kelimeler: Doğal Dil İşleme, Ontoloji Geliştirme, Anlamsal Web Uy-
       gulama Mimarisi.


1   Giriş

Teknolojinin hayatımızdaki önemi ve depolanan veri miktarı çoğaldıkça, son
kullanıcılar için bilgiye daha hızlı ve kolay erişim sürekli olarak çözümü iyileştirilmeye
çalışılan bir probleme dönüşmüştür. Kullanıcıların kendilerini en rahat hissettikleri
sorgu tipi günlük hayatta iletişim için kullandıkları doğal dildir. Doğal dille temsil
edilen kullanıcının bilgi ihtiyacının makine tarafından anlaşılır bir forma dö-
nüştürülmesi gerekmektedir. Bu alanda çalışan araştırmacılar, doğal dilin ayrıştırılması,
her bir öğenin analizi, makine anlaşılır bir temsile çevrilmesi ve otomatik olarak cevap
üretilmesi süreçlerine yoğunlaşmaya başlamışlardır. Bu gelişmeler doğrultusunda ya-
pay zekânın bir alt birimi olan doğal dil işleme (DDİ) konusu popülerlik kazanmıştır.
DDİ; verilen bir doğal dil sorgusunun bileşenlerine ayrıldığı, her bileşenin ve bileşenler
arası ilişkilerin dilbilimsel olarak analiz edildiği süreçlerin bütünüdür. DDİ, verilen
                                                                                           3


sorgu ile ilgili detaylı sonuçlar çıkarsa da anlamsal analiz ile ilgili yetersiz kaldığı nok-
talar bulunmaktadır. Dilbilimsel analiz sürecini anlama ve uzlaşma konusunda bir üst
seviyeye çıkartabilecek ve onu destekleyecek anlamsal teknolojilere ihtiyaç vardır.
   Anlamsal teknolojilerin arkasındaki temel bileşen, belirli bir alanda tanımlanan
kavramlar arasındaki ilişkiler ve taksonomi ile kavramsallaştırmayı temsil eden on-
tolojilerdir. Farklı platformlar arasında bilgi paylaşımı ve değişimi yapılabilmesinde
önemli rol oynarlar. Bu sebepten dolayı ontoloji kavramı, sözdizimi, OWL ya da RDF
ile temsil edilmesi ve ontoloji sorgu dilleri olan RDQL, SPARQL konularındaki
çalışmalarda artış görülmektedir [1]. Anlamsal teknolojilerin yaygınlaşması ile DDİ
alanındaki gelişmeler yeni bir yön kazanmıştır. Araştırmacılar arasında kullanıcıyı an-
lamak ve sorularına cevap üretmek için DDİ tekniklerini anlamsal teknolojiler ile
birleştiren melez yöntemler tartışılmaya başlanmıştır. Bu aşamada ilk odaklanılan konu
anlamsal teknolojilerin DDİ yöntemlerini güçlendirmeye nasıl yardımcı olacağı
olmuştur. İkinci önemli konu ise, anlamsal web geliştirmede kullanılan ontoloji öğren-
mesi, ontoloji sorgulama, çok dilli ontoloji eşleştirme yöntemlerinde DDİ’nin hangi
noktalarda katkı sağlayabileceği olmuştur [2].
   Cümle anlama, içerisinde temel olarak iki süreç barındırır. Bunlardan ilki morfolojik
olarak incelenmesi, ikincisi ise anlamsal analizdir [3]. Morfolojik analiz kelimelerin
yapılarıyla ilgilenirken anlamsallığa ulaşmak için kelimeler arası ilişkiler, kelimelerin
POS (“part of speech”, kelime türü) etiketleri (isim, fiil, sıfat, vb.) ve cümle içindeki
görevlerini (özne, yüklem, nesne, vb.) çıktı olarak üretir. Anlamsallık seviyesine kat-
kıda bulunmak için, varlık ismi tanıma yönteminden faydalanılır. Bu yöntem doğal dil
sorgusunda bulunan varlıkların önceden tanımlanmış kategorilerle (kişi, organizasyon,
tarih, lokasyon, vb.) işaretlenmesini sağlar [4]. Üretilen bu çıktılar, doğal dil sorgusu-
nun zenginleştirilmesi için ontolojilerle birleştirilerek kullanılır. Bu yaklaşım özellikle
doğal dil ile sorgulama imkanı sağlayan soru cevaplama sistemleri için ontolojilerin
bilgi kaynağı olarak kullanılmasını sağlar. Doğal dil sorgusu ile temsil edilen bilgi ih-
tiyacı ontolojinin sorgu diline dönüştürülür. Kullanıcılar ontoloji sorgu dilini, yapıyı ve
ontoloji sözlüğünü öğrenme ihtiyacı olmaksızın ontolojilerdeki bilgiye ulaşabilirler.
Kullanıcılar ile sistemler arası köprü kuran bu yaklaşım sayesinde ontolojilerin pratik
kullanımı da sağlanmış olmaktadır [5].
   Bu çalışmada DDİ teknikleri ve anlamsal web teknolojilerinin birleştirilmesi yak-
laşımı ile tasarlanan mimari sunulmuştur. Bu bölümde konuya bir giriş yapılarak Bölüm
2’de temel kavramlar açıklanmış ve benzer çalışmalar sunulmuştur. Bölüm 3’de doğal
dil farkında ontoloji geliştirme açıklanmıştır. Bölüm 4’de, doğal dil sorgularının
otomatik olarak anlamsal web sorgularına dönüştürülmesi ve çalışmada önerilen
mimari açıklanmıştır. Son bölümde ise, çalışmanın katkısı, diğer yaklaşımlar ile farkları
ve benzerlikleri, sağlayacağı katkılar ve bu katkıların genişletilerek gelecek çalışmalara
hangi şekilde yol gösterebileceği tartışılmıştır.
4


2     Temel Kavramlar ve İlgili Çalışmalar

2.1    Doğal Dil İşleme
Yapay zeka ve hesaplamalı dilbilim konularına ait bir araştırma konusu olan doğal dil
işlemenin temel konusu içeriği çözümleme, kelime yapılarının ve kelimeler arası
ilişkilerin anlaşılması için kelime, cümle ve metin işlemedir. Doğal dil işlemenin temel
prensibi; doğal dil verisinin dilbilim yöntemleri kullanılarak zenginleştirilmesi olarak
özetlenebilir. Doğal dilde kullanılan olası kelime sayısı oldukça fazladır ve verilen bir
kelime için belirli eklerle birleştirilip anlamları birbirinden farklı kelimeler türetilmesi
olasıdır. Bu sebepten dolayı doğal dilde bulunan kelime kümesinin geniş ve karmaşık
olduğu görülmektedir. [6].
    Doğal dil girdisi kabul ederek, makine tarafından anlaşılır çıktıya dönüştüren doğal
dil işleme sistemlerinin blok diyagramı Şekil 1’de gösterilmiştir.


                   Şekil 1. Bir DDİ sistemi için sistem blok diyagramı [7].

   Hayes ve Carbonell [8], doğal dil işlemeyi, doğal dille iletişim için hesaplama etkili
mekanizmaların formüle edildiği ve araştırıldığı alan olarak tanımlamıştır. Doğal dil
işlemenin temel motivasyonu insan dilinin modellenmesi ve bilgisayar sistemleri
tarafından oluşturulan modellerin verimli ve etkin bir şekilde kullanılması olarak belir-
tilmiştir [8].
   Liddy [9], doğal dil işlemeyi bir dizi görev veya uygulama için insan benzeri dil
işlemenin gerçekleşmesi amacıyla metnin bir ya da daha fazla seviyede dilbilimsel an-
alizi ve temsili için bir dizi teorik hesaplama teknikleri olarak tanımlamıştır. Bu tanımı
yaparken bir dizi hesaplama teknikleri kavramını birden fazla seviyede çeşitli dil-
bilimsel analiz tekniklerini temsil etmek adına vurgulamıştır. Her bir dilbilimsel analiz
seviyesi anlama ulaşmak için ayrı bir görev üstlenir. Bu sebepten dolayı sistemlerin
daha doğru ve etkin sonuçlar üretebilmesi için uygulama ihtiyacına göre hangi seviye
ya da seviyelerde analiz yapılması gerektiğinin iyi belirlenmesi gerekmektedir [9].
2.2     Ontoloji Geliştirme
Felsefe bilimi ontolojiyi varoluşun konusu [10] ve belirli bir alanda geçerli olan varo-
luşun kategorize edilmesi [11] olarak tanımlar. Bilgisayar bilimleri ve bilgi bilimleri
                                                                                          5


alanında ontolojilerde bilgi, kavramlardan oluşan bir küme ve bu kavramlar arasındaki
ilişki tanımları ile temsil edilir. Bir başka deyişle, belirli bir alanı, kavramların tanım-
ları, özellikleri ve ilişkileri ile modelleyen ortak bir sözlük paylaşımı ontolojiler tara-
fından yapısal bir şekilde sunulur.
    Gruber’in [12] tanımında, ontolojiler paylaşılan kavramsallaştırmanın resmi ve açık
tanımlamaları olarak ifade edilir. Kavramsallaştırma; belirli bir amaç doğrultusunda
dünyanın soyut ve sadeleştirilmiş bir görüntüsüdür. Gruber [13], bir diğer çalışmasında,
kavramsallaştırmanın her bilgi tabanlı sisteminde açık veya kapalı şekilde var olduğuna
değinmiştir. Tanımda kullanılan ikinci önemli ifade olan resmi ve açık tanımlama, on-
tolojinin makine tarafından okunur/anlaşılır olabilmesi için tanımlayıcı, açık ve belirli
bir standartlarda temsil edilmesi gerektiğine atıfta bulunmaktadır.
    Hendler [14], ontolojiyi sözlük, anlamsal ilişkiler, belirli bir alana özel tanımlı bazı
çıkarsama ve mantık kurallarından ulaşan terimler kümesi olarak tanımlar. Hendler,
mantıksal kurallar ve çıkarsama mekanizması kullanılarak kavramlar arasında anlamsal
tanımlamalar ile bağlantı kurulduğuna dikkat çeker.
    Kalfoglou’na [15] göre, ontoloji, bazı ilgi alanlarındaki önemli kavramların ortak
bir anlayışının açık bir temsilidir. Nesnellik kavramı ortak anlayış amacını destekler ve
nesnelliğe ulaşabilmek için açık kavramsal bir yapı kullanıldığını belirtmiştir. Ontolo-
jinin nesnel olma özelliği, akıllı ajanlar ve uygulamalara bilgi paylaşımı ve tekrar kul-
lanımı sayesinde anlamsal uyumluluk ve birlikte çalışabilirlik özelliğini sağlamıştır.
    Noy and McGuinness [16]’ in ontoloji geliştirme 101’de tanımladığı adımlar ise şu
şekilde sıralanmaktadır:
       Adım 1: Ontoloji alanının ve kapsamının belirlenmesi
       Adım 2: Hâlihazır ontolojilerin yeniden kullanımının gözden geçirilmesi
       Adım 3: Ontolojideki önemli terimlerin belirtilmesi
       Adım 4: Sınıfların ve sınıf hiyerarşisinin tanımlanması
       Adım 5: Sınıfların özelliklerinin tanımlanması
       Adım 6: Özellikler ile ilgili nitelik ve kısıtların belirlenmesi
       Adım 7: Sınıf örneklerinin oluşturulması.

   Bölüm 3’de bu adımlar izlenerek doğal dil tabanlı sorgulama için doğal dil farkında
ontoloji geliştirilmesi açıklanmıştır.

2.3    Anlamsal Web Teknolojileri ile Ontoloji Kullanarak Soru Cevaplama
Bilgisayarlar tarafından doğal dil anlama ve yorumlamanın hayata geçirilmesi için ses
ve dil işleme, insan dili teknolojileri, doğal dil işleme, hesaplamalı dilbilim ve konuşma
tanıma/sentezleme gibi birçok farklı disiplini bir araya getirmek gerekmektedir. Temel
hedef, insan-makine ve insan-insan arasındaki iletişimi iyileştirmek ve metin ya da ses
verisinin kullanışlı bir şekilde işlenebilmesini sağlamaktır. Soru cevaplama sistemleri
ise, doğal dil sorgularını yapısal sorgulara dönüştüren, bu sorgularına cevaplar üreten
ve doğruluk oranları çeşitli metrikler ile ölçülebilen bu hedefe katkı sağlayan sistem-
lerdir.
    Bir soru cevaplama sistemi 3 temel sürece sahiptir. Bu süreçler doğal dil girdisinin
işlenmesi, kullanıcının bilgi ihtiyacının anlaşılması ve bu doğrultuda cevap üretilmesi
6


şeklinde sıralanır. Soru cevaplama sistemleri 2 farklı temel yaklaşımda görülmektedir.
Bunlardan ilki bilgi geri getirimi tabanlı soru cevaplamadır, diğeri ise, bilgi tabanına
dayalı soru cevaplamadır [17]. Cevap üretmek için bilgi geri getirimi tekniklerini
kullanan ilk yaklaşım, metin tabanlı soru cevaplama ya da belge tabanlı soru cevaplama
olarak da bilinir. Verilen bir doğal dil sorgusu için cevabı içerebilecek aday belgelerin
oluşturulması bir arama mekanizması kullanılarak gerçekleştirilir.
    İkinci yaklaşım olan bilgi tabanlı soru cevaplama sistemlerinde, odak noktası
yapısal olmayan doğal dil sorgularının yapısal olan bir bilgi tabanı sorgu diline
çevrilmesi esas alınmaktadır. Bilgi tabanlı soru cevaplama sistemleri kural tabanlı,
gözetimli ya da yarı gözetimli yöntemler kullanırlar. Kural tabanlı yöntemler sorudan
ilişkileri çıkarmak için tanımlı kurallar ve örüntüler kullanırlar. Gözetimli yöntemler
ise, mantıksal form ile eşleşmiş soru kümelerinden oluşan işaretlenmiş eğitim veri setle-
rini kullanan öğrenme algoritmalarından faydalanırlar. Gözetimli öğrenme algoritma-
ları genel olarak doğal dil sorgu kavramları ile bilgi kaynaklarında tanımlı kavramların
eşleştirilme süreci için ayrıştırma ağaçlarını kullanırlar [17].
    Anlamsal web teknolojilerinin giderek gelişmesi bağlı verinin artışını sağlamıştır.
Bu artış beraberinde gerçek hayat ihtiyacını temsil eden daha geniş bir spektrumda bağlı
veri kullanımı sağlamıştır [1]. Ayrıca bağlı veri artışı, birbiriyle bağlantılı RDF veri
setlerine sahip olan bağlı veri depolama kaynaklarına erişim ve kullanım ihtiyacını da
arttırmaktadır. Bu ihtiyaç doğrultusunda araştırmacılar arasında kullanıcıların yapısal
bir sorgu dili bilmeden bağlı veri depolayan ontolojilerden nasıl yararlanacakları yeni
bir odak noktası olmuştur [18]. Anlamsal teknolojilerin arka planındaki karmaşık ra-
syonellikten dolayı son kullanıcılar ve bağlı veri arasında bir boşluk bulunmaktadır. Bu
boşluğu kapatacak olan yaklaşım, doğal dil arayüzleridir. Araştırmacılar kullanıcıların
rahatlıkla kullanabileceği, kullanıcı dostu ve pratik arayüz gereksinimi üzerinde yoğun-
laşmışlardır. Bunlara ek olarak, bu arayüzlerin bağlı veri üzerinden soru cevaplama ya-
pan sistemler için temel bir bileşen olması gerektiğine dikkat çekmişlerdir [19].

2.4    İlgili Çalışmalar
Xu vd. [20], doğal dil sorgularını SPARQL sorgularını çeviren ve sorguları DBpedia’ya
gönderen Xser adında bir soru cevaplama sistemi geliştirmişlerdir. İki aşamalı olan bu
yöntemin ilk aşamasında cümlede bulunan varlıklar, kategoriler, ilişkiler veya
değişkenler gibi ifadeler tespit edilmiştir. İfadeler arası “predicate argument” ilişkileri
sorgu örüntü yapıları şeklinde temsil edilmesi ve tahminleme yapılması için
kullanılmıştır.
    Dima [21] tarafından sunulan çalışmada, kullanıcının bilgi ihtiyacının RDF üçlü
ifadeleri ile eşleşmesi için hem sözdizimsel, hem de anlamsal bilgiyi kullanmaktadır.
Bu sistemin temel amacı, anahtar kelime tabanlı arama için alternatif bir yaklaşım suna-
rak, bir cevap yerine bir doküman listesi döndüren bu arama mekanizmasının yarattığı
problemleri çözmektir. Intui3 olarak adlandırılan bu arama yaklaşımı, çok dilli bir soru
cevaplama platformudur. Sistemde varlıklar ve yüklemler endekslenmektedir. Yüklem
endeksinin kaynağı 49,714 yüklem ve varlıktan oluşan DBpedia’dır.
    He vd.’nin [22] CASIA@V2 şeklinde adlandırdığı soru cevaplama sistemi,
cevapların bağlı veri üzerinden üretildiği ve DBpedia’nın veri kaynağı olarak
                                                                                       7


kullanıldığı bir mimari ile tasarlanmıştır. İfadelerin ya da ifade gruplarının tespiti ve
DBpedia ile eşleştirilmesi için ortak öğrenme çerçevesi sunan Markov Mantık Ağları
[23] yöntemi kullanılmıştır. Doğal dil sorgusunu bileşenlerine ayırmak için sistemdeki
yapılan ilk işlem aday ifadelerin tespit edilmesidir. DBpedia içerisindeki kavramların
aday ifadelerle olan olası eşlemelerini bularak RDF üçlüleri yaratmak için ayrıştırılan
ifadeler ile DBpedia elemanları arasında gruplama yöntemi kullanılır.
    Park vd. [24] tarafından ISOFT isimli çalışmada, doğal dil cümlelerinin SPARQL
örüntüleri ile eşleştirilmesi için yararlanılan anlamsal benzerlik yöntemi üzerinde du-
rulmuştur. Sorguda anlam içeren kelimeler seçilmiş ve ontolojideki kavramların temsil
edildiği tanımlı URI’lar ile eşleştirilmiştir. Anlam içeren kelimeler cümle içerisinde
ipucu içeren ve cevabı üretebilmek amacıyla anlama büyük katkı sağlayan ifadeleri
temsil etmektedir.
    Usbeck ve Ngomo [25], HAWK adını verdikleri hibrit bir soru cevaplama platformu
sunmuşlardır. Kelime segmentasyonu, POS etiketlemesi ve geçiş temelli bağlılık
ayrıştırma yöntemlerini kullanarak bir yazılım zinciri geliştirilmiştir. Cümlede
ayrıştırılan her bir öğe daha sonra anlamsal açıklayıcı şeklinde kullanılması için POS
etiketlemesi işleminden geçirilmiştir. Kolektif öğrenme tabanlı bir bilgi çıkarımı
çerçevesi olan FOX [26] kullanılarak cümledeki varlıklar ve aralarındaki ilişkiler tespit
edilmiştir. Bağlılık analizi ve isim tamlaması bulunması ile anlamsal rol işaretleme
yöntemleri birleştirilerek sözdizimsel ve anlamsal ilişkilerin yakalanması sağlanmıştır.
    Ruseti vd. [27], QAnswer adında doğal dil sorgularını DBpedia üzerinden
cevaplayan bir soru cevaplama çerçevesi geliştirmişlerdir. Doğal dilden SPARQL
sorgu diline dönüştürülen sorgular açık kaynak kodlu bir platform olan Virtuoso [28]
üzerinde geliştirilmiştir. Çalışmalarında gelen sorgu iki aşamalı bir işlemden
geçirilmektedir. İlk aşamada doğal dil sorgusundaki DBpedia varlıkları tespit edilir.
İkinci aşamada ise, yönlü grafik oluşturmak için bu varlıklar birbirleriyle uygun ve
doğru sözdizimsel bağlılık tipi temsil edilecek şekilde bağlanır.
    Beaumont vd. [29] tarafından yapılan çalışmada, bilgi tabanlı bir soru cevaplama
sistemi olan SemGraphQA kolay bir erişim ile kullanıcılarının doğal dil kullanarak on-
toloji tabanlı bir platformda sorgulama yapabilmelerine olanak sağlamaktadır. Çalışma-
larındaki odak nokta, doğal dil sorgusunun grafik temsili olarak gösterilmesidir. Doğal
dil sorgusunu olası anlamların temsil edildiği varlıkların düğümler kenarların ise
ilişkileri ile gösterildiği anlamsal çizgelere çevirilir. Soruların anlamsal analizi için
kullanılan bu çizge gösterimi gözetimsiz öğrenme tekniğini kullanır. Oluşan bu çizgeler
içerisinden bir ilgililik sıralama algoritması kullanılarak doğal dil sorgusuna en yakın
olan bulunur ve anlamsal çizge üzerinden SPARQL formüle edilir.
    Baudis ve Sedivy [30], YodaQA adını verdikleri çalışmalarında modüler ve açık
kaynak kodlu bir soru cevaplama sistemi sunmuşlardır. DDİ işleme teknikleri
kullanılarak doğal dil sorgusu üzerinden üç adet soru cevaplama özelliği aranır. Bun-
lardan ilki ipuçları olarak adlandırdıkları sorgunun kapsamını belirlemede önemli bir
rol oynayan ifadelerdir. İkincisi ise, cümlenin odak noktası olan, kullanıcının bilgi ih-
tiyacını temsil eden odak olarak adlandırdıkları sorgulanan nesnedir. Odak bulunurken
bağlılık analizi yöntemine sezgisellik entegre edilmiştir. Son özellik ise, odaktan tü-
retilen cevap tipi tanımlamasını içeren sözcük cevap tipidir. Çıkarılan ipuçları olası
cevapları belirlemek için cevap üretilirken kullanılır.
8


    İlgili çalışmalar incelendiğinde, genel olarak DDİ yöntemlerinin doğal dil sorgusu
analizinde kullanıldığı ve analiz çıktılarının çeşitli yöntemler ile birleştirilerek on-
tolojide kavramlar ile eşleştirildiği görülmektedir. Önerilen diğer çalışmalarda ontoloji,
mimari bileşen anlamında bir bilgi tabanı olarak kullanılmıştır ve kullanılan ontolojiler
halihazırda geliştirilmiş ontolojilerdir. Bu çalışmada farklı bir yaklaşım üzerinde duru-
larak ilk nokta olarak doğal dil farkında ontoloji geliştirilmeye dikkat çekilmiştir. Daha
sonra ise DDİ çıktılarının ontoloji üzerindeki karşılıkları ve öğeler arası gizli kalan
ilişkiler bulunarak bir örüntü yardımıyla ontoloji sorgu dili formüle edilmiştir. DDİ
çıktıları üzerine ontolojinin çıkarsama kabiliyetinden de yararlanılmıştır.


3   Doğal Dil Farkında Ontolojilerin Geliştirilmesi

Doğal dil farkında ontolojilerin geliştirilmesi açıklanmadan önce bu konudaki en
önemli kavram olan “doğal dil farkında ontoloji” ifadesini açıklamak gerekmektedir.
Ontolojiler doğaları gereği belirli bir kapsama, alana hitap etmektedirler. Dolayısıyla
hitap edilen bu alanda hangi doğal dil cümlelerine cevap bulunabileceği ve hangi
kavramların tanımlı olduğu belirlenmektedir. Noy and McGuinness [16]’ in ontoloji
geliştirme 101’de tanımladığı ilk adım, ontoloji alanının ve kapsamının belirlenmesidir.
Ontolojinin doğal dil farkında olma özelliği için bu adım kritiktir. Noy and McGuinness
[16] bu adımı şu şekilde tanımlar: Alan ve kapsam belirleyerek ontolojinin sınırlarının
çizildiği ontoloji geliştirmedeki ilk adımdır. Bu adımı başarıyla tasarlayabilmek için
ontoloji geliştiricilerin şu soruları cevaplandırmaları gerekmektedir:
      Ontoloji hangi alanı kapsayacak?
      Ontoloji ne için kullanılacak?
      Ontoloji tarafından hangi tip sorular cevaplanacaktır?

   Geliştirilecek ontolojide cevaplanacak kapsama örnek teşkil etmesi açısından örnek
soruların tanımlanması gerekmektedir. Doğal dilde tanımlanan bu örnek sorular on-
tolojinin doğal dil farkında olmasına olanak sağlamaktadır. Bu çalışmanın temel pren-
sibi ontolojinin bu ilk adımı göz önünde bulundurularak örnek sorularda belirtilen doğal
dil ifadeleri ile ontolojideki kavram tanımlamalarının eşleştirilmesidir. Kapsamı belir-
leme ve kavramsallaştırma süreçlerinin temeli bu eşleştirme üzerine ko-
numlandırıldığında gelen doğal dil sorgularının cevaplarının geliştirilen ontolojide
aranması kolaylaşacaktır.
   Ontoloji geliştirme 101’de belirtilen halihazır ontolojilerin yeniden kullanımının
gözden geçirilmesi olan 2. adım yeni bir ontoloji yaratılacağı için atlanmıştır. 3. adım
ise, ontolojideki önemli terimlerin belirlenmesidir. Doğal dil farkında özelliğinin ka-
zandırılması adımı ile de örtüşmektedir. Bir doğal dil sorgusu içerisindeki önemli ter-
imler varlıkları, tamlamaları, çeşitli ifadeleri içerebilir ve genellikle sorgu cevabının
oluşturulmasında katkıları büyüktür. Ontoloji için tanımlanan bu önemli kelimelere
örnek soru tanımlamalarında rastlanacaktır. Analiz edilecek doğal dil sorgusunda ise,
ya bir varlık, ya da cümle içerisinde cevabın bulunmasına katkı sağlayan önemli bir öğe
(özne, yüklem ya da nesne) olarak rastlamak mümkündür. Tüm bu kavramların doğal
                                                                                           9


dil farkında olması ile eşleşmenin ve cevap üretilmesinin daha kolay yapılması sağlan-
acaktır.
    Bu önerinin daha anlaşılır olması için birkaç ontoloji örnek sorusu ve doğal dil sor-
gusu ile örneklendirmek gerekmektedir. Coğrafya alanında kapsamı mekânsal bir
sentez olarak Türkiye’yi ele alan bir coğrafi ontolojiyi ele alalım. Tanımlanan örnek
sorular:
    • Türkiye’deki şehirleri gösterir misin?
    • Konya’nın komşularını gösterir misin?
    • Bursa ili hangi coğrafi bölgededir?
    • Marmara Bölgesi’ndeki şehirlerin nüfusları kaçtır?
    • Antalya’nın en yüksek dağı hangisidir?
    • Türkiye’ de en fazla yağış alan il hangisidir?
    Bu örnek sorgulardan doğal dilde kavramlar incelenip önemli kelimeleri bir kümeye
koyduğumuzu varsayalım. Elimizdeki kümede {Türkiye, şehir, Konya, komşu, Bursa,
bölge, Marmara Bölgesi, nüfus, Antalya, yükseklik, dağ, yağış, il} elemanları bulun-
maktadır. Geliştirilen ontolojide bu elemanlar ya bir sınıf, ya bir birey ya da bir özelliği
temsil edecektir. Bu aşamada 4. adım olarak sınıfların ve sınıf hiyerarşisinin
tanımlanması ele alınmaktadır. Önemli terimlerin içerisinde genel olan ifade tanımla-
malarından ya da gruplamalarından olası sınıflar ya da alt sınıflar tespit edilir. Örneğin;
verilen örneklerde şehir, bölge, dağ genel tanımlamaları adreslemektedirler.
Dolayısıyla ontoloji içerisinde sınıf tanımlaması olarak kullanılacaklardır. Sınıf
tanımlamaları ve hiyerarşi belirlendikten sonra 5. adım olan sınıfların özelliklerinin
tanımlanması uygulanır. Bulunan terimler içerisinde ontolojideki varlıkların nitelikle-
rini belirtebilecek ve aralarında ilişki kurmamıza yarayacak olan kavramlar özellikler
olarak tanımlanır. 6. adım, 5. adımın ön koşuludur ve listelenen özelliklerinin nitelik ve
kısıtlarının belirlenmesidir. Örneğin; komşuluk ilişkisine simetrik olması şeklinde bir
nitelik tanımlanabilir. 7. Ve son adım olan sınıf örneklerinin oluşturulması için on-
tolojide tanımlı olacak bireyler belirlenir. Örneğin; “şehir” ontoloji içerisinde bir sınıf
olarak ve “Bursa, Konya, Antalya” bu sınıfın bireyleri olarak tanımlanır. Verilen sınıf
örneklerini kapsam genişletmek adına arttırmak ontoloji içerisinde mümkündür. Bu
örnek için diğer şehirler eklenerek olası özellikler kontrol edilerek yeni örnekler tü-
retilebilir.
    Ontoloji Geliştirme 101’de de belirtildiği üzere sınıflar, alt sınıflar ve özellikler ta-
nımlandığı zaman artık bu kavramların özellikleri kullanarak birbirine bağlanması yani
anlamlandırılması gerekmektedir. Örneğin; “komşu” şeklinde tanımlanan bir ilişki “şe-
hir” sınıfının bir örneği olan “Konya” için tanımlanır. Bu ilişkide Konya ile komşu olan
diğer şehirler eklenir. Bu kavramları içeren soruların cevapları artık ontolojide bulun-
maktadır. Ontolojiden bu cevapları döndürebilmek için verilen sorguyu bir SPARQL
sorgusuna dönüştüren bir doğal dil arayüzü gerekmektedir. 4. Bölümde bu dönüştürme
işleminin detayları aktarılmıştır. Bunlara ek olarak, bu önemli elemanlar cümle doğal
dil işleme teknikleri kullanılarak analiz edildiğinde anlama katkı sağlayan öğeler olarak
karşımıza çıkmaktadır. Morfolojik analiz ve belirsizlik giderme, varlık ismi tanıma,
bağlılık analizi gibi doğal dil işleme yöntemleri ile cümlede varlıklar ve kelimeler arası
ilişkiler elde edilip ontolojide bu öğelerin tanımları ve tipleri bulunarak SPARQL sor-
gusunun oluşturulması için gerekli altyapı bu çalışmada önerilmiştir.
10


   Doğal dili tanıyan, formüle edebilecek yetenekte bir ontoloji doğal dilde gelen sor-
guların bir arayüz yardımıyla ontoloji sorgu diline çevrilmesi ile cevap üretebilen bir
çerçeve oluşumunu sağlamaktadır. Gelen doğal dil sorgusunun otomatik olarak
SPARQL diline çevrilmesi için önerilen yöntem ve mimari 4. Bölüm’de açıklanmıştır.


4    Önerilen Yöntem ve Mimari: Doğal Dil Sorgularının Otomatik
     Olarak Anlamsal Web Sorgularına Dönüştürülmesi

Önerilen anlamsal web uygulaması doğal dilde sorguları kabul eden ve bilgi kaynağı
olarak ontolojiyi kullanan bir platformdur. Ontolojilerin bilgi kaynağı olarak kullanıl-
masından dolayı doğal dil sorgusunun bir doğal dil arayüzü yardımıyla SPARQL sor-
gusu ile temsil edilmesi sağlanacaktır. Bu bölümde önerilen yöntem ve mimarinin ta-
sarlanması birbirini besleyen süreçlerdir. Bu bölümün daha anlaşılır olması adına öne-
rilen yöntem, önerilen mimari bileşenleri üzerinden açıklanmaktadır.
    Doğal dil sorgusunun ilk olarak “Doğal Dil İşleme” katmanı ile bir ön işlemeden
geçirilip daha sonra ise “Sorgu Anlamsallaştırma” katmanında sorguya cevap üretil-
mesi şeklinde önerilen sistem mimarisi Şekil 2’de gösterilmiştir.


                            Şekil 2. Önerilen sistem mimarisi.
                                                                                         11


     Doğal dil arayüzüne gelen doğal dil girdisi ilk olarak doğal dil işleme teknikleri
kullanılarak işlenir. Morfolojik analiz ve belirsizlik giderme, varlık ismi tanıma ve bağ-
lılık analizi yöntemlerine sırasıyla başvurulur. Morfolojik analiz ve belirsizlik giderme
cümledeki her kelimenin ayrıştırılıp, kelimelerin morfolojik yapılarının POS etiketleri
ile çıktı olarak temsil edildiği bir DDİ tekniğidir. Kelime kökleri, sözcük türleri (isim,
fiil, sıfat, vb.) ve varsa ekleri detaylı olarak incelenir. Cümlenin bir üst seviye analizi
için çok kritiktir. Diğer DDİ süreçlerinin sonuçlarını etkiler. POS etiketleri dilbilgisi
tanımlayıcıları olarak adlandırılabilirler. Ayrıştırılan her kelimenin POS etiketlerinin
belirlenmesi için çeşitli farklı algoritmalardan yararlanılmaktadır. Cümlenin doğru yo-
rumlanması ve anlama ulaşılan yolda bir adım öteye taşınması için cümlenin altında
yatan sözdizimsel yapısının çözümlenmesi gerekir [31].
     Varlık ismi tanıma yönteminde ayrıştırılan cümle içerisindeki kelimeler kişi, yer,
tarih, organizasyon gibi tanımlayıcılar ya da kategoriler ile etiketlenir. Anlamsal sevi-
yede analizin ilk aşamaları olduğu düşünülebilir. Cümle içerisinde geçen söylem-
ler/varlıklar önceden tanımlanmış kategorilere çözümlenir. Bu kategoriler alan ihtiya-
cına göre özelleştirilebilir. Uygulamalar tarafından kullanılan çeşitli varlık ismi tanıma
algoritmaları mevcuttur. Bu algoritmalar arasında en popüler yaklaşım öğrenme algo-
ritmalarından etkin olarak yararlanılmasıdır [32].
     Bağlılık analizi, doğal dil cümlelerini belirli yapı tiplerine yani cümleyi öğelerine
ayrıştıran DDİ alanındaki başlıca araştırma alanlarından biridir. Kelimeler arasındaki
çeşitli ilişkileri (özne, yüklem, nesne vb.) bağlılık analizi ile tanımlanır. Kelimeler ara-
sındaki ilişkiler bağlılık yapıları ile temsil edilir. Bağlılık analizi algoritmaları düğüm
ve ilişkilerden oluşan bağlılık temsili yöntemlerinden faydalanır. Başlangıç düğümü
dışında diğer bütün düğümlerin birbirine bağlı olduğu bir bağlılık yapısında temsil edi-
lir [33]. Bir cümlede fiil tipinde sözcükleri bulmak, diğer kelimeler ile aralarındaki iliş-
kileri çözümlemek ve diğer terimlerinin sözcük tiplerini, görevlerini çıkarmak kritiktir.
Kelimeler arasındaki ilişkiler anlama giden yolda en doğru yol göstericilerdir. Cümle
içerisinde kimin kime ne yaptığı bilgisi genel anlama ulaşılırken her bir terimin kısmi
olarak rolünü açıklar [34].
     Şekil 2’den de anlaşıldığı üzere doğal dil sorgusu sisteme girdi olarak verilir. Veri-
len bu sorgu ilk olarak DDİ teknikleri kullanılarak analiz sürecinden geçirilir. Analiz
sonrasında cümlede anlam içerisinde katkı sağlayan terimler belirlenir ve ontoloji tara-
fıyla bulunan terimlerin tanımlamaları tekrar kontrol edilir. Bölüm 3’de belirtildiği
üzere doğal dil farkında bir ontoloji yardımıyla anlamsal web uygulaması oluşturmak
mümkündür. Örnek bir cümle analizi konunun daha anlaşılır olmasına katkı sağlaya-
caktır. Örneğin; “Marmara Bölgesi’ndeki şehirlerin nüfuslarını göster” cümlesinin ilk
olarak DDİ teknikleriyle işlenmiş çıktıları Tablo 1’ de gösterilmiştir. DDİ analiz ve
çıktılarını göstermek için ITU Türkçe Doğal Dil İşleme Web Servisi’nden [35] fayda-
lanılmıştır.
     DDİ çıktılarına baktığımızda bağlılık analizinin cümledeki kelimelerin ve ilişkilerin
çıkarılması için kritik olduğu görülmektedir. Doğal dil sorgusunda kullanıcının bilgi
ihtiyacını temsil eden öğenin, hedefin çoğunlukla ya nesne ya özne ya da yüklemde
görüldüğü gözlenmektedir. Önerilen yöntemde bu öğeler bulunduktan sonra doğal dil
farkında ontoloji ile karşılaştırmasının yapılmasının anlamlı olacağı düşünülecektir.
 12


 Örneğin bu cümlede nesne (OBJECT) olarak işaretlenen kök kelime “nüfus” iken
 yüklem (PREDICATE) olarak işaretlenen kelime kökü “göster” olarak görülmektedir.

                                   Tablo 1. DDİ çıktıları

Örnek Sorgu                 “Marmara Bölgesi’ndeki şehirlerin nüfuslarını göster”
                            Marmara+Noun+Prop+A3sg+Pnon+Nom
                            bölge+Noun+A3sg+P3sg+Loc^DB+Adj+Rel
                            bölge+Noun+A3sg+P3sg+Loc^DB+Pron+Rel+A3sg+Pnon+Nom
                            şehir+Noun+A3pl+Pnon+Gen
                            şehir+Noun+A3pl+P2sg+Nom
Morfolojik Analiz           nüfus+Noun+A3pl+P3pl+Acc
                            nüfus+Noun+A3pl+P2sg+Acc
                            nüfus+Noun+A3pl+P3sg+Acc
                            nüfus+Noun+A3sg+P3pl+Acc
                            göster+Verb+Pos+Imp+A2sg
                            ?+Punc
                            Marmara Marmara+Noun+Prop+A3sg+Pnon+Nom
                            Bölgesi'ndeki bölge+Noun+A3sg+P3sg+Loc^DB+Adj+Rel
Morfolojik Belirsizlik      şehirlerin şehir+Noun+A3pl+Pnon+Gen
      Giderme               nüfuslarını nüfus+Noun+A3pl+P3pl+Acc
                            göster göster+Verb+Pos+Imp+A2sg
                            ? ?+Punc
                            Marmara Marmara+Noun+Prop+A3sg+Pnon+Nom               B-
                          LOCATION
                            Bölgesi'ndeki bölge+Noun+A3sg+P3sg+Loc^DB+Adj+Rel I-
                          LOCATION
Varlık İsmi Tanıma
                            şehirlerin şehir+Noun+A3pl+Pnon+Gen        O
                            nüfuslarını nüfus+Noun+A3pl+P3pl+Acc          O
                            göster göster+Verb+Pos+Imp+A2sg        O
                            ? ?+Punc
                            1 Marmara Marmara Noun Noun Prop|A3sg|Pnon|Nom _ 2
                            POSSESSOR
                            2 Bölgesi'ndeki bölge Noun Noun A3sg|P3sg|Loc^DB|Adj|Rel _
                            5 MODIFIER
Bağlılık Analizi
                            3 şehirlerinşehir Noun Noun A3pl|Pnon|Gen _ 4 POSSESSOR
                            4 nüfuslarını nüfus Noun Noun A3pl|P3pl|Acc _ 5 OBJECT
                            5 göster göster Verb Verb Pos|Imp|A2sg _ 0 PREDICATE
                            6 ? ? Punc Punc _ _ 5 PUNCTUATION


     Cümlede herhangi bir öğe özne (SUBJECT) olarak işaretlenmemiştir. Her iki öğe
 için doğal dil farkında ontoloji üzerinde tanımlamaları kontrol edilir ve “nüfus” için
 şehirler ve bölgelerde tanımlı bir özellik tanımı döndürülür. Bunlara ek olarak, varlık
 ismi tanıma yöntemi “Marmara Bölgesi” ifadesini lokasyon (LOCATION) olarak
                                                                                      13


işaretlemiştir. Ontoloji üzerinden bu birey bulunur ve bu bireyin ait olduğu sınıf dö-
ndürülür. SPARQL formulasyonunda bu elemanların hepsi bir örüntü üzerine oturtulup
SPARQL sorgusunun son haline ulaşılacaktır. Eğer sadece ontoloji tabanlı bir yaklaşım
ile bakılırsa sorgu Marmara Bölgesi’nin nüfusunu hedeflemiştir olarak algılanabilirdi.
Bu noktada DDİ teknikleri yardıma koşmaktadır. Cümlenin nesnesi ile bağlı olan her-
hangi bir öğenin var olup olmadığının kontrol edilmesi gerekir. 3 numaralı “şehir” öğesi
cümlenin nesnesine aitlik (POSSESSOR) ilişkisi ile bağlıdır. Bu ilişki yardımıyla
kullanıcının bilgi ihtiyacının şehir-nüfus ilişkisi şeklinde temsil edildiği elde edile-
bilmektedir.
    Bir sonraki adımda mimaride sorgu örüntüsü doğrulama olarak gösterilen adım için,
cümlenin öğeleri ile ontolojide tanımlı kavramlar arasında ek bir eşleme kontrolü
olacaktır. Cümlede ve ontolojide tanımlı ortak kavramlar arasında olası başka ilişkilerin
temsil edilip edilmediğine bakılacaktır. Bu kontrol sonrası verilen örnek için her şehrin
bir bölgede konumlanmış olduğu ilişkisi ontolojide tanımlı “konumVar” ilişkisi ile
temsil edilmektedir. Bölge ile şehir sınıfları arasında temsil edilen bu özellik o sadece
o bölgede bulunan şehirlerin elde edilmesini sağlayacaktır. Dolayısıyla bu ilişkinin
şehir ve bölge sınıfları arasında SPARQL sorgusuna eklenmesi gerekmektedir. Aşağıda
gösterilen örnek bir SPARQL örüntüsünde SPARQL üretmek için ihtiyacımız olan
öğeler gösterilmektedir. Sorgu örüntüsü örneklendirme işlemi sayesinde sorgu eleman-
ları örüntüdeki doğrulanmış eşleme doğrultusunda konumlandırılır.
                                        SELECT ?y
                WHERE { ?x rdf:type ontoloji_ismi: varlık-ismi-sınıfı.
                         ?y rdf:type ontoloji_ismi: hedef-sınıfı.
                                ?y özellik: özellik-adı ?x
                       FILTER(regex(str(?x),"varlık ismi","i")) }
  Örnek cümlemizden elde ettiğimiz SPARQL sorgusu aşağıdaki şekilde olacaktır:
                            SELECT ?x ? nufus-miktari
                   WHERE { ?x rdf:type geo_turkce:Bolge .
                          ?y rdf:type geo_turkce:Sehir .
                               ?x ins:konumVar ?y .
                           ?y ins:nufus ?nufus-miktari .
                FILTER(regex(str(?x),"Marmara Bolgesi","i")) }

    Uygulama içerisinde 2 temel katman bulunmaktadır. Bunlardan ilk olanı DDİ yönt-
emlerini sırasıyla uygulayan “Doğal Dil İşleme” katmanıdır. DDİ çoğu soru cevaplama
sisteminde de bulunur. Bu çalışmanın temel katkısı “Sorgu Anlamsallaştırma” katmanı
olarak temsil edilmiştir. Bir üst katmandan DDİ çıktıları mimarideki sorgu örüntüsü
eşleme adımı için kullanılır. Örüntü için gereken sorgu elemanları DDİ çıktıları
yorumlanarak elde edilir. Daha sonra, mimaride gösterilen sorgu örüntüsü doğrulama
adımı için bulunan varlık isimleri, varlık ismi ve hedef sınıfları ve ilişkiler ontoloji
üzerinden tekrar kontrol edilir. Çıkarsama mekanizması sayesinde varlıklar arası olası
diğer ilişkiler de tespit edilir. Mimarideki bir sonraki adım olan sorgu örüntüsü
örneklendirme sürecinde elde edilen sorgu elemanları ile sorgu formüle edilir. Sorgu
14


cevabı oluşturulması adımı için sorgu motoru kullanılarak ontoloji üzerinde sorgu
koşturularak cevap üretilir.


5    Değerlendirme ve Gelecek Çalışmalar

Çalışma kapsamında doğal dil sorgularının, kullanıcının bilgi ihtiyacını karşılamak için
makine anlaşılır bir şekle dönüştürülmesi problemine çözüm aranmıştır. Dilbilimsel an-
alize yardımcı anlamsal teknolojilerin kullanımı için hibrit bir yaklaşım tanıtılmıştır.
Yapısal olmayan doğal dil formundaki sorgulara otomatik olarak yapısal bir form ka-
zandırılarak ontoloji sorgu diline dönüştürüldüğü bir anlamsal web mimarisi
önerilmiştir. Ontoloji geliştirme sürecinde üretilen örnek sorulardan ile deneysel bir test
çalışması yapılmıştır. Sisteme gönderilen 100 adet örnek doğal dil sorgusundan 78
adedine cevap dönülmüş ve bu cevaplar içerisinden 60 adedi doğru cevap olarak
işaretlenmiştir. Deneysel sonuçlar kesinlik değeri (precision), hassasiyet değeri (recall)
ve F- ölçüsü değerleri cinsinden %76.92, %60 ve %67.41 olarak hesaplanmıştır.
    İlgili çalışmalardan farklı olarak tasarlanan ve katkı sağlanan noktalar ise, mimaride
“Sorgu Anlamsallaştırma” katmanında tanıtılan işlemler ve doğal dil farkında bir on-
toloji geliştirilerek tasarlanılan yöntem ve mimarideki bileşen kullanımından doğan
farklılıklardır. İlgili çalışmalarda bilgi kaynağı olarak ontoloji, mimari bileşeni olarak
tanıtılmıştır. Bilgi kaynağı olarak kullanılan ontolojiler Freebase, DBpedia gibi hali-
hazırda geliştirilmiş ontolojilerdir. Bu çalışmada, doğal dil farkında bir ontoloji
geliştirilerek, geliştirilen ontolojinin DDİ yöntemleri ve anlamsal analiz yöntemleriyle
uyumlu çalışması tasarlanan algoritmalar sayesinde mümkün kılınmıştır. İlgili çalışma-
lardan farklı olarak geliştirilen doğal dil farkında ontoloji sayesinde, DDİ çıktılarının
yorumlanması ve sorgu öğeleri arasındaki gizli kalmış ilişkilerin çıkarılarak sorgu
örüntüsüyle eşleştirilip ontoloji sorgu dilinin formüle edilmesi sağlanmıştır. Bunlara ek
olarak, ontolojinin doğal dil farkında olması bu algoritmaların kapsam alanlarının
genişletilebilmesi ve sonuçlarının iyileştirilmesine olanak sağlamıştır. Gelecek
çalışmalar için aynı mimari kullanılarak tasarlanacak sistemde doğal dil farkında yeni
ontolojiler geliştirilerek doğal dil tabanlı sorgulamanın dilden bağımsız hale dö-
nüştürülmesi fikri önerilmektedir. Bu yaklaşım, birden fazla ontolojinin kullanıldığı bir
platformda aynı mimarinin geçerli olması imkanını da sağlayacaktır. Farklı alanlarda
doğal dil farkında geliştirilmiş ontolojiler ile doğal dil sorgularına cevap üreten sistem-
lerin tasarlanması fikri, gelecek çalışmalara yön verebilir.
    Önerilen mimaride doğal dil işleme süreçleri için ITU Türkçe Doğal Dil İşleme
Web Servisi’nden [35] faydalanılmıştır. Araştırma çalışmaları için ücretsiz kullanılan
bu servis, ticari kullanım için lisans gereksinimini beraberinde getirecektir.
    Halihazır yöntemin içerisinde tek tip olarak kullanılan sorgu örüntüsünün daha
karmaşık doğal dil sorgularını cevaplayabilmesi için yeni örüntüler eklenerek
geliştirilmesi ihtiyacı doğacaktır. İçeriğinde birden fazla varlık, karşılaştırmalı ifade ya
da uzun tamlamalar bulunduran sorgular için yöntemin makina öğrenmesi yaklaşımı ile
iyileştirilmesi ve örüntü tiplerinin genişletilmesine başvurmak gerekecektir. Gelecek
çalışmaların hedefine, bu ihtiyaç da dahil edilebilir. Bu çalışmanın bir diğer önemli
                                                                                               15


katkısı ise, doğal dil farkında ontolojiler geliştirilerek çok dilli soru cevaplama plat-
formu oluşturma imkanı tanımasıdır. Birden fazla dilde geliştirilmiş olan her bir on-
tolojinin doğal dil farkında olması çok dilli soru cevaplama imkanının sağlanması için
kritiktir.


Kaynaklar
 1. Berners-Lee, T., Hendler, J., Lassila, O.: The semantic web. Scientific American 284(5),
    34–43 (2001).
 2. Guo, R., Ren, F.: Towards the relationship between Semantic Web and NLP. In: 2009 IEEE
    International Conference on Natural Language Processing and Knowledge Engineering. pp.
    1-8. IEEE, China (2009).
 3. Guo, Y., Li, Y., Shao, Z.: A semantic processing model for sentence understanding based
    on cognitive learning. In: 2011 IEEE 3rd International Conference on Communication Soft-
    ware and Networks. pp. 106-110, IEEE, China (2011).
 4. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., Kuksa, P.: Natural lan-
    guage processing (almost) from scratch. Journal of Machine Learning Research, 12, 2493-
    2537 (2011). https://doi.org/10.1.1.231.4614
 5. Bernstein, A., Kaufmann, E., Göhring, A., Kiefer, C.: Querying ontologies: A controlled
    English interface for end-users. In: International Semantic Web Conference. pp. 112-126.
    Springer, Berlin, Heidelberg. (2005).
 6. Hoque, M. M., Rahman, M. J., KumarDhar, P.: Lexical semantics: A new approach to ana-
    lyze the Bangla sentence with semantic features. In: 2007 International Conference on In-
    formation and Communication Technology. pp. 87-91, IEEE, US (2007).
 7. Kumar, E.: Natural language processing. IK International Publishing House. India (2011).
 8. Hayes, P. J., Carbonell, J. G.: A tutorial on techniques and applications for natural language
    processing. Carnegie- Mellon University, (1983).
 9. Liddy, E. D.: Natural language processing. Encyclopedia of Library and Information Sci-
    ence. 2nd edn. Marcel Dekker, NY (2001).
10. Gaševic, D., Djuric, D., Devedžic, V.: Model driven architecture and ontology development.
    1st edn. Springer, Berlin, Heidelberg (2006). https://doi.org/10.1007/3-540-32182-9
11. Sowa, J. F.: Ontology, metadata, and semiotics. In: International Conference on Conceptual
    Structures. pp. 55-81, Springer, Berlin, Heidelberg, Germany (2000).
12. Gruber, T. R.: A translation approach to portable ontology specifications. Knowledge Ac-
    quisition, 5(2), 199-220 (1993). https://doi.org/10.1006/knac.1993.1008
13. Gruber, T. R.: Toward principles for the design of ontologies used for knowledge sharing.
    International Journal of Human-Computer Studies, 43(5-6), 907-928 (1995).
    https://doi.org/10.1006/ijhc.1995.1081
14. Hendler, J.: Agents and the semantic web. IEEE Intelligent Systems, 16(2), 30-37 (2001).
    https://doi.org/10.1109/5254.920597
15. Kalfoglou, Y.: Exploring ontologies. In Handbook of Software Engineering and Knowledge
    Engineering, Volume I: Fundamentals, 863-887 (2001).
16. Noy, N. F., McGuinness, D. L.: Ontology development 101: A guide to creating your first
    ontology. Stanford Knowledge Systems Laboratory. (2001). https://doi.org/10.1016/j.art-
    med.2004.01.014
17. Jurafsky, D., Martin, J. H.: Speech and language processing. 2nd edn. Pearson, New Jersey
    (2014).
16


18. Unger, C., Freitas, A., Cimiano, P.: An introduction to question answering over linked data.
    In: Reasoning Web International Summer School. pp. 100-140, Springer, Cham (2014).
19. Lopez, V., Uren, V., Sabou, M., Motta, E.: Is question answering fit for the semantic web?:
    a survey. Semantic Web, 2(2), 125-155 (2011). https://doi.org/10.3233/SW-2011-0041
20. Xu, K., Feng, Y., Zhao, D.: Xser@ qald-4: Answering natural language questions via phrasal
    semantic parsing. In: Working Notes for CLEF 2014 Conference. pp. 15-18, (2014).
21. Dima, C.: Answering natural language questions with Intui3. In: Working Notes for CLEF
    2014 Conference. pp. 1201-1211, (2014).
22. He, S., Zhang, Y., Liu, K., Zhao, J.: CASIA@ V2: A MLN-based question answering system
    over linked data. In: Working Notes for CLEF 2014 Conference. pp. 1249-1259, (2014).
23. Richardson, M., Domingos, P.: Markov logic networks. Machine Learning, 62(1-2), 107-
    136 (2006). https://doi.org/10.1007/s10994-006-5833-1
24. Park, S., Kwon, S., Kim, B., Lee, G. G.: ISOFT at QALD-5: Hybrid question answering
    system over linked data and text data. In: Working Notes for CLEF 2015 Conference.
    (2015).
25. Usbeck, R., Ngomo, A. C. N.: HAWK@ QALD5-Trying to answer hybrid questions with
    various simple ranking techniques. In: Working Notes for CLEF 2015 Conference. (2015).
26. Speck, R., Ngomo, A. C. N.: Ensemble learning for named entity recognition. In: Interna-
    tional Semantic Web Conference. pp. 519-534, Springer, Cham (2014).
27. Ruseti, S., Mirea, A., Rebedea, T., Trausan-Matu, S.: QAnswer-Enhanced entity matching
    for question answering over linked data. In: Working Notes for CLEF 2015 Conference.
    (2015).
28. Dolan-Gavitt, B., Leek, T., Zhivich, M., Giffin, J., Lee, W.: Virtuoso: Narrowing the seman-
    tic gap in virtual machine introspection. In: IEEE Symposium on Security & Privacy 2011.
    pp. 297-312, IEEE, U.S. (2011).
29. Beaumont, R., Grau, B., Ligozat, A. L.: SemGraphQA@ QALD5: LIMSI participation at
    QALD5@ CLEF. In: Working Notes for CLEF 2015 Conference. (2015).
30. Baudiš, P., Šedivý, J.: Biomedical question answering using the YodaQA system: Prototype
    notes. In: Working Notes for CLEF 2015 Conference. (2015).
31. Indurkhya, N., Damerau, F. J.: Handbook of natural language processing. 2nd edn CRC
    Press, U.S. (2010).
32. Celikkaya, G., Torunoglu, D., Eryigit, G.: Named entity recognition on real data: a prelimi-
    nary investigation for Turkish. In: The 7th International Conference on Application of In-
    formation and Communication Technologies. pp. 1-5, IEEE. Azerbaijan (2013).
33. Nivre, J. Dependency parsing. Language and Linguistics Compass, 4(3), 138–152 (2010).
    https://doi.org/10.1111/j.1749-818X.2010.00187.x
34. Shehata, S., Karray, F., Kamel, M.: Enhancing search engine quality using concept-based
    text retrieval. In: International Conference on Web Intelligence. pp. 26-32, IEEE Computer
    Society. (2007).
35. Eryiğit, G.: ITU Turkish NLP web service. In: Proceedings of the Demonstrations at the
    14th Conference of the European Chapter of the Association for Computational Linguistics.
    pp. 1-4, Sweden (2014).