=Paper=
{{Paper
|id=Vol-1483/72_Bildiri
|storemode=property
|title=İlişkisel Veri Tabanı Sistemlerinde İşlem Yönetimi ve Büyük Verinin Saklanması
|pdfUrl=https://ceur-ws.org/Vol-1483/72_Bildiri.pdf
|volume=Vol-1483
|dblpUrl=https://dblp.org/rec/conf/uyms/AydoganDKAHK15
}}
==İlişkisel Veri Tabanı Sistemlerinde İşlem Yönetimi ve Büyük Verinin Saklanması==
<pdf width="1500px">https://ceur-ws.org/Vol-1483/72_Bildiri.pdf</pdf>
<pre>
li³kisel Veri Taban Sistemlerinde Çoklu Oturum

                                 ve ³lem Yönetimi

NoSQL Veri Taban Sistemlerinde Büyük Verinin

                                    Saklanmas


                            12                12               2
          S. Said Aydo§an   , Esat E. Demirel , Utku Ketenci , Mehmet S.
                            1                   2             1
                       Aktas ,Ihsan Helvacioglu , Oya Kalipsiz

     1
         Bilgisayar Mühendisli§i Bölümü, Elektrik-Elektronik Fakültesi Yldz Teknik
                                   Üniversitesi, stanbul
                         2
                           Ar-Ge Merkezi, Cybersoft, stanbul ?
                                 utku.ketenci@cs.com.tr


     Kurumlar tarafndan barndrlan veri ve bu verilere eri³im skl§ gittikçe art-
maktadr. Artan veri boyutuyla analiz i³lemleri de karma³k hale gelmektedir.
Günümüzde birden çok veri taban ayn amaca yönelik i³lemlerde beraber kul-
lanlabilmektedir. Veri tabanlarnn ortak kullanmlarnda ba§lant problemleri,
hangi tablonun hangi veri tabanndan geldi§inin bilinememesi, i³leme (commit)
ve geri alma (rollback) mekanizmalarnn yeterli düzeyde sa§lanamamas gibi
sorunlar meydana çkabilmektedir. Bu çal³ma, birden çok veri tabannn bulun-
du§u sistemlerde bahsedilen problemlere bir çözüm sunmaktadr. Bu çözümle
birlikte geni³ ölçekte kullanlan Oracle, MySQL, MSSQL, DB2 ve Sybase gibi
veri tabanlar için ortak bir eri³im katman olu³turulmaktadr. Bununla birlikte,
birden çok veri tabanndan elde edilen büyük hacimli verinin muhafaza edil-
mesi ve analiz i³lemlerinde kullanlabilmesi için kolon tabanl büyük veri i³leme
platformlar da kullanlmaktadr. Bu platformlardan yaygn olarak kullanlan,
açk-kaynakl, HBase ve Hadoop mimarileri, büyük verinin muhafazas ve is-
tenildi§inde eri³ilmesi amaçlaryla kullanlm³tr. Gerçekle³tirilen araçla farkl
ili³kisel veri taban sistemleri ile i³lemlerin (transaction) sorunsuz bir ³ekilde
yönetilebilmesi ve bu veri tabanlarndan alnan verinin büyük veri i³leme plat-
formuna ta³nmas sa§lanabilmi³tir. Geli³tirilen çözümün kullanlabilirli§ini ve
performansn ortaya koymak adna, i³levsel ve ba³arm testleri gerçekle³tirilmi³
ve olumlu sonuçlar elde edilmi³tir.


Anahtar Kelimeler: Veri Taban Sistemleri, ³lem Yönetimi, Büyük Veri Plat-
formlar, Da§tk Sistemler


?
    Bu çal³ma Yldz Teknik Üniversitesi Yazlm Kalite Ara³trma Grubu ve Cybersoft
    rmas Ar-Ge birimlerinin i³birli§i çerçevesinde gerçekle³tirilmi³tir. Yazarlar, Cyber-
    soft rmasna sa§lanan çal³ma ortam için; Cybersoft Ar-Ge Müdürü Umut Orçun
    Turgut'a ve Cybersoft çal³anlarndan ek Temel'e de katklar için te³ekkür etmek-
    tedir. Bu çal³ma ayn zamanda, Yldz Teknik Üniversitesi BAP Projesi (Proje No:
    2013-04-01-KAP03) kapsamnda gerçekle³tirilmi³tir.


                                            691
1    Giri³


Gün içinde insanlar tarafndan gerçekle³tirilen pek çok i³lem, çe³itli veri taban
sistemleri aracl§yla, farkl tipteki veri kaynaklarna kaydedilmektedir. Bu du-
rum, sürekli artan ve farkl tipteki veri taban sistemlerinde bulunan verinin
yönetimi ve birle³tirilmesi için, bir ihtiyaç olarak ortaya çkmaktadr. Kayde-
dilen bu veriler ile yaplacak raporlama ve analiz çal³malarnda kullanlmak
üzere, bütün bu veritaban sistemleri ile tek bir noktadan ileti³ime geçebilecek
bir altyap kurulabilmektedir. Bu noktadaki zorluklar her sistemin kendine has
bir altyapya sahip olmas ve bu sistemler ile ileti³im kurma metotlarnn farkl
olmasdr. Veri tabanlarnn ortak kullanmlarnda ba§lant problemleri, hangi
tablonun hangi veri tabanndan geldi§inin bilinememesi, i³leme (commit) ve geri
alma (rollback) mekanizmalarnn yeterli düzeyde sa§lanamamas gibi sorunlar
meydana çkabilmektedir. Bu çal³mann amaçlarndan biri, birden çok veri ta-
bannn bulundu§u sistemlerde bahsedilen problemlere bir çözüm sunmaktadr.
Bu çözümle birlikte geni³ ölçekte kullanlan Oracle, MySQL, MSSQL, DB2 ve
Sybase gibi veri tabanlar için ortak bir eri³im katman olu³turulmaktadr.
    Birden çok veri kayna§na sahip bu sistemlerde, veri kayna§ndan gelen ve-
rilerin i³lenerek kullan³l bilgiye çevrilmesi gerekmektedir. Yüksek hacimli bu
veriler i³lenmek istendi§inde da§tk çal³abilen NoSQL veri tabanlarnda mu-
hafaza edilebilirler. Google, ili³kisel veri taban yönetim sistemlerinin büyük
verileri mevcut dosya sisteminde kontrol etme ve verileri efektif kullanma ko-
nusundaki sorunuyla yüzle³mi³tir. Bunun neticesinde geli³tirdikleri Google File
System (GFS) [6], BigTable, Map/Reduce paralel i³leme platformu ile sorunlara
en efektif çözümleri bulurken Apache Hadoop ve Apache HBase projelerine ilham
kayna§ olmu³lardr. Hadoop, Map/Reduce i³lem özelli§i olan Hadoop Distribu-
ted File System (HDFS) üzerine kurulmu³ paralel programlama platformudur
[9]. HBase ise HDFS üzerinde çal³an bir veri yönetim sistemidir [5]. Çal³mann
bir di§er amac da, HBase NoSQL veri taban kullanlarak, farkl ili³kisel veri
tabanlarnda bulunan bilgilerin tek bir kaynakta depolanmasn sa§lamaktr.
    Bu bildiride; birden çok veri taban i³letim sistemi aracl§ ile kayt edilmi³
verilerin okunarak i³lenmeye hazr hale getirilmesi, farkl veri taban sistemlerin-
den gelebilecek i³lemsel istisnalarn (transactional exception) Spring Framework
kullanlarak gerçekle³tirilen i³lem yöneticisi (transaction manager) aracl§ ile
yönetiminin yaplmas ve analizi yaplan verinin da§tk olarak çal³an sunucu-
larda bulunan Hadoop da§tk dosyalama sistemine ve HBase veri taban siste-
mine ta³nmasnn deneyimlerinin sonuçlar payla³lmaktadr. Bu bildirinin geri
kalannda srasyla; testlerde kullanlan ili³kisel ve ili³kisel olmayan veri tabanlar
ve NoSQL hakknda genel bilgiler verilecektir; bir sonraki a³amada, genel sistem
mimarisi anlatlacaktr; en son bölümde de testler ve sonuçlar payla³lacaktr.


2    li³kisel ve NoSQL Veri Tabanlar


li³kisel veri taban sistemleri 1960'l yllarda General Electric laboratuvarlarnda
ortaya çkm³tr [1]. Bu tarihten önce veriler dosya yaps içerisinde saklanrken,


                                         692
ortaya çkan bu yeni yap ile dosyalar yerlerini ili³kisel veri taban tablolarna
brakm³lardr. Artan veri büyüklü§ü ile ili³kisel veri tabanlar ile çal³mann zor-
luklarnn belirgin bir ³ekilde ortaya çkmaya ba³lad§ 2010 ba³larnda NoSQL
veri tabanlar popülerlik kazanmaya ba³lam³tr. li³kisel veri taban sistemlerine
göre yüksek ölçeklenebilirlik, kümeleme, veri e³leyebilme, veri modelinin sabit ol-
mamas ve karma³k sorgulara kar³t olma gibi özellikleri ile [7][8] NoSQL veri
taban sistemleri farkllk yaratmaktadr.
    li³kisel veri tabanlar ACID (Atomik  Atomicity, Tutarllk  Consistency,
Yaltm  Isolation, Süreklilik - Durability) ³artlarnn hepsini sa§larken, No-
SQL veri tabanlar bu ³artlar tamamen sa§lamamaktadr. Bunun yerine da§tk
sistemdeki herhangi bir küme elemannda sorun oldu§unda çal³maya devam
edebilmesi ve verinin bütünlü§ünü koruyabilmesi ³artlarn en ön srada tutmak-
tadrlar. li³kisel veri tabanlarnn aksine NoSQL veri tabanlarnda, verilere tekil
anahtar üzerinden eri³ilmekte, fakat verilere eri³im SQL yapsndaki kadar ko-
lay olmamaktadr. Bu bildiri hazrlanrken popüler olarak kullanlan ili³kisel veri
taban sistemleri ve HBase NoSQL veri taban sistemi incelenmi³tir.
    li³kisel veritabanlar arasnda, Oracle, yaygn kullanlan, popüler bir veri ta-
ban yönetim sistemidir [2][4]. Birden çok programlama dili deste§i mevcuttur
[3]. MySQL ise dünya çapnda en çok kullanlan açk kaynak kodlu veri taban yö-
netim sistemidir. MySQL ile kurumsal ve kurumsal olmayan binlerce uygulama
geli³tirilmi³tir. Ayrca Windows ve Unix/Linux i³letim sistemlerini desteklemek-
tedir [3]. Microsoft SQL Server, Windows i³letim sistemine sahip bilgisayarlar
üzerinde çal³abilen modern ve popüler veri taban sistemlerindendir. Yaygn
kullanm özellikle .NET uygulamalar ile olmaktadr. DB2, IBM tarafndan;
Sybase, SAP tarafndan geli³tirilen popüler veri taban sistemlerindendir.
    HBase, kolon temelli NoSQL veri taban olarak snandrlr. Kolon ailesi
(column family) yaps ile ayn satra (row) ait farkl kolon aileleri olu³turularak
verilere eri³imin hzlandrlmas mümkündür. Bir kolon ailesindeki veriye eri³im,
ba³ka bir kolon ailesindeki veriye eri³imi performans anlamnda etkilememek-
tedir. Ba³ka bir deyi³le kolon temelli yap veri aktarm esnasnda satrn ta-
mamen kilitlenmesine sebep olmamaktadr. Kolon temelli veri tabanlar d³nda
Anahtar-De§er (Key-Value), doküman temelli ve çizge temelli gibi NoSQL veri
taban tipleri de bulunmaktadr. HBase di§er NoSQL veri taban sistemlerinden,
HDFS alt yapsn kullanmas ile fark yaratmaktadr. Kendine ait ve tam perfor-
mansla çal³abilece§i da§tk bir dosyalama sisteminin varl§ HBase'i elastik ve
ölçeklenebilir klmaktadr. Bununla birlikte, rastlantsal okuma ve yazma konu-
sunda etkili olmas HBase'in di§er NoSQL veri taban sistemlerine göre avantaj
sa§lad§ ba³ka bir noktadr. Facebook Messages'n da tercih etti§i ve yaptklar
testlerde en iyi sonuçlar veren veri taban sistemi NoSQL olmu³tur [8].


3    Sistem Mimarisi


Gerçekle³tirilen çal³ma esnasnda, farkl veri tabanlarna ba§lanmak için Sp-
ring Çats (Framework) ve MyBatis Sürerlik Çats (Persistence Framework)
kullanlm³tr. Genel sistem mimarisi ekil 1'de gösterilmektedir.


                                        693
   Spring, bir uygulamann gerçekle³tirilmesi esnasnda gerekecek birçok mo-
dülü içinde barndran bir uygulama çatsdr. Bu çal³mada Spring'in i³lem yö-
neticisi (Transaction Manager) modülüne yer verilmi³tir.


                          ekil 1: Genel Sistem Tasarm .


   MyBatis Sürerlik Çats, ili³ki nesne modellerinden (ORM) farkl olarak sakl
yordamlarn (stored procedure) nesne olarak Java ortamnda tutulmasna veya
SQL cümlelerinin birer Java metotu olarak kullanlmasna olanak vermektedir.
MyBatis, kullanld§ projelerde, genel olarak, tek bir veri taban kaynak olarak
kullanlmaktadr.
   Spring Application-Context modülü i³lem yöneticisini barndrmaktadr. My-
Batis modülü, e³leyicileri (mapper) tutmaktadr ve SQL ifadeleri aracl§ ile
veri tabanndaki verinin çekilmesini sa§lamaktadr. ³lem yöneticisi SQL cümle-
ciklerinin çal³trlmas esnasnda do§abilecek istisnalar do§rultusunda i³lemleri
(Commit ve Rollback) yönetmektedir
   Çal³ma prensibi a³a§da maddeler halinde verilmektedir:

1. Kullanlacak veri taban sisteminin bilgileri (ör: Veri taban tipi, IP de§eri ,
    port, uid, parola, vb.) ile SqlSessionFactory (MyBatis snf) olu³turulmak-
    tadr.
2. MyBatis'te veri taban i³lemleri (ör: create, update, insert, vb.) servisler
    aracl§ ile gerçekle³tirilmektedir. Bu servisler veri taban yapsndaki tablo
    modellerine uygun ³ekilde çal³maktadrlar. Servislerle modeller arasndaki
    etkile³im e³leyiciler (mapper) aracl§ ile sa§lanmaktadr. Servislerin çal³a-
    bilmesi için bir önceki a³amada yaratlan SqlSessionFactory kullanlarak veri
    taban oturumu olu³turulmaktadr.


                                        694
 3. Bu a³amada istemci, e³leyicilerde tanmlanan fonksiyonlar aracl§yla veri
      tabanndaki modele eri³imini sa§layabilmektedir.
 4. Veri tabannda istenilen de§i³iklik veya görüntüleme yapldktan sonra, is-
      temci tarafndaki veri taban oturumu yine istemci tarafndan kapatlmak-
      tadr.


      Bu çal³mann hedeedi§i gereksinimlerinden biri olan farkl veri tabanlarna
ba§lanma ve i³lem yönetimi Bölüm 3.1'de, verilerin HBase'e aktarm ve eri³imi
Bölüm 3.2'de anlatlmaktadr.


3.1     Farkl li³kisel Veri Taban Sistemlerine Ba§lanabilme ve
        ³lemlerin Yönetilmesi


Bu projede Oracle, MSSQL, MySQL, Sybase ve DB2 veri taban sistemlerinin
hepsi birden veri kayna§ olarak kullanmak istenmektedir. Bunun bir sonucu ola-
rak yukarda anlatlan MyBatis çal³ma prensibi Spring'in özellikleri kullanlarak
geli³tirilmi³tir. MyBatis-Spring Kütüphanesi aracl§ ile Spring'in MyBatis ile
entegrasyonu gerçekle³tirilmi³tir (Bknz. ekil 2). Entegrasyonun sonucunda or-
taya çkan yap ³u ³ekilde çal³maktadr:


 1. Spring, Application-Context Container modülü içinde servis yönetimini ger-
      çekle³tirir. Bu modül içerisindeki i³levsel nesnelerden biri olan Datasource
      Bean, proje kapsamnda kullanlacak farkl veri taban sistemlerine ait bil-
      gilere eri³imi sa§lamaktadr (XML, Veri taban, Metin Belgesi veya Hard
      coded ³ekilde verilmi³ olan). Datasource Bean, bu bilgileri kullanarak, i³-
      lem yaplacak veri taban sisteminde ba§lant (connection) açmaktadr.
 2. Bir di§er i³levsel nesne olan SqlSession Bean, Datasource Bean 'in olu³-
      turdu§u ba§lanty kullanarak veri taban oturumunu açmaktadr.
 3. Veri taban üzerindeki i³lemleri gerçekle³tirmek amacyla kullanlan MyBatis
      servisleri birer Bean nesnesi olarak Container içerisinde yazlmc tarafn-
      dan tanmlanmaktadr. Bu servisler olu³turulurken bir önceki admda yara-
      tlan SqlSession enjekte edilmektedir. Ba§mllk enjeksiyonu (Dependency
      Injection) diye de adlandrlan bu yap sayesinde enjekte edilen oturum bil-
      gisine göre servis, farkl veri taban sistemi ile etkile³ebilmektedir.
 4. Aktif olan veri tabannda i³lem yaptktan sonra ba³ka bir veri tabanyla etki-
      le³ime geçilmek istenebilir. Bu durumda, Datasource Bean 'inin kulland§
      aktif veri taban bilgileri bu veri tabannn bilgileri ile de§i³tirilir. Bu de§i-
      ³im bir metot ya da arayüzden gelen bir istek ile gerçekle³tirilebilir. De§i³im
      tamamlandktan sonra Container yenilenir. Servisler yeni oturum bilgileri ile
      güncellenir ve etkile³ime hazr hale getirilir.


      Farkl veri tabanlarna ba§lant ve sorgulama amac ile kurulan sistem a³a-
§daki srada i³lemleri gerçekle³tirmektedir.

 1. Veri taban de§i³ikli§i istemi gönderilir.
 2. Ba§lanlacak veri tabanna ait bilgiler Spring ApplicationContext Conta-
      iner'a iletilir.


                                           695
 3. Ba§lant Açlr.
 4. SqlSession Bean ba§lanty sa§lar.
 5. Veri tabannda oturum açlr.
 6. Oturum Service Bean 'e enjekte edilir.
 7. Veri tabanndaki i³lemi gerçekle³tirilecek servis ça§rlr.
 8. Servis, Mapper'n gerekli metodunu ça§rr.
 9. Mapper ça§rlan metota uygun SQL cümleci§ini bulur.
10. Ba³langçta karar verilmi³ olan veri taban ile etkile³ime geçerek SQL cüm-
    leci§i ko³turulur.
11. Sorgu sonucu Service Bean 'e ula³trlr.
12. Kullanc tarafna servis ça§rsnn cevab ula³trlr.


                          ekil 2: Çoklu Veri taban Eri³imi


   Farkl veri tabanlar ile çal³rken kar³la³lan bir sknt da istisnalarn (excep-
tion) yönetimidir. Bu noktada da Spring Framework'ün sa§lad§ i³lem yönetimi
(Transaction Management) modülü kullanlmaktadr. Servislerin içerisindeki me-
totlardan i³lemsel olanlar (Transactional notasyonuna sahip olanlar) istisna ile
kar³la³lan durumlarda geri alma (Rollback) yapabilme özelli§ine sahip olurlar.
Detayl anlatm örnek üzerinde Bölüm 4.1.'de yaplacaktr.
   Veri tabanlar üzerinde kullanc tarafndan yaratlacak olan sorgular için ilgili
³emada hangi tablolarn bulundu§u bilgisine ihtiyaç duyulmaktadr. Her veri


                                         696
tabannn farkl bir yapya sahip olmasndan dolay bu tablolar listeleyebilmek
probleme neden olmaktadr. Projede bu probleme çözüm için Java'nn veri taban
tablo isim listesi, view isim listesi gibi meta data bilgilerini getiren java.sql paketi
içindeki DatabaseMetaData snf kullanlmaktadr. Bu snf birçok veri taban
tasarmcs kurulu³ ile ortak olu³turulmu³tur ve veri taban ile ilgili yapsal bütün
bilgileri bize sunabilmektedir.


3.2     Büyük Veri Taban Sistemlerine Veri Aktarm

HBase, Hadoop ile en verimli ³ekilde çal³maktadr. Hadoop'un da§tk mima-
risi HBase'in performans ve sa§lamlk açsndan optimum düzeyde çal³masn
sa§lamaktadr. Bu sebepten çal³mamzda ilk a³ama olarak Hadoop kurulumu
gerçekle³mi³tir.
      Bu a³amada Hadoop'un kurulacak olan versiyonunu seçerken, çal³lmaya
karar verilmi³ olan HBase versiyonu ile uyumlulu§una dikkat edilmi³tir. Ger-
çekle³tirilen çal³mada HBase 0.98.9-Hadoop2 versiyonu ve buna uyumlu olan
Hadoop 2.5.2 kurulmu³tur. Kurulumumuzda 3 tane i³çi (slave) ve 1 tane üstat
(master) dü§ümleri bulunmaktadr. Kurulum srasnda, makinalar Centos 6.5
i³letim sistemine sahiptir.
      Bu makinalar hepsinin üstüne Hadoop kurulumu gerçekle³tirilirken i³letim
sistemine ve Hadoop'a ait hosts, core-site.xml ve hdfs-site.xml dosyalar üze-
rinde ayarlarn yaplmas gerekmektedir. Bu dosyalar Hadoop'un temel 3 süreci
(process) olan Namenode (veri a§ac yapsn saklar cluster içinde hangi verinin
nerede tutuldu§unun kaydn barndrr), Datanode (verileri saklar) ve Secon-
daryNamenode'un (Namenode'un yede§idir) çal³masnda temel olmaktadr. Bir
master makinada Namenode tutulurken i³çi makinalarda Datanode çal³makta-
dr.
      SecondaryNamenode, Namenode'dan ba³ka bir makinada tutulmaktadr. Bu
sayede Namenode'un çökmesi durumunda SecondaryNamenode'daki bilgiler kul-
lanlarak sistem aya§a kaldrlabilir. Hosts, core-site.xml ve hdfs-site.xml
dosyalar master ve slave makinalarn her biri için ayarlanmaldr.
      Hadoop kurulumu ve kongürasyonu tamamlandktan sonra HBase kurulumu
gerçekle³tirilir. HBase'in temel süreçleri HMaster (Namenode'un ko³turuldu§u
makinada ko³turulur metadatalar saklar.), HRegionServer (Datanode'larn ça-
l³trld§ makinalarda çal³trlr, verilerin tablo yaps altnda saklanmasn sa§-
lar.) ve HQuorumPeer (Hmaster ve Hregionserverlar arasnda bilgi al³veri³inin
yaplmasn sa§lar. stemci tarafndan gelen istekleri yönetir.)'dir.
      HBase kurulurken hbase-site.xml kongüre edilmektedir. HDFS'nin yor-
dam (HDFS Path) burada belirtilmektedir. Yaplan kongürasyon HBase'in
tablolarn HDFS yaps altnda tutmasn sa§lamaktadr. Ayrca, Hadoop'un ça-
l³ma moduna göre (Fully Distributed, Pseudo Distributed, Single Node) HBase'in
çal³ma modu bu dosyada belirlenmektedir. Bu çal³mada single node (tek ma-
kina) ve fully distributed (tamamen da§tk) modlar testlerde kullanlmaktadr.
      HBase'in tablo yaps kolon aileleri (Column Family) içermektedir. Ayrca,
veriyi baytlar halinde tuttu§undan dolay kayt edilen verinin baytlara çeviri-
lerek kayt edilmesi gerekmektedir. JSON kaydedilecek verinin snf yapsnda


                                          697
baytlara çevrilerek kaydedilmesini sa§lamaktadr. Yaplacak testlerde kolon aile-
leri kullanlarak veri kayt edilmesi ve verinin JSON objesine çevrilerek kayt
edilmesi ayr ayr incelenmektedir. Bir sonraki bölümde gerçekle³tirilen testler
incelenecek ve sonuçlar payla³lacaktr.


4      Gerçekle³tirilen Testler ve Sonuçlar

Sistem gereksinimleri dahilinde 5 farkl veri taban i³letim sistemine eri³im per-
formans testleri ve i³lem yöneticisi fonksiyonalite testleri gerçekle³tirilmi³tir.
Bunlarla birlikte HBase veri taban üzerinde büyük veri yazma ve okuma testleri
yaplm³tr. Bölüm 4.1'de ili³kisel veri tabanlar üzerinde yaplan testler, Bölüm
4.2'de HBase üzerinde gerçekle³tirilen testler detaylandrlacaktr.


4.1     Çoklu ili³kisel veri taban sistemlerine eri³im testleri

li³kisel veri taban sistemlerine eri³im testleri 3.4 GHz i7 i³lemciye, 8Gb RAM'e
sahip bir makina üzerinde gerçekle³tirilmi³tir. li³kisel veri tabanna yönelik
fonksiyonel testler olarak, ba§lant kontrolü ve i³lem yönetimi testleri gerçek-
le³tirilmi³tir. Ba§lant kontrolünde (ekil 2'de detaylandrlan), veri tabanlarna
ba§lant ve oturum açma kontrolü bahsi geçen tüm veri tabanlar için gerçek-
le³tirilmi³tir. Bu test srasnda veri tabanlarndan sadece veri getirme amacyla
kullanlan (select sorgular içeren) servisler ça§rlm³tr. Servis ça§rlarnn so-
nucunda her veri tabannn kendisine ait olan veriyi eksiksiz bir ³ekilde getirdi§i
görülmü³tür.
      Farkl veri taban i³letim sistemlerinde bulunan, index içermeyen ve 8 ko-
lonluk varchar bilgi saklayan tablolardan 5000 satrn getirilmesi (select) ile
gerçekle³tirilen testlerin sonuçlar Tablo 1'de gösterilmektedir. MyBatis-Spring
kütüphanesi ile geli³tirilen ili³kisel veri taban eri³imi testlerinin sonuçlar Tablo
1'in ilk satrnda, JDBC ile gerçekle³tirilen testlerin sonuçlar tablonun ikinci sa-
trnda gösterilmektedir. Test sonuçlarna göre MyBatis-Spring kütüphanesi ile
olu³turulan sistemin sonuçlar JDBC ba§lantsna göre her veri taban için daha
iyi sonuçlar vermektedir.


                       Tablo 1: 5000 satrn okunmas (Saniye)

                              MySQL MSSQL ORACLE SYBASE DB2
               JDBC           2,01  2,06  2,14   2,32   2,45
               MyBatis-Spring 0,55  1,19  2,12   1,50   2,36


      ³lem yönetimi testinde, Cybersoft tarafndan kullanlan hatasz çal³mas
beklenen servisler kullanlmaktadr. Örne§in baz durumlarda, kullancnn web
uygulamas üzerinde oturum açp, i³ledi§i veriyi kaydetmek için ilgili servisi ça-
§rmas gerekmektedir. ekil 1'de gösterildi§i üzere Application Context içeri-
sinde bulunan ilgili servis, aktif olan veri taban oturumu kullanlarak çal³trlr.


                                         698
Böylelikle, kayt i³lemlerini kendisine enjekte edilmi³ oturum üzerinden gerçek-
le³tirebilmektedir.
      E§er metot i³lemselse yani @transactional notasyonuna sahip ise; Applica-
tion Context içerisinde yer alan i³lem yönetimi (transaction manager) aracl§yla
istisnalar yönetebilmektedir. Metot içerisinde istisna (exception) ortaya çkarsa
yaplan i³lemin geri alnmasn (rollback) ya da istisna olu³mam³sa metottan
dönüldü§ü srada i³lemin onaylanmasnn (commit) sa§lamas gerçekle³mekte-
dir. Bahsedilen örnek için kayt srasnda istisna çkaran durum ve çkarmayan
durum ayr ayr test edilmi³tir.
      ³lem yönetimi fonksiyonalite testleri sonucunda, istisna meydana geldi§inde
kaydetme i³leminin gerçekle³medi§i, istisna olmad§ durumda ise kullancnn
belirtti§i veri taban üzerinde kaytlarn olu³tu§u görülmü³tür.
      ³lem yönetiminin zamansal olarak yükünü gözlemlemek amacyla gerçekle³-
tirilen performans testleri sonucu Tablo 2'de sergilenmektedir. Ekleme i³leminde
kullanlan veri 8 kolonlu varchar içeren 1000 satrdan olu³maktadr. li³kisel veri
tabanlarna eklenmesi önceden yaratlm³ üzerinde index bulunmayan bir tablo
yaps kullanlarak gerçekle³tirilmi³tir. Tablo 2'de ilk satr @transactional no-
yasyonuna sahip, ikinci satr ise sahip olmayan metotlarn sonucunu göstermek-
tedir.
      Görülece§i üzere i³lemsellik dü³ük seviyede fazla yük yaratmaktadr. Bununla
birlikte, sebep oldu§u küçük dezavantaja ra§men sistemi hataya kar³ daha sa§-
lam klan (commit ve rollback) mekanizmalar içerdi§inden ötürü kullanlmas
fayda sa§lamaktadr.


                       Tablo 2: 1000 satrn eklenmesi (Saniye)

                               MySQL MSSQL ORACLE SYBASE DB2
                ³lemsel       14    16    55     15     17
                ³lemsel de§il 10    13    54     10     14


4.2      HBase veri taban performans testleri


HBase ve Hadoop, tek makina ve tam da§tk ³ekilde Cybersoft'a ait sunucular
üzerinde gerçekle³tirilmi³tir. Tek makina tipindeki kurulum 2GB RAM, 3 GHz
tek çekirdek i³lemciye sahip bir sunucuda çal³trlm³tr. Tam da§tk modda,
master makina 2 GB Ram ve 3 GHz çift çekirde§e sahip iken, slave makinalar
her biri 1 gb RAM ve 3GHz tek çekirdek i³lemciye sahip 2 makina üzerinde
kurulmu³tur.
      HBase yaps altnda verilerin eklenmesi ve okunmas zamansal etki aç-
sndan incelenmi³tir. A³a§da sonuçlar sunulan testler, UCI Yapay Ö§renme
Veri kayna§ndan (http://archive.ics.uci.edu/ml/datasets/Poker+Hand) çekilen
1025010 satr ve 11 kolon içeren veri kümesi ile gerçekle³tirilmi³tir.


                                         699
   Tablo 3'te tek makina ve tam da§tk kongürasyonlar üzerinde sral (synch-
ronous) ve toplu (batch) veri ekleme sonuçlar gösterilmektedir. Toplu olarak veri
ekleme sonuçlar beklendi§i gibi daha iyi sonuç vermektedir (30 kat daha iyi).
Tam da§tk yaplandrmada ise toplu veri ekleme sonuçlar beklenildi§i gibi tek
makinadan daha iyi sonuç vermektedir.


                    Tablo 3: 1 milyon satrn eklenmesi (Saniye)

                                        Senkron Toplu
                            Tek Makina 1865     66
                            Tam da§tk 2129    26


   Tablo 4'te tek makina ve tam da§tk kongürasyonlar üzerinde JSON'a çevi-
rilerek ve kolon ailelerine bölünerek veri ekleme sonuçlar gösterilmektedir. Snf
yapsna sahip JSON objeleri ile tek bir kolon ailesi üzerinden yaplan testlerin
çoklu kolon ailesi yaps ile gerçekle³tirilen testlere göre daha iyi sonuç verdi§i
saptanm³tr.


            Tablo 4: 1 milyon satrn farkl yaplarda eklenmesi (Saniye)

                                      JSON Kolon Ailesi
                          Tek Makina 37    111
                          Tam da§tk 25   97


   Tablo 5'te tek makina ve tam da§tk yaplandrmalar üzerinde okuma i³lem-
lerinin sonuçlar gösterilmektedir. HBase yaps ile tek makina (3 GHz i³lemci ve
2 GB RAM) üzerinde yaplan testlerin sonucunda 1025010 satrn okunmas 44
saniye sürmü³tür. u ana kadar gerçekle³tirdi§imiz testlerde ili³kisel veri taban
sistemlerinden bu seviyede bir veri okumas gerçekle³tirilememi³tir (3.4 GHz i7
i³lemciye, 8Gb RAM'e sahip bir makina üzerinde). Basit bir hesapla 5000 satr-
lk verinin okunmas en iyi ihtimalle (MySQL) 0,55 sn sürdü§üne göre 1 milyon
satrlk verinin okunmas 0,55*200=110 sn sürecektir.


                    Tablo 5: 1 milyon satrn okunmas (Saniye)

                                            Okuma
                                Tek Makina 44
                                Tam da§tk 45


                                        700
    Elde edilen sonuçlara dayal olarak, HBase' in 3 kat daha hzl veri döndü§ü
saptanm³tr. Veri okunmas ksmnda tam da§tk yaplandrmada verinin her
bir makinadan toplanarak getirilmesi söz konusu oldu§undan dolay tek makine
ve tam da§tk yaplandrma arasnda belirgin bir süre farkna rastlanmam³tr.


5    Sonuç ve Gelecekteki Çal³malar


Bu çal³ma kapsamnda, birden fazla veri tabannn ortak kullanmnn oldu§u
sistemlerde kar³la³lan problemlere bir çözüm geli³tirilmektedir. Bu problemler
arasnda, ba§lant problemleri, hangi tablonun hangi veri tabanndan geldi§inin
bilinememesi, i³leme ve geri alma mekanizmalarnn yeterli düzeyde sa§lanama-
mas yer almaktadr.
    Önerilen çözüm, Oracle, MySQL, MSSQL, DB2 ve Sybase gibi veri taban-
lar için ortak bir eri³im katman olu³turmakta ve bu farkl veri tabanlarndan
elde edilen büyük hacimli verinin muhafaza edilmesi ve analiz i³lemlerinde kul-
lanlabilmesi için kolon tabanl büyük veri i³leme platformlarn kullanmaktadr.
Çözümün kullanlabilirli§i test etmek amacyla, 5 farkl veri tabanna eri³im
performans testleri ve i³lem yöneticisi fonksiyonalite testleri gerçekle³tirilmi³tir.
Bunlarla birlikte HBase veri taban üzerinde büyük veri yazma ve okuma test-
leri de yaplm³tr. Testler sonucunda elde edilen sonuçlar, önerilen yakla³mn,
i³lemsellik açsnda dü³ük seviyede ek yük yaratt§n göstermektedir. Bununla
birlikte, sebep oldu§u küçük dezavantaja ra§men sistemi hataya kar³ daha sa§-
lam klan commit ve rollback mekanizmalar sayesinde faydalar sa§lamaktadr.
Yine elde edilen, test sonuçlarna göre, çözümde kullanlan MyBatis ve Spring
kütüphaneleri ile olu³turulan sistemin sonuçlar JDBC ba§lantsna göre her veri
taban için daha iyi sonuçlar vermektedir. Toplu olarak veri ekleme sonuçlar ise
beklendi§i gibi daha iyi sonuç vermi³tir.
    Gelecek çal³malar arasnda, önerdi§imiz çözümün daha farkl veri tabanlar
üzerinde test edilmesi ve daha kapsaml performans ve yük testlerinin yaplmas
yer almaktadr.


Kaynaklar

1. Database management systems. http://db-engines.com/en/systems, note= Ula³m:
   09.01.2015, key= 0
2. Db-engines ranking. http://db-engines.com/en/ranking, note = Ula³m: 09.01.2015,
   key= 1
3. Oracle system properties. http://db-engines.com/en/system/Oracle, note= Ula³m:
   09.01.2015, key= 2
4. Alapati, S.R.: Expert Oracle Database 11G Administration. Apress, Berkely, CA,
   USA, new edn. (2008)
5. George, L.: HBase: the denitive guide. " O'Reilly Media, Inc." (2011)
6. Ghemawat, S., Gobio, H., Leung, S.T.: The google le system. In: ACM SIGOPS
   operating systems review. vol. 37, pp. 2943. ACM (2003)
7. Leavitt, N.: Will nosql databases live up to their promise? Computer 43(2), 1214
   (2010)


                                        701
8. Muthukkaruppan, K.: Storage infrastructure behind facebook messages. Proceedings
   of HPTS 11 (2011)
9. White, T.: Hadoop: The denitive guide. " O'Reilly Media, Inc." (2012)


                                       702

</pre>