<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Pazar Sepeti Analizi icin O rneklem Olusturulmas ve Birliktelik Kurallar n n C kart lmas</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Sider Hazal K rtay</string-name>
          <email>hazalkirtay@gmail.com</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Nevzat Ekmekci</string-name>
          <email>nvztekmekci@gmail.com</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Tugba Hal c</string-name>
          <email>tugba.halici@cs.com.tr</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Utku Ketenci</string-name>
          <email>utku.ketenci@cs.com.tr</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Mehmet S. Aktas</string-name>
          <email>aktas@yildiz.edu.tr</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>ve Oya Kal ps z</string-name>
          <email>kalipsiz@yildiz.edu.tr</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Anahtar Kelimeler: O</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Ar-Ge Merkezi</institution>
          ,
          <addr-line>Cybersoft, I</addr-line>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Bilgisayar Muhendisligi Bolumu, Elektrik-Elektronik Fakultesi Y ld z Teknik U</institution>
        </aff>
      </contrib-group>
      <fpage>172</fpage>
      <lpage>183</lpage>
      <abstract>
        <p>O zet Bankac l k sektorunde musteri ihtiyaclar n n dogru, eksiksiz ve h zl bir sekilde tespit edilmesi ve urun onerilerinde bulunulmas , musteri memnuniyetinin art r lmas icin onem arz etmektedir. Her gecen gun artan islem ve musteri say s nedeniyle analiz yapmak; zaman ve bellek tuketimi ac s ndan maliyetli hale gelmistir. Bu bildiride, urun oneri sisteminin performans n art rmak icin Pazar Sepeti Analizi surecine orneklem olusturma islemi dahil edilmistir. Boylece evren yerine; evreni temsil eden ve daha az gozlem say s na sahip orneklem uzerinde islem yap larak, analiz suresi ve bellek kullan m azalt labilecektir. Bu kapsamda, orneklem olusturma yontemleri, orneklem boyutlar n bulan teknikler, olusturulan orneklemlerin evrene benzerligini olcen testler ve orneklemden c kart lan birliktelik kurallar incelenmistir. Musterilerin ortak sat n alma davran slar Apriori algoritmas kullan larak bulunmustur. Teknikler; eksiksiz kural c kartma ve harcanan sure kriterlerine gore kars last r lm st r.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        Gelisen veri depolama kapasitesiyle birlikte bankalar n veritabanlar buyuyup
zenginlesmistir. Cogu stratejik sat s ve pazarlama kararlar , bu verilerin
islenmesiyle elde edilmektedir. O rnegin, capraz sat s (cross sell), yukar sat s (up sell)
veya risk yonetimi (risk management) gibi stratejiler musteri verisinin islenmesi
sonucunda olusturulmaktad r. Artan musteri say s ve buna bagl artan islem
kapasitesiyle musteri ihtiyaclar n h zl ve dogru bir sekilde tespit ederek cozum
onerileri sunmak daha da zor bir hale gelmistir. Bu sorunun cozumu icin yenilikci
veri madenciligi uygulamalar ve tekniklerine ihtiyac duyulmaktad r [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ].
      </p>
      <p>Pazar sepeti analizi musterilerin urun sahiplik verilerinde var olan oruntuyu
bulabilmek amac yla uygulanan veri madenciligi yontemlerinden biridir. Bu analiz
sayesinde musterilerin s kl kla beraber sat n ald g urunler aras nda bir oruntu
kurulabilir. Elde edilen oruntu, capraz sat s ve yukar sat s stratejilerinin
gelistirilmesinde aktif rol oynamaktad r. Pazar sepeti analizi iki ana surecten olusmaktad r.
Bunlar s ras yla kumeleme ve birliktelik surecleridir. Kumeleme sureci, birbirine
benzer musterilerin kumeler halinde gruplanmas n icermektedir. Boylelikle ayn
kategoride incelenmesi gereken musteriler belirlenmis olacakt r. Birliktelik
surecindeyse, kumelenmis ve birbirine benzer ozellikteki musterilerin benzer sat n
alma davran s gosterecegi varsay m yla, secili bir kume uzerinden musterilerin
sat n alma davran slar ndaki ortakl klar tespit edilmektedir.</p>
      <p>Bankac l k veritabanlar n n cok buyuk olmas nedeniyle birliktelik islemi
zaman ve bellek tuketimi ac s ndan cok maliyetli bir surec haline gelmistir.
Zaman ve bellek performans n art rabilmek amac yla birliktelik oncesine
ornekleme sureci dahil edilmesi gerekmektedir. Bu kapsamda evren olarak adland r lan
butun veri kumesinden daha az gozlem say s na sahip ve evreni temsil edebilecek
bir orneklem olusturulmaktad r. Elde edilen orneklemin temsil gucunun yuksek
olmas durumunda bilgi kayb en aza indirgenmekte ve birliktelik sureci evren
yerine orneklem uzerinden gerceklesmektedir. Boylece daha az veri islenerek
birliktelik kurallar daha h zl ve daha az bellek harcanarak elde edilmis olacakt r.</p>
      <p>Arast rma konusu banka verisi uzerinde yogunlast g ndan, banka taraf ndan
yap lm s olan musteri segmentasyonu kumeleme olarak kabul edilmistir.
Segmentasyon sonucunda birbirine benzer musterilerin olusturdugu kumeler ornekleme
icin girdi olarak kullan lm st r. Bildiride s ras yla orneklem olusturma
yontemleri, ideal orneklem boyutunu bulan teknikler, bu tekniklerle uretilen
orneklemlerin evreni temsil gucu ve orneklemler uzerinden c kart lan birliktelik kurallar
incelenmistir. Hem evrenden hem de orneklemden elde edilen birliktelik
kurallar orneklem surecini dogrulamak icin kullan lm st r. Ayr ca, zaman tuketimi
ac s ndan ortaya c kan kazan m hesaplanm st r.</p>
      <p>Bu bildirinin yaz m organizasyonu su sekildedir; Bolum 2'de; evren ve
orneklem uzerinden birliktelik kural c kartmaya yonelik yap lan benzer cal smalar
anlat lacakt r. Bolum 3'te; birliktelik kurallar elde etmek icin gerekli olan
parametreler ve Apriori algoritmas ac klanacakt r. Bolum 4; orneklem olusturmak
icin gerekli olan parametrelerin, orneklem olusturma yontemlerinin ve
orneklem buyuklugunu hesaplamada kullan lan tekniklerin anlat mlar n icermektedir.
Bolum 5'te; evren ve orneklemden elde edilen birliktelik kurallar ve orneklemin
evreni temsil etme gucunu gosteren sonuclar ile zaman tuketimi ac s ndan elde
edilen kazan m gosteren sonuclar incelenecektir.
2</p>
    </sec>
    <sec id="sec-2">
      <title>I_lgili Cal smalar</title>
      <p>
        Birliktelik alan ndaki cal smalar 1990'l y llarda ortaya c km s ve o donemden
gunumuze artarak devam etmistir [
        <xref ref-type="bibr" rid="ref14">14</xref>
        ]. Bu cercevede ilk once s kca beraber
bulunan oge kumeleri c kart lmakta, daha sonras nda da bu oge kumelerinden
kurallar elde edilmektedir. Birliktelik algoritmalar , elde edilen oge kumeleri
ozelliklerine gore s n and r lmaktad rlar. Yap lan ilk cal smalarda genis oge
kumeleri bulmay saglayan Agrawal-Imielinski-Swami (AIS) algoritmas kullan lm s,
sonras nda gunumuzde de s kca kullan lan ve buyuk veri kumelerini de h zl
isleyebilen Apriori gibi algoritmalar bulunmustur [
        <xref ref-type="bibr" rid="ref14 ref2">2,14</xref>
        ].
      </p>
      <p>
        Birliktelik bulma ve orneklem olusturma yontemlerinin beraber kullan lmas
yeni bir yaklas m degildir. Birliktelik bulmak amacl olarak orneklem olusturma
cal smalar , evrenin ozelliklerini koruyan bir orneklemin olusturulabilecegini
matematiksel olarak ispatlayan makalelerle baslam st r. Daha sonras nda gerceklesen
cal smalarda, ideal gozlem say s n hesaplayan bircok farkl teknik yer alm st r
[
        <xref ref-type="bibr" rid="ref3 ref4 ref6 ref7">3,4,6,7</xref>
        ].
      </p>
      <p>
        O rneklem boyutu bulma cal smalar n n baslang c nda orneklenecek veriyle
ilgilenilmemis; hata pay , asgari destek degeri ve asgari guven degeri gibi
veriden bag ms z olan parametreler kullan larak orneklem boyutu hesaplanmaya
cal s lm st r [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ]. Devam eden cal smalarda, verinin ozelliklerini de hesaba katan
(azami islem uzunlugu veya veri kumesinin Vapnik{Chervonenkis boyutu gibi
degiskenler kullanan) formuller ortaya c km st r [
        <xref ref-type="bibr" rid="ref4 ref6 ref7">4,6,7</xref>
        ].
      </p>
      <p>Bolum 3 ve 4'te s ras yla birliktelik bulma ve orneklem olusturma yontemleri
detayland r lacak ve cal smada kullan lan teknikler anlat lacakt r.
3</p>
      <sec id="sec-2-1">
        <title>Birliktelik Bulma</title>
        <p>
          Veri madenciligi alan nda birliktelik algoritmalar , gozlemler aras nda var olan
oruntunun bulunmas icin kullan lmaktad r [
          <xref ref-type="bibr" rid="ref2 ref8">2,8</xref>
          ]. Herhangi bir kurulusun islem
veritaban ele al nd g nda; gozlemlerle musteriler ve oruntu bulunmaya cal s
lacak alanlarla sat n al nan urunler aras nda bir analoji kurulabilir. Birliktelik
algoritmalar n n elde ettigi oruntuler islenerek birliktelik kurallar elde
edilmektedir.
        </p>
        <p>Birliktelik kurallar n n tan m soyle yap labilir; veritaban nda bulunan urunler
kumesinin tum alt kumelerine oge kumesi (itemset) ve bir musterinin beraber
sat n ald g urunlerin olusturdugu kumeye ise islem (transaction) diyelim.
Herhangi bir oge kumesinin sahip oldugu destek say s (support count) kume
elemanlar n n veritaban nda beraber bulundugu islem say s olarak tan mlanmaktad r.
O ge kumesinin destek degeri (support) ise destek say s n n veritaban ndaki islem
say s na oran n gostermektedir. Kullan c taraf ndan belirlenen asgari destek
degeri (minimum support) kosulunu saglayan oge kumesi ise s k rastlanan oge
kumesi (frequent itemset - SRO K) olarak adland r lmaktad r. O rnegin, 10 tane
islem bar nd ran bir veritaban nda A urunu 3 farkl islemde yer al yorsa; A
urununun destek say s 3, destek degeri ise 0.3' tur. Asgari destek degerinin
0.3'un alt nda bir degerle tan mlanmas durumunda, A urunu SRO K olarak
s n an r.</p>
        <p>
          Veritaban ndaki islemleri kullanarak SRO K c kartan cok say da algoritma
bulunmaktad r [
          <xref ref-type="bibr" rid="ref10 ref2 ref8 ref9">2,8,9,10</xref>
          ]. Evrende var olan butun oge kumelerini c kartmas
nedeniyle Apriori algoritmas tercih edilmistir. Algoritma, oncelikle veritaban ndan
1-elemanl aday oge kumelerini c kartmaktad r. Aday oge kumeleri icinden asgari
destek degerini saglayanlar ltrelenir ve SRO K olarak kaydedilir. Eleman say s
art r larak bir onceki ad mda elde edilen SRO K'den yeni aday oge kumeler elde
edilmektedir. Aday oge kumeleri her ad mda asgari destek degeri s namas ndan
gecirilerek k-elemanl SRO K uretilemeyene kadar algoritman n cal smas devam
etmektedir. Algoritma 1'de Apriori algoritmas n n sozde kodu verilmistir.
Algoritma 1 Apriori algoritmas
Girdi I: urun kumesi
min sup: asgari destek degeri
        </p>
        <sec id="sec-2-1-1">
          <title>C kt SR OK: s k rastlanan oge kumeleri</title>
          <p>k = 0
SR OK
do</p>
          <p>;
k k + 1
Adayk
SR OKk ;
for all A 2 Adayk do
if supp(A) min sup then</p>
          <p>SR OKk SR OKk [ A
end if
end for</p>
          <p>SR OK SR OK [ SR OKk
while SR OKk 6= ;</p>
          <p>I kumesinin k-elemanl alt kumeleri</p>
          <p>
            Veritaban ndan elde edilen SRO K'nin elemanlar aras nda A ! B format nda
birliktelik kurallar (association rule - BK) c kart labilmektedir. BK'nin destek
degeri A [ B oge kumesinin destek degerine esit olmaktad r. Guven degeri (con
dence) ise A[B oge kumesinin destek degerinin A oge kumesinin destek degerine
oran olarak tan mlanmaktad r. BK'nin kullan c taraf ndan belirlenen asgari
guven degeri (minimum con dence) kosulunu da saglamas gerekmektedir [
            <xref ref-type="bibr" rid="ref2">2</xref>
            ].
          </p>
          <p>A ! B kural n n s destek degerine ve c guven degerine sahip oldugunu
varsayarsak, A ve B oge kumelerinin butun veritaban nda s ihtimalle beraber
bulundugu, ayr ca A oge kumesine sahip olan musterilerin c ihtimalle B oge
kumesine de sahip oldugu c kart m yap labilir.</p>
          <p>Veritaban ndaki butun BK'nin bulunmas icin elde edilen her SRO K'ye
kural c kartma algoritmas uygulanmaktad r. Kural c kartmak icin secilmis bir
SRO K'nin butun alt kumeleri aras nda A ! B format nda aday kural
kombinasyonlar olusturulmaktad r. Aday kurallar aras ndan asgari guven degerini
saglayanlar ltrelenir ve BK olarak kaydedilir. Algoritma 2'de kural c kartma
algoritmas n n sozde kodu verilmistir.
4</p>
        </sec>
      </sec>
    </sec>
    <sec id="sec-3">
      <title>O rneklem Olusturma</title>
      <p>O rneklem olusturma, bir veri kumesinin ozelliklerini bar nd ran alt kumesinin
olusturulmas islemidir. O rnekleme sonucunda ortaya c kan alt kumenin, veri
kumesini (evreni) temsil etmesi beklenmektedir.</p>
      <p>Geleneksel istatistik yontemlerinde, iki veri kumesinin benzerligi 2 testi veya
Kolmogorov-Smirnov (K-S) testi ile olculmektedir. 2 testi uygulan rken evren
ozelliklerinin bulunma ihtimalinin %5' n alt nda olmamas sart aranmaktad r.
Algoritma 2 Birliktelik kural algoritmas</p>
      <sec id="sec-3-1">
        <title>Girdi SR OK: s k rastlanan oge kumeleri</title>
        <p>min sup: asgari destek degeri
min conf : asgari guven degeri
C kt BK: birliktelik kurallar</p>
        <p>BK ;
for all B 2 SR OK do
for all A B do
if conf (A ! B) min conf and supp(A ! B)</p>
        <p>
          BK BK [ (A ! B)
end if
end for
end for
min sup then
Aksi takdirde, testlerde yanl l k olusabilmektedir [
          <xref ref-type="bibr" rid="ref15">15</xref>
          ]. K-S testinde buna benzer
bir sart olmamas na kars n, bu testin de 2. tur hata verme ihtimali yuksektir
[
          <xref ref-type="bibr" rid="ref15">15</xref>
          ]. Olusturulan orneklemin evrene benzerligini olcmek amac yla bu testlerden
faydalan lm st r. Her iki testin verdigi istatistiklerin p degeri kars l klar
uzerinden bir kars last rma yap labilir. Elde edilen p degeri; 0.05'in ustunde c kmas
durumunda \orneklem en az %95 ihtimalle evrene benzerdir" gibi bir c kart m
yap labilmektedir.
        </p>
        <p>O rneklem olusturma; orneklem olusturma yontemleri ve orneklem boyutu
bulma teknikleri olmak uzere iki basl kta incelenmektedir. O rneklem olusturma
yontemleri Bolum 4.1'de, orneklem boyutu bulma teknikleri Bolum 4.2'de
anlat lm st r.
4.1</p>
        <p>O rneklem Olusturma Yontemleri
Evrenden orneklem olustururken, bir cok farkl orneklem olusturma yontemi
kullanmak mumkundur. Bu yontemler, evrenden gozlem secme sekillerine gore
s n and r lmaktad r. Basl ca orneklem olusturma yontemleri sunlard r;
{ Basit rastlant sal ornekleme: Evrendeki gozlemler herhangi bir rutin
izlenmeden rastgele secilir. Her gozlemin secilme olas l g ayn d r.
{ Sistematik ornekleme: Evrendeki gozlemler numaraland r l r. Evren
boyutunun gozlem boyutuna oran kadar bolum evrende olusturulur. Rastgele bir
numara secilir. Her bolumden bu numaradaki gozlem ornekleme dahil edilir.
{ Katmanl ornekleme: Evrendeki gozlemlerin gruplara ayr labilecegi
durumlarda kullan l r. Gruplar n/katmanlar n gozlem say s n n evrendeki toplam
gozlem say s na oran korunacak sekilde orneklem olusturulur. Ayn katman
icindeki her bir gozlemin secilme olas l g ayn d r.
{ Kume ornekleme: Evrendeki gozlemlerin gruplara ayr labilecegi durumlarda
kullan l r. Gruplar belirlendikten sonra basit rastlant sal orneklem
yontemiyle iclerinden secim yap l r. Secilen gruplar icindeki butun gozlemler
ornekleme dahil edilir.
{ Cok asamal ornekleme: Evrendeki gozlemlerin gruplara ayr labilecegi
durumlarda kullan l r. Gruplar belirlendikten sonra basit rastlant sal orneklem
yontemiyle gruplar secilir. Kume orneklemeden farkl olarak, gruplar icinden
secilecek olan gozlemler basit rastlant sal ornekleme yontemiyle belirlenir.</p>
        <p>Bahsi gecen yontemler aras ndan basit rastlant sal ornekleme yontemi h zl
cal smas yla one c kmaktad r. Evrende grup olusturulmas n ve gozlemler aras nda
s ralama olmas n gerektiren yontemler, on analiz sureci gerektirdiginden, zaman
tuketimleri basit rastlant sal ornekleme yontemine gore daha fazlad r.
4.2</p>
        <p>O rneklem Boyutu Bulma Teknikleri
O rneklem olusturma yontemlerinde beklenen parametre, olusturulacak olan
orneklemin boyutudur. I_deal orneklem boyutu hesaplan rken, evreni temsil etme
gucunu dusurmeyecek bir say bulunmas gerekmektedir.</p>
        <p>
          Birliktelik algoritmalar kapsam nda, olusturulacak orneklemden evrendeki
butun SRO K'lerin ve BK'lerin c kart lmas onemlidir. Bu cal smada, orneklem
boyutunu bulmak icin gelistirilen tekniklerden, birliktelik algoritmalar icin
ozellesmis olanlar incelenmistir [
          <xref ref-type="bibr" rid="ref3 ref4 ref6 ref7">3,4,6,7</xref>
          ]. O rneklem boyutu bulma teknikleri SRO K
ve BK kayb n asgariye indirecek sekilde ikiye ayr lm st r. Tablo 1'de teknik tipi
sutununda SRO K bar nd ranlar, SRO K kayb n ; BK bar nd ranlar ise BK kayb n
ortadan kald rmay hede emektedir.
        </p>
      </sec>
      <sec id="sec-3-2">
        <title>Tablo 1: Orneklem boyutunu hesaplayan teknikler verilmistir. Asgari orneklem boyutu;</title>
        <p>
          dogruluk ", aksakl k ihtimali , asgari destek degeri , asgari guven degeri , evrenin
d-indeks degeri v, evrenin azami islem uzunlugu ve c sabiti cinsinden bulunabilir.
Formullerde gecen degeri ; ve " degiskenlerine; p ise ve degerlerine bagl olarak
hesaplanmaktad r [
          <xref ref-type="bibr" rid="ref12 ref13 ref5">5,12,13</xref>
          ].
        </p>
        <p>
          Chakaravarthy [
          <xref ref-type="bibr" rid="ref4">4</xref>
          ]
        </p>
        <p>BK-mutlak
na gore farkl c kmaktad r. Bu hata pay iki farkl yontem kullan larak
olculmektedir. Mutlak hata pay hesab nda, evrenden ve orneklemden bulunan degerlerin
fark n n mutlak degerine bak lmaktad r. Bag l hata pay ise, mutlak hata pay n n
evrendeki degere oran al narak hesaplanmaktad r. Tablo 1'de teknik tipi
sutununda mutlak bar nd ranlar, mutlak hata pay n ; bag l bar nd ranlar ise bag l
hata pay n asgariye indirmeyi hede emektedir.</p>
        <p>I_ncelenen butun teknikler, onerdikleri formuller ve formul tipleriyle birlikte
Tablo 1 uzerinde gosterilmistir. Teknikler sonucunda bulunan degerler orneklem
olusturma icin gereken asgari islem say s n bulmaktad r. Bulunan deger kadar
islem, belirlenen orneklem olusturma yontemiyle evrenden secilmektedir.</p>
        <p>
          Evrenin karmas kl g teorik olarak Vapnik-Chernovenkis (VC) boyutu ile
hesaplanmaktad r. Tablo 1'deki formullerde VC boyutu yerine ona ust s n r olan
d-indeks degeri kullan lmaktad r [
          <xref ref-type="bibr" rid="ref11 ref7">7,11</xref>
          ]. Veritaban ndaki islemlerin, sahip
olduklar oge say s na gore s raland klar n ve islem say s -oge say s eksenli koordinat
sistemine yerlestirildigini varsayarsak, d-indeks degeri en buyuk karenin kenar
uzunluguna kars l k gelecektir. Cal smada onerilen d-indeks algoritmas islemler
aras nda s ralama kosulu aramamakta ve v'yi 1'den baslat p art r rarak
hesaplamaktad r. Degerin bulunmas icin veritaban ndaki butun islemlerin taranmas
gerekmektedir.
        </p>
        <p>Algoritma 3 I_yilestirilen d-indeks hesaplama algoritmas
Girdi V T : islem veritaban
C kt v: d-indeks degeri</p>
        <p>Bankac l k verisi gibi islem say s n n cok ve her bir islemdeki oge say s n n
az oldugu durumlarda islemlerin uzunlugu d-indeks degerini bulmada belirleyici
olmaktad r. O nerilen algoritman n, eldeki veriyle test edildiginde yavas cal st g
gozlenmistir. Bu nedenle, islem uzunluklar goz onunde bulundurularak
iyilestirilmis versiyon Algoritma 3'te sozde kod olarak verilmektedir. Veritaban ndaki
islemler, oge say s azalacak sekilde s ralanm s ve v degeri azami islem
uzunlugundan baslat l p azalt larak hesaplanm st r. Boylece, butun islemlerin taranmas na
gerek kalmam st r.</p>
        <p>
          Tablo 1'de gecen parametrelerin ayr nt lar ve ispatlar na [
          <xref ref-type="bibr" rid="ref12 ref13 ref5 ref7">5,7,12,13</xref>
          ] cal
smalar ndan ulas labilir.
5
        </p>
        <sec id="sec-3-2-1">
          <title>Test ve Deneysel Degerlendirme</title>
          <p>Testler, bankac l k musterisi urun sahipligi verisi uzerinde gerceklestirilmistir.
I_statistiki cal smalarda yayg n olarak kullan lan R programlama dilinde kod
gelistirilmesi yap lm st r. Testler yap l rken s ras yla su asamalar izlenmistir:
1. Farkl tekniklerden faydalan larak orneklem boyutunun bulunmas ,
2. Hesaplanan boyutun evrenden daha kucuk olmas durumunda, basit
rastlant sal ornekleme yontemi kullan larak her bir teknik icin 3 ayr orneklemin
olusturulmas ,
3. Elde edilen orneklemlerin evreni temsil gucunu kars last rmak amac yla 2
ve K-S testlerinin incelenmesi,
4. R dilinin arules paketinde var olan Apriori algoritmas ndan faydalan larak
evren ve orneklem uzerinden SRO K'nin ve BK'nin elde edilmesi,
5. Sonuclar n, evren uzerinden elde edilenlerle kars last r larak destek ve guven
degerlerinde olusan mutlak hatan n hesaplanmas ,
6. Evrenden BK elde etme suresiyle orneklem olusturma ve olusturulan
orneklemden BK uretme suresinin kars last r lmas .</p>
          <p>Teorik olarak; tekniklerden elde edilen farkl boyutlardaki orneklemlerin SRO K
ve BK sonuclar n n evrenin sonuclar yla uyusmas , temsil gucu ve mutlak hata
aras nda bir iliski olmas , ayr ca orneklem uzerinden yap lan islemlerde gecen
surenin ve bellek tuketiminin azalmas beklenmektedir.</p>
          <p>
            Test sureclerini h zland rmak icin bankan n 143 urunu yerine 10 farkl urun
grubu belirlenmis ve bu gruplar aras ndaki birliktelik arast r lm st r. Kullan lan
banka verisi 1048575 musteri ve bu musterilerin 10 farkl urun grubuna sahiplik
durumlar n n bulundugu bir matristir. Sat rlar, musterileri; sutunlar ise urun
gruplar n temsil etmektedir. Musterinin bir urune sahip olmas durumunda ilgili
sat r-sutun kesisimde 1, aksi takdirde 0 bulunmaktad r. Testlerde dogruluk " =
0:04, aksakl k ihtimali = 0:07, asgari destek degeri = 0:02 ve asgari guven
degeri = f0:06; 0:1; 0:14g olarak kullan lm st r. Dogruluk ve aksakl k ihtimali
[
            <xref ref-type="bibr" rid="ref7">7</xref>
            ]'deki degerler temel al narak; asgari destek degeri banka verisinin yap s goz
onunde bulundurularak secilmistir. Bu uc parametre sabit tutularak farkl asgari
guven degerleri [
            <xref ref-type="bibr" rid="ref7">7</xref>
            ]'deki gibi test edilmistir.
          </p>
          <p>Tablo 2 degisen asgari guven degerlerine bagl olarak degisen orneklem
boyutlar n gostermektedir. Toivonen, Chakaravarthy SRO K-mutlak, Chakaravarthy
BK-mutlak, Riondato SRO K-mutlak ve Riondato SRO K-bag l formullerinde
'n n parametre olarak kullan lmamas nedeniyle hesaplanan boyutlarda degisim
bulunmamaktad r.</p>
          <p>Tablo 2 detayl incelendiginde; Chakaravarthy SRO K-mutlak, Chakaravarthy
BK-mutlak, Riondato SRO K-bag l ve Riondato BK-bag l tekniklerinden elde
edilen boyutlar n, evrenden (1048575) daha buyuk oldugu gorulmektedir. Veri
Tablo 2: Degisen asgari guven degerlerine gore hesaplanan orneklem boyutlar
verilmistir. Hesaplanan boyutun evrenden daha buyuk oldugu teknikler orneklem
olusturma asamas nda kullan lmam st r.</p>
          <p>Teknik Ad
Zaki
Toivonen
Chakaravarthy
Chakaravarthy
Riondato
Riondato
Riondato
Riondato</p>
          <p>Teknik Tipi</p>
        </sec>
      </sec>
      <sec id="sec-3-3">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-4">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-5">
        <title>SR OK-mutlak</title>
        <p>BK-mutlak</p>
      </sec>
      <sec id="sec-3-6">
        <title>SR OK-mutlak</title>
        <p>SR OK-bag l
BK-mutlak
BK-bag l
kumesinin kucultulmesi amacland g ndan, bu teknikler bir sonraki testlerde
incelenmemistir. Basit raslant sal ornekleme yonteminden kaynakl hatay asgariye
indirebilmek amac yla Zaki, Toivonen, Riondato SRO K-mutlak ve Riondato
BKmutlak tekniklerinin her biri icin 3 orneklem olusturulmustur.</p>
        <p>Tablo 3'te her bir teknigin 2 ve K-S testlerinden hesaplanm s ortalama
p degerleri gorulmektedir. Evren ve orneklemin benzerlik onem derecesi %95
olarak kabul edildiginde p degerlerinin 0.05'ten buyuk c kmas
beklenmektedir. Sonuclara gore, evren ve elde edilen butun orneklemler aras nda
istatiksel olarak benzerlik oldugunu kan tlamada yeterli olacak degerler elde edilmistir.
O rneklem boyutu degismeyen Toivonen tekniginin p degerlerinde karars zl k goze
carpmaktad r. Bu karars zl g n, teknigin verdigi orneklem boyutunun cok kucuk
olmas ndan kaynakland g dusunulmektedir.</p>
      </sec>
      <sec id="sec-3-7">
        <title>Tablo 3: Degisen asgari guven degerlerine gore 2 ve K-S testlerinden hesaplanan p</title>
        <p>degerleri sunulmustur. Butun teknikler evrene benzer c km st r.</p>
        <p>Teknik Ad
Zaki
Toivonen
Riondato
Riondato</p>
        <p>Teknik Tipi</p>
      </sec>
      <sec id="sec-3-8">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-9">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-10">
        <title>SR OK-mutlak</title>
        <p>BK-mutlak</p>
        <p>Apriori algoritmas kullan larak olusturulan orneklemlerden SRO K'ler ve
bunlara ait BK'ler bulunmustur. SRO K ve BK'lerin benzerliklerini olcmek icin
s ras yla destek ve guven degerleri uzerinden mutlak hata hesaplanm st r. Zaki
ve Toivonen teknikleri = 0:1 degeri icin evrende var olan butun SRO K'leri
ve BK'leri bulmada yetersiz kalm st r. Kural kayb n n istenmemesi nedeniyle,
bu iki teknigin orneklem olusturmaya elverisli olmad g gorulmustur ve zaman
tuketimi testlerinde incelenmemistir. Eksik olan degerlerin 0 kabul edilip hata
hesaplamas yla Tablo 4'teki sonuclar elde edilmistir. Beklendigi gibi mutlak
destek degeri hatas n n yuksek oldugu durumlarda, guven degeri hatas da yuksek
c km st r.</p>
        <p>Tablo 3 ve Tablo 4 kars last r larak incelendiginde 2 ve K-S testlerinden elde
edilen sonuclar ile destek ve guven hatalar aras nda bir iliski bulunamam st r.
Geleneksel istatistik olcumlerinin birliktelik c kartmak amac yla olusturulan
orneklemin temsil gucunu olcmede yetersiz kald g fark edilmistir.</p>
        <p>Tablo 4: Degisen asgari guven degerlerine gore uretilen ortalama destek ve guven mutlak
hatalar sunulmustur. BK kayb n n yasand g teknikler, cal sma suresi ac s ndan test
edilmemistir.</p>
        <p>Teknik Ad
Zaki
Toivonen
Riondato
Riondato</p>
        <p>Teknik Tipi</p>
      </sec>
      <sec id="sec-3-11">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-12">
        <title>SR OK-mutlak</title>
      </sec>
      <sec id="sec-3-13">
        <title>SR OK-mutlak</title>
        <p>BK-mutlak</p>
        <p>Tablo 5'te BK olusturmaya kadar gecen sureler evren ve olusturulan
orneklemler icin verilmistir. Evren icin, orneklem olusturmadan BK elde etmeye
kadar gecen sure; orneklemler icinse orneklem boyutunu bulma, basit rastlant sal
ornekleme yontemiyle orneklem olusturma ve BK elde etme icin gecen toplam
ortalama sure sunulmustur. Beklendigi gibi her degeri icin butun tekniklerin
zaman performanslar evrene gore daha iyi c km st r. Testlerde 10 tane urun
grubu yerine gercekteki 143 farkl urunun kullan lmas yla kazan mlar n daha
fazla olmas beklenmektedir.</p>
        <p>Tablo 5: Degisen asgari guven degerlerine gore kural c kartmaya kadar gecen zaman
saniye cinsinden verilmistir. Testler 3.2 GHz i5 islemciye, 8Gb RAM'e sahip bir makina
uzerinde gerceklestirilmistir.</p>
        <p>Teknik Ad
Evren
Riondato
Riondato</p>
        <p>Teknik Tipi
{</p>
      </sec>
      <sec id="sec-3-14">
        <title>SR OK-mutlak</title>
        <p>BK-mutlak</p>
        <sec id="sec-3-14-1">
          <title>Sonuclar ve Gelecekteki Cal smalar</title>
          <p>
            Evren uzerinden BK c kartma isleminin uzun surmesi nedeniyle, evreni
temsil eden daha kucuk boyutlu bir orneklemin bulunmas ve orneklem uzerinden
BK c kart lmas hede enmistir. Bu amac dogrultusunda, birliktelik bulmak icin
ozellesmis olan ideal orneklem boyutunu veren teknikler arast r lm st r. O
rneklemler, basit rastlant sal ornekleme yontemi kullan larak olusturulmus ve her
bir teknik icin 3 farkl orneklem elde edilmistir. Birden fazla ornek olusturularak
sonuclarda olusabilecek olan gurultunun onune gecilmeye cal s lm st r. Basit
rastlant sal ornekleme yonteminin kullan lmas na ve 3 orneklem olusturulmas na
karar verilirken [
            <xref ref-type="bibr" rid="ref7">7</xref>
            ]'deki cal sma temel al nm st r. Tekniklerin onerdikleri formuller
farkl asgari guven degerleriyle test edilmistir. Testlerde kullan lan degerler test
verisinin yap s na ve [
            <xref ref-type="bibr" rid="ref7">7</xref>
            ] cal smas temel al narak olusturulmustur. Bu asamada,
goze carpan ilk degerlendirme, test edilen degerlerde baz tekniklerin her
boyuttaki evrene uygulanabilir olmamas d r.
          </p>
          <p>O rneklemlerin evrene benzerligi 2 testi ve K-S testi ile olculmustur. Her iki
test sonucunda elde edilen degerlerin birliktelik c kartmak amac yla olusturulan
orneklemlerin temsil gucunu olcmede yetersiz kald g gorulmustur. Soz konusu
testlerle, guven ve destek hata degerleri aras nda herhangi bir iliski
bulunamam st r. Testlerin yanl sonuclar verme ihtimallerinin olmas ve onerilen
orneklem boyutlar n n olcum yapmada yetersiz kalmas n n bu sonuclar dogurmada
sebep oldugu dusunulmektedir.</p>
          <p>O rneklemlerin SRO K ve BK sonuclar evrenden uretilen sonuclarla kars
last r lm st r. Evrende, en cok rastlanan Mevduat(M) urunu %94, Kredi Kart (KK)
urunu %11 ve Taksitli Kredi(TK) urunuyse %8 oranlar nda bulunmaktad rlar.
Bu urunler evren uzerinde %2,3 oran nda beraber bulunmaktad r. Bu dusuk
destek degerine ragmen, guven degeri yuksek 3 farkl kural c kart lm st r. KK; T K !
M kural c kart lm s ve sonucta KK ile TK alanlar n %92'sinin M de sat n
ald g gorulmustur. C kan bir diger kural T K; M ! KK ile KK ve M alanlar n
%31'inin TK de sat n ald g ortaya c km st r. Bir diger kural olan KK; M ! T K
ile de TK ve M alanlar n %28'inin KK da sat n ald g bulunmustur.
Teknikler icerisinden Zaki ve Toivonen'de bu kurallar c kart lamam s ve bilgi kayb
yasanm st r. Bu nedenle, birliktelik c kartma amac yla orneklem olusturmak icin
bu tekniklerin kullan lmas uygun degildir. Beklendigi gibi orneklem boyutu
artt kca sonuclarda elde edilen mutlak hata azalm st r.</p>
          <p>Evren uzerinden BK uretme isleminde gecen sureyle; orneklem boyutu bulma,
orneklem olusturma ve orneklem uzerinden BK uretme islemlerinde gecen
toplam sure kars last r lm st r. Her bir teknigin, evren sonuclar na gore daha basar l
oldugu gorulmustur. Hesaplanan mutlak hata degerlerine gore Riondato SRO
Kmutlak ve Riondato BK-mutlak teknikleri iyi sonuclar vermistir. Daha kucuk
orneklem boyutu ve daha az zaman tuketimi kriterleri goz onunde
bulunduruldugunda Riondato SRO K-mutlak teknigi one c kmaktad r.</p>
          <p>Kullan lan bankac l k verisi, musteriler ve sahip olduklar urunlerin urun
gruplar bilgisini tas maktad r. Bir baska deyisle, musterilerin sahip olduklar
urunler yerine bankac l k urun gruplar kullan lm st r. Bu tercih, veri
kumesindeki seyrekligi azaltmak ve testlerin cal sma surelerini h zland rmak icin yap lm
st r. Bu sayede, evren uzerindeki testlerin dahi 2 saniyeden uzun surmedigi
gozlenmistir. Sure ac s ndan kazan mlar, her ne kadar saniyeler seviyesinde gozukse de
daha cok urun (veya urun grubu) iceren bir veri kumesiyle yap lacak testlerde
daha belirgin kazan mlar gozlenecektir. Gelecek cal smalarda veri kumesi bu
cercevede yenilenecek ve diger ornekleme yontemleri de uygulanacakt r. Ayr ca,
tek bir veri kumesine bagl olabilecek sonuclar baska bir veri kumesiyle
gerceklestirilecek testlerle genisletilerek capraz dogrulamadan gecirilecektir.
Kaynaklar</p>
        </sec>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Pulakkazhy</surname>
            , Sreekumar, and
            <given-names>R. V. S.</given-names>
          </string-name>
          <string-name>
            <surname>Balan</surname>
          </string-name>
          .
          <article-title>"Data mining in banking and its applications-a review</article-title>
          .
          <source>" Journal of Computer Science</source>
          <volume>9</volume>
          .10 (
          <year>2013</year>
          ):
          <fpage>1252</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>Agrawal</surname>
            , Rakesh, and
            <given-names>Ramakrishnan</given-names>
          </string-name>
          <string-name>
            <surname>Srikant</surname>
          </string-name>
          .
          <article-title>"Fast algorithms for mining association rules</article-title>
          .
          <source>" Proc. 20th int. conf. very large data bases, VLDB</source>
          . Vol.
          <volume>1215</volume>
          .
          <year>1994</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3.
          <string-name>
            <surname>Zaki</surname>
            ,
            <given-names>Mohammed</given-names>
          </string-name>
          <string-name>
            <surname>Javeed</surname>
          </string-name>
          , et al.
          <article-title>"Evaluation of sampling for data mining of association rules</article-title>
          .
          <source>" Research Issues in Data Engineering</source>
          ,
          <year>1997</year>
          . Proceedings. Seventh International Workshop on. IEEE,
          <year>1997</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4.
          <string-name>
            <surname>Chakaravarthy</surname>
          </string-name>
          , Venkatesan T.,
          <string-name>
            <surname>Vinayaka</surname>
            <given-names>Pandit</given-names>
          </string-name>
          , and
          <string-name>
            <given-names>Yogish</given-names>
            <surname>Sabharwal</surname>
          </string-name>
          .
          <article-title>"Analysis of sampling techniques for association rule mining</article-title>
          .
          <source>" Proceedings of the 12th international conference on database theory. ACM</source>
          ,
          <year>2009</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5.
          <string-name>
            <surname>Mannila</surname>
            , Heikki,
            <given-names>Hannu</given-names>
          </string-name>
          <string-name>
            <surname>Toivonen</surname>
          </string-name>
          ,
          <article-title>and</article-title>
          <string-name>
            <given-names>A. Inkeri</given-names>
            <surname>Verkamo</surname>
          </string-name>
          .
          <article-title>"E cient algorithms for discovering association rules</article-title>
          .
          <source>" KDD-94: AAAI workshop on Knowledge Discovery in Databases</source>
          .
          <year>1994</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <surname>Toivonen</surname>
          </string-name>
          , Hannu.
          <article-title>"Sampling large databases for association rules</article-title>
          .
          <source>" VLDB</source>
          . Vol.
          <volume>96</volume>
          .
          <year>1996</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <surname>Riondato</surname>
            , Matteo, and
            <given-names>Eli</given-names>
          </string-name>
          <string-name>
            <surname>Upfal</surname>
          </string-name>
          .
          <article-title>"E cient discovery of association rules and frequent itemsets through sampling with tight performance guarantees." Machine Learning and Knowledge Discovery in Databases</article-title>
          . Springer Berlin Heidelberg,
          <year>2012</year>
          .
          <fpage>25</fpage>
          -
          <lpage>41</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <surname>Zaki</surname>
            ,
            <given-names>Mohammed</given-names>
          </string-name>
          <string-name>
            <surname>Javeed</surname>
          </string-name>
          .
          <article-title>"Scalable algorithms for association mining." Knowledge and Data Engineering</article-title>
          ,
          <source>IEEE Transactions on 12.3</source>
          (
          <year>2000</year>
          ):
          <fpage>372</fpage>
          -
          <lpage>390</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <surname>Pei</surname>
          </string-name>
          ,
          <string-name>
            <surname>Jian</surname>
          </string-name>
          , et al.
          <article-title>"H-Mine: Fast and space-preserving frequent pattern mining in large databases</article-title>
          .
          <source>" IIE Transactions 39.6</source>
          (
          <year>2007</year>
          ):
          <fpage>593</fpage>
          -
          <lpage>605</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10.
          <string-name>
            <surname>Borgelt</surname>
            ,
            <given-names>Christian.</given-names>
          </string-name>
          <article-title>"Keeping things simple: Finding frequent item sets by recursive elimination." Proceedings of the 1st international workshop on open source data mining: frequent pattern mining implementations</article-title>
          .
          <source>ACM</source>
          ,
          <year>2005</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          11.
          <string-name>
            <surname>Vapnik</surname>
            , Vladimir,
            <given-names>Esther</given-names>
          </string-name>
          <string-name>
            <surname>Levin</surname>
          </string-name>
          , and Yann Le Cun.
          <article-title>"Measuring the VC-dimension of a learning machine."</article-title>
          <source>Neural Computation 6.5</source>
          (
          <year>1994</year>
          ):
          <fpage>851</fpage>
          -
          <lpage>876</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          12. Lo er, Maarten, and
          <string-name>
            <surname>Je</surname>
            <given-names>M.</given-names>
          </string-name>
          <string-name>
            <surname>Phillips</surname>
          </string-name>
          .
          <article-title>"Shape tting on point sets with probability distributions." Algorithms-ESA</article-title>
          <year>2009</year>
          . Springer Berlin Heidelberg,
          <year>2009</year>
          .
          <fpage>313</fpage>
          -
          <lpage>324</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          13.
          <string-name>
            <surname>Har-Peled</surname>
            , Sariel, and
            <given-names>Micha</given-names>
          </string-name>
          <string-name>
            <surname>Sharir</surname>
          </string-name>
          .
          <article-title>"Relative (p; ")-approximations in geometry</article-title>
          .
          <source>" Discrete and Computational Geometry 45.3</source>
          (
          <year>2011</year>
          ):
          <fpage>462</fpage>
          -
          <lpage>496</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          14.
          <string-name>
            <surname>Agrawal</surname>
            , Rakesh,
            <given-names>Tomasz</given-names>
          </string-name>
          <string-name>
            <surname>Imielinski</surname>
            , and
            <given-names>Arun</given-names>
          </string-name>
          <string-name>
            <surname>Swami</surname>
          </string-name>
          .
          <article-title>"Mining association rules between sets of items in large databases." ACM SIGMOD Record</article-title>
          . Vol.
          <volume>22</volume>
          . No.
          <article-title>2</article-title>
          . ACM,
          <year>1993</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          15.
          <string-name>
            <surname>Bircan</surname>
            , H.,
            <given-names>Y.</given-names>
            Karagoz, and Y.
          </string-name>
          <string-name>
            <surname>Kasapoglu</surname>
          </string-name>
          .
          <article-title>"Ki-Kare ve Kolmogorov Smirnov Uygunluk Testlerinin Simulasyon ile Elde Edilen Veriler Uzerinde Kars last r lmas ." Sivas: Cumhuriyet Universitesi I_ktisadi ve I_dari Bilimler Dergisi 4</article-title>
          .1 (
          <year>2003</year>
          ).
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>