<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <contrib-group>
        <aff id="aff0">
          <label>0</label>
          ,
          <addr-line>Oya Kalıpsız</addr-line>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>, ve M. Özgür Cingiz</institution>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Ahmet Unudulmaz</institution>
        </aff>
        <aff id="aff3">
          <label>3</label>
          <institution>Anahtar Kelimeler. Yazılım Risk Faktörleri</institution>
          ,
          <addr-line>Riks Modelleri, Risk Tahmini, Risk Değerlendirme Modelleri</addr-line>
        </aff>
      </contrib-group>
      <abstract>
        <p>RİSK FAKTÖRLERİ ve RİSK DEĞERLENDİRME MODELLERİNİN FARKLI VERİ SETLERİ ÜZERİNDE GERÇEKLENMESİ Özet. Başarısız giden birçok proje, hatalı yönetilen süreçler, ürünlerin ve projelerin zamanında teslim edilememesi, maliyetlerde oluşan aşırı artışlar yazılım mühendisliğinde risk yönetiminin önemini günden güne arttırmaktadır. Özellikle risklerin düzgün bir şekilde ele alınamaması, projeler arası risk türlerinin ve gruplarının farklılaşması, şirket/kurum içi yapılan risk yönetimi ve risk analizi çalışmalarının ölçülememesi de bu durumu karmaşıklaştırmaktadır. Bu çalışmada risk faktörleri, sınıflandırıcı yöntemleri ve model performans yapıları incelenmekte, ayrıca 2 farklı şirketin veri setlerinin karşılaştırılmasına da yer verilmektedir.Gerçekleştirilen uygulamada, farklı firmaların veri setleri üzerinde faktör kararı verilerek gereksiz risk faktörlerinin projelerden çıkarılması sağlanmış, 32 risk faktörü kendi içinde sıralanarak hangi alt alanın en çok risk taşıdığı ortaya konulmuştur. Veri setleri içindeki risk faktörlerinin etki değerleri, risk faktörlerinin birbirleriyle kıyaslanmaları ve risk faktörü eleme yöntemlerinden bahsedilmiş olup, bu faktörler yardımıyla veriler çok kritik, kritik, koşullu hata, orta seviyeli ve ihmal edilebilir olarak sınıflandırılmıştır. Sınıflandırma işleminde Destek Vektör Makineleri, Karar Ağaçları ve Naive Bayes sınıflandırıcılarından faydalanılmıştır. Kullanılan yöntemlerin başarı oranları ve başarı yüzdeleri de değerlendirilmiştir.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>Yazılım risk yönetimi alanında yapılan bu çalışmada temel olarak risk faktörleri ve
risk değerlendirme modellerinin birbirleriyle karşılaştırılmasından bahsedilecektir.
İncelenen çalışmalar göz önünde bulundurulduğunda bu iki alanda şirketlerde yaşanan
problemler ve zaman kayıpları dikkate alınmıştır. Risk faktörlerinin analiz
edilmemesi veya hatalı analiz edilerek gerkesiz bir faktör için önlem alınması zaman kaybına ve
maddi kayıplara yol açmaktadır. Bu nedenle faktörlerin doğru seçilmesi, kritik
faktörlerin belirlenmesi ve etki değeri düşük faktörlerin elenmesi gerekmektedir. Bildiri
çalışması kapsamında risk faktörlerinin detaylı analizi amaçlanmıştır. Diğer bir amaç
ise yazılım mühendisliği yaklaşımlarını kullanarak indirgenmiş risk faktörleri ve veri
setlerini doğru sınıflandırabilecek modeller oluşturmaktır. Kullanılan yöntemlerin
başarı oranları ve başarı yüzdeleri de çalışma süresince incelenecektir.</p>
      <p>Yapılacak çalışmada Turkcell Teknolojide gerçekleştirilen projelerdeki problem
etki veri setleri ile yazılım sektöründe faaliyet gösteren bir firmanın hata veri setleri
kullanılacaktır. Naive Bayes, destek vektör makineleri ve karar ağaçlarıyla
oluşturulan model benzer yazılım projelerinde ortaya çıkacak aynı tip problemlerin projeye
etkisine ait kestirim yapılmasını sağlamaktadır.
2</p>
      <p>İlgili Çalışmalar
Yazılım mühendisliğinde risk yönetimi ile ilgili çalışmalara bakıldığında ise son
yıllarda artış gözlemlenmektedir. Bu alanda yapılan çalışmalar geçmiş yıllara göre
çeşitlilik göstermekte ve önem kazanmaktadır.Genel risk yönetimi, risk faktörleri, risk
önlemek için modellerin kullanılması ile ilgili çalışmaların yayınlandığı, bu konular
üzerinde daha detaylı durulduğu gözlemlenmiştir. Bu kısımda yazılım
mühendisliğindeki risk yönetimi konusunda yapılan çalışmalar iki alt başlık altında toplanmıştır. İlk
başlıkta risk yönetimi ve analizi ile ilgili dergi ve makale çalışmaları incelenmiş ve
derlenmiştir. İkinci başlıkta ise risk faktörlerine yer verilmiş, faktörlerin birbirleriyle
kıyaslanması, eleminize edilmesi ve sıralanması ile ilgili yapılan çalışmalardan
bahsedilmiştir. Ayrıca yazılım mühendisliği yaklaşımları kullanılarak oluştrulan modeller
ortaya konulmuş ve modellerinde birbirleriyle kıyaslanmasına yer verilmiştir.
2.1</p>
    </sec>
    <sec id="sec-2">
      <title>Risk Yönetimi ve Analizi ile İlgili Yapılan Çalışmalar</title>
      <p>Risk yönetimi ve analizi ile ilgili yapılan genel çalışmalar bu başlık altında
toplanmıştır. Tahminler, belirsizlikler ve riskler ele alınmış ve bu belirsizliklerin/risklerin
sebepleri incelenmiştir. Ayrıca risk yönetim metodolojilerinden ve risk adımlarından
bahsedilmiş ve risklerin bağımlılıklarıda bu kısımda değinilmiştir. Risk analizi
alanında yapılan çalışmalardanda bahsedilerek risk yönetimi ve analizi ile ilgili
yapılan çalışmalar tamamlanmıştır.</p>
      <p>
        Kitchenham ve Linkman bu çalışmasında tahminler, belirsizlik ve risk konularını
ele almışlardır. Tahmin etme modellerinini ise bu faktörleri göz önünde bulundurarak
oluşturulması gerektiğine vurgu yapılmış ve belirli olmayan risk faktörleri için
varsayımlarda bulunması gerektiğini belirtmiştir. Hatalı varsayımların etki değerleri göz
önünde bulundurularakta değerlendirme modellerinin çıkarılabileceğinden
bahsedilmiştir [
        <xref ref-type="bibr" rid="ref1">1</xref>
        ].
      </p>
      <p>
        Kwan ve Leung çalışmasında ise risk yönetim metodolojisini ve proje risk
bağımlılıklarını ele almıştır. Konservatif metod, optimistik metod ve ağırlık metodları
kullanılarak risk bağımlılığı grafı oluşturulmuştur. Risk grafları oluşturulduktan sonra
ise risk yönetim paradigmaları risk bağımlılığı yönünden ele alınmıştır. Buna göre 3
farklı durum için kritklik seviyeleri belirlenmiştir. Bunlardan ilki iç ciddiyet
seviyesidir. Risk yönetim paradigmalarında direkt olarak kullanılmaktadır. İkinci ise diğer
riskin oluşma durumuna için kullanılan ciddiyet seviysidir. Üçüncü olarak ise tepki
ciddiyet seviyesi kullanılmaktadır. Bu seviyelere göre farklı aksiyon planları
alınmaktadır [
        <xref ref-type="bibr" rid="ref2">2</xref>
        ].
      </p>
      <p>
        Ray ve Mohapatra ise risk analizi ile ilgili bir çalışma yayınlamışlardır. Yazılım
geliştirme yaşam döngüsü içinde analiz ve dizayn adımları için durum bazlı risk
önleme metodolojisi üzerine çalışmalar yapmışlardır. Risk tahmin metodu geliştirerek
komponentler arası karmaşıklığı indirgeyip her bir bileşeni graf yöntemleriyle
incelemişlerdir. Bunun yanında kritiklik analizide yaparak sistem seviylerindeki
başarısızlık senaryolarınında analizini yapmışlardır. Buna göre hata seviyelendirmeyi
felaket,major, marjinal ve minör olarak 4 seviyede toplamışlardır [
        <xref ref-type="bibr" rid="ref3">3</xref>
        ].
2.2
      </p>
    </sec>
    <sec id="sec-3">
      <title>Risk Faktörleri ve Risk Modellerinin Kullanılması ile İlgili Çalışmalar</title>
      <p>Risk faktörlerinin değerlendirilmesi, sınıflandırılması ve eleminize edilmesi ile ilgili
çalışmalarla risk modellerinin oluşturulması ve oluşturulan bu modellerin birbiriyle
kıyaslanması ile ilgili çalışmalar bu başlık altında toplanmıştır. İncelenen
çalışmalarda yapay sinir ağları, destek vektör makineleri, NaiveBayes, kNN yöntemi, bulanık
mantık, çok katmanlı yapay sinir ağları kullanılmıştır. Bu sınıflandırma yöntemleri
sayesinde risk verileri ve risk faktörleri sınıflandırılabilimiş, bilgisayar mühendisliği
yaklaşımları kullanıldıktan sonra ise risk modelleri oluşturulmuştur. Yapılan
çalışmalar aşağıda listelenmiştir.</p>
      <p>
        Sun Yat Sen Üniversitesi’nden yayınlanan makalede yapay sinir ağları ve destek
vektör makineleri yöntemleri kullanılarak yazılım projelerinin risk yönetiminin
modellenmesi sağlanmıştır. 300 farklı firmaya gönderilen 194 anket sorusuyla birlikte
kategoriler daha da netleştirilmiştir. Anket sonuçlarında 6 kategori bulunmuştur.
Belirlenen 64 farklı risk yukarıda yer alan 6 ana risk grubu içerisinde tanımlanmıştır.
Riskler standart yapay sinir ağlarıyla, genetik algoritma ile iyileştirilmiş yapay sinir
ağlarıyla ve SVM yaklaşımlarıyla tahminleri yapılmıştır. NN elde edilen sonuçlar
projelerin gerçek sonuçlarıyla kıyaslandığında %70 oranındabir doğruluk oranı elde
edilmektedir. SVM kullanarak elde edilen başarı oranı ise %80’nin üzerinde yer
almaktadır [
        <xref ref-type="bibr" rid="ref4 ref5">4,5</xref>
        ].
      </p>
      <p>
        Windsor üniversitesinde yapılan çalışmada ise NaiveBayes sınıflandırıcısı ile K-en
yakın komşuluk sınıflandırıcısının performansları incelenmiştir. Veri setlerine
uygulanan bu iki yöntemin performansları belirtilmiştir. 671 veri 9 sınıfa ayrılmak
istenmiş. NaiveBayes sınıflandırıcısı %12,43 hatayla verileri doğru
sınıflandırabilmiştir. K en yakın komşuluk metodunda ise k değerine göre yüzdeler
değişkenlik göstermiştir. K değerinin 5 seçildiği durumlarda hata oranı en düşük
çıkmıştır. %9,45 hata oranıyla sınıflandırma yapabilen K en yakın komşuluk yöntemi
NaiveBayes yöntemine göre daha başarılı olmuştur [
        <xref ref-type="bibr" rid="ref6">6</xref>
        ].
      </p>
      <p>
        Bulanık mantık alanında da risk değerlendirme alanında çalışmalar yapılmıştır.
Hunan üniversitesinde yapılan bir çalışmada risklerde oluşan kayıplar üzerine
yoğunlaşılmıştır. Risk faktörlerini belirlemişler ve risklerin önem sırasına göre risk analiz
ağı oluşturmuşlar(Semantik indirgemeler kullanılarak). Sonuç olarak yaptıkları
çalışmada yazılım projelerindeki risk faktörlerin kritiklik seviyesini analiz
etmişlerdir.Bulanık mantık alandaki bir diğer çalışmada ise yazılım projelerindeki
tasarım risk analizi incelenmiştir. Yazılım projelerindeki risklerin tanımı ve kritiklik
seviyelerinin farklılık göstermesinden dolayı böyle bir çalışma yayınlamışlardır. Proje
riskleri ve ayrı bileşenler arasında bulanık mantık yöntemi kullanılmıştır. Bunun
sonucunda da düşük, orta ve yüksek seviyeli riskleri tespit edebilmişlerdir [
        <xref ref-type="bibr" rid="ref7 ref8">7,8</xref>
        ].
3
      </p>
      <sec id="sec-3-1">
        <title>Metodoloji</title>
        <p>Yapılan çalışmada risk faktörleri belirlenmiş, risk verileri toplanmış ve model
oluşturulmuştur. Yazılım sektöründe çalışan bir firmadan elde edilen, hataları
seviyelendirmek için kullanılan alanlara göre faktörler belirlenecektir. Risk kestirimi
sektörden sektöre farklılaşabileceği gibi, aynı işi yapan firmalar arasında bile riskler
farklı olarak belirlenebilmektedir. Her yeni projeye göre önceki projeler için
tanımlanan riskler farklılaşabilmektedir. Bu farklılık projelerde oluşan problemlerde
dahi görülmektedir. Bu da risk yönetiminde standart oluşturmayı zorlaştırmaktadır.
Bu nedenle bir projeye başlamadan önce ele alınması gereken ilk kısım risk
faktörlerinin analizi olmalıdır.</p>
        <p>Turkcell ICT’den elde edilen etki analizi için kullanılan veriler ile yazılım
sektöründe faaliyet gösteren bir firmanın veri setlerine göre uygulama
gerçekleştirilecektir. Yapılacak projede Turkcell ICT için temel olarak 6 risk faktörü
ve problemin proje içindeki etkisini gösteren etki değeri belirlenmiştir. 384 problem
etki değer veri seti üzerinde bilgisayar mühendisliği yöntemleri kullanılacaktır.</p>
        <p>Yazılım sektöründe faaliyet gösteren firmanın verileri ise 8 projeden ve 32 risk
faktöründen oluşmaktadır. Projeler yazılım alanında gerçeklenmiş olup veri setleri bu
yazılımlarda görülen hatalardan oluşmaktadır. Temel olarak 32 risk faktörü etki
değeri belirlenmiştir. Faktörlerden 19 tanesi tekil ve diğer projelerde ortak olmadığı
için elenmiştir. Kalan 13 faktör ve alt alanları detaylı şekilde aşağıdaki tabloda
belirtilmiştir. 6382 hata veri setleri üzerinde bilgisayar mühendisliği yöntemleri
kullanılacaktır.</p>
        <p>Her iki veri seti içinde etki değerlerine göre sınıflandırma algoritmaları
kullanılarak başarı oranları karşılaştırılacaktır. İlk olarak Turkcell ICT risk faktörleri
ve değerleri tablosu verilecek. Daha sonar ise yazılım firması risk faktötleri ve
değerleri tablosu veirlecektir.</p>
        <p>Tablo 1. Turckell ICT Risk Faktörleri ve Değerleri
Faktörler
FİNANSAL ETKİ
ETKİ İÇ MÜŞTERİ
ETKİ ABONE SAYISI
REGULASYON ETKİSİ
SOX ETKİSİ
MARKA ETKİSİ
ETKİ</p>
        <p>Değerler
Gelir_Raporlamasina_etkisi_var,Yok,
BABT_1/2000_under_charge_1/50000_over_charge
Yok, 1-100, 101-1000, 1000_den_Fazla
1-1000, 1001-10000, 10000_den_Fazla, Yok
Var, Yok
Var, Yok
Var, Yok</p>
        <p>HIGH, LOW, MEDIUM</p>
        <p>Tablo 2. Yazılım Şirketi Risk Faktörleri ve Değerleri
Kişi-grup-şirket bazında</p>
        <p>Değişken
Faktörler
Alt alanın öneri olup
olmama durumu
Proje içindeki durum
Görülme seviyesi
Kişi-grup-şirket bazında
çözümleyen
Kişi-grup-şirket bazında
değiştiren
Sınıf bilgisi
Öncelik olma durumu
İşletim sistemi
Şirket bazlı mı?
Hangi grupta
gösterileceği
Yazılımsal-tasarımsal
olma durumu
Kişi-grup-şirket bazında
atanmış
Etki</p>
        <p>Alt Alan
2 alt alan
10 alt alan
6 alt alan
Değişken
Değişken
30 alt alan
4 alt alan
2 alt alan
3 alt alan
10 alt alan
2 alt alan
Değişken
6 alt alan</p>
        <p>Değerler
“Öneridir”,”Öneri değildir”
“Yeni”,“Çözülen”, ”Paydaşlara gönderilen”,
“Tekrarlanamayan”, ”Otomasyon” vs.
“Her zaman”, ”Bazen”,”Nadiren”, ”Sıksık”,
”Hiçbir zaman”, ”Otomotize edildiğinde”
Kişi-grup-şirket sayısına göre değişkenlik
gösteriyor
Kişi-grup-şirket sayısına göre değişkenlik
gösteriyor
Kişi-grup-şirket sayısına göre değişkenlik
gösteriyor
“Fonksiyonel”,”Arayüz”,”Bağlantı”,
”Kullanılabilirlik”, ”Otomasyon”, ”Faturalama”, ”Güvenlik”
vs.
“Öncelikli”, ”Önceliklideğil”,
”Koşulluöncelikli”,”Koşullu öncelikli değil”
“Windows”,”Linux”
“Şirket bazlı”,”Paydaşlar”,”Outsource”
Tür bilgisi ile paralellik gösteriyor
“Yazılımsal”,”Donanımsal”
Kişi-grup-şirket sayısına göre değişken
Çok kritik, kritik, orta , koşullu, düşük, ihmal
edilebilir</p>
        <p>Bilgi kazanımı bir özelliğin sınıf bilgisine ait belirsizliğinin, özellik bilgisi
kullanılarak azaltılması olarak da tanımlanabilir. Belirsizlik ölçütü olarak rastsal
değişkenlerde kullanılan entropi, bilgi kazanımı hesabında da kullanılmaktadır.
Kısaca, bilgi kazanımı özelliğin bir veya birden fazla sınıf için var olup olmamasına
göre entropideki azalımı ölçmektedir.</p>
        <p>Tablo 3. Bilgi Kazanımı Özellik Seçimine Göre Turkcell ICT Etki Değerleri Sıralaması
Risk Faktörleri
Regulasyon Etkisi
Finansal Etki
Etki Abone Sayısı
Sox Etkisi
Etki İç Müşteri
Marka Etkisi</p>
        <p>Etki Değerleri
Yüksek
Yüksek
Orta
Orta
Düşük
Düşük
Tablo 4. Bilgi Kazanımı Özellik Seçimine Göre Yazılım Firması Etki Değerleri Sıralaması
Risk Faktörleri
Kişi grup şirket bazında atanan
Kişi grup şirket bazında çözümleyen
Proje içindeki durum bilgisi
Kişi-grup-şirket bazında değiştiren
Kişi-grup-şirket bazında yaratan
Sınıf bilgisi
Grüldüğü işletim sistemi
Öncelik seviyesi
Grup bilgisi
Görülme sıklığı
Öneri olma duru
Yazılımsal-tasarımsal olma durumu
Şirket bazlı olma durumu</p>
        <p>Etki Değerleri
Yüksek
Yüksek
Yüksek
Yüksek
Orta
Orta
Orta
Düşük
Düşük
Düşük
Düşük
Düşük</p>
        <p>Düşük</p>
        <p>Bilgi kazanımı yüksek olan özellikler sınıflandırma için değerli özellikler olarak
alınır ve belirli bir eşik değerinin altında kalan özellikler elenerek özellik seçimi
gerçeklenmiş olur. Weka arayüzünde bilgi kazanımı kullanılarak bu faktör için
yapılan çalışma sonrasında yukarıdaki tablolar elde edilmiştir.
3.1</p>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Destek Vektör Makineleri</title>
      <p>Risk analizi için en çok kullanılan sınıflandırma yöntemlerinden biri destek vektör
makinesidir. Destek vektör makineleri metin sınıflandırma, yüz tanıma, el yazısı
tanıma ve buna benzer makine öğrenmesi algoritmalarının kullanıldığı alanlarda
başarılı sonuçlar vermesinden dolayı çalışmada tercih edilen sınıflandırma
yöntemlerden biridir. Destek Vektör Makineleri karar düzlemlerinin ideal şekilde
belirlenmesi prensibine dayanır. İdeal karar sınırı ayırdığı sınıflara ait verilere mümkün
olduğu kadar karar düzleminden uzak olmalıdır.</p>
      <p>Weka arayüzünde sınıflandırıcı olarak destek vektör makinelerinin kullanımı
sonucunda Turkcell ICT için 384 problemin etki analiz verisinin 371 adedini doğru olarak
belirleyebilmiştir. Modelin doğruluk oranı ise %96,61’dir.</p>
      <p>Yazılım sektöründeki firmanın veri setlerine bakıldığında 8135 hata veri setinin
6382 adedini doğru olarak sınıflandırmıştır. Modelin doğruluk oranı %78,45’dir. Test
sonuçlarının doğrulama yöntemi 10 kere çapraz doğrulama olarak
uygulanmıştı.Karışıklık matrisine bakılıdığında ise kritik, koşullu hata, hata değil, orta
derece hatalar genel olarak doğru olarak sınıflandırılmasına rağmen çok kritik ve
ihmal edilebilir hatalardaki sınıflandırma başarı yüzdelerinde düşüşler
gözlemlenmiştir.
3.2</p>
    </sec>
    <sec id="sec-5">
      <title>Karar Ağaçları</title>
      <p>Karar ağaçları örnek verileri bir ağaç yapısına benzemektedir. Ağacın kökünden
ağacın alt dallarına kadar sıralayarak verilerin sınıflandırılmasını sağlar. Ağaçtaki
düğümler özellik, dallar özellik değer bilgisini ve yaprak düğümler ise sınıf etiketini
belirtmektedir. Karar ağaçlarının yaygın kullanımının nedeni ağaç yapılarının
kurallarla ve sade bir şekilde tanımlanabilmesidir. Bu şekilde öğrenilen kurallar kolay
bir şekilde aktarılmış olur. Karar ağaçları kullandığı algoritma farklılıklarına göre en
çok kullanılanlar ID3,ASSISTANT ve J48’dir.</p>
      <p>Karar ağacı sınıflandırıcısıyla veriler aç gözlü yaklaşım (greedy) olan belirli
kriterleri en iyi özelliğe dayalı bölünürler. Düğümler bölünme şekline göre çoklu veya ikili
bölünmektedir. En iyi düğümler bölümlemesi için homojen sınıf dağılımına sahip
düğümler tercih edilir. Homojenliği belirlemek için düğümün saf olmama
değeri(impurity) hesaplanır. Saf olmama değerini ölçmek için gini indeksi, entropi
gibi değerler kullanılır. Tüm veriler karar ağacında doğru şekilde sınıflandırılana
kadar karar ağacı dallandırılır.</p>
      <p>Weka arayüzünde sınıflandırma fonksiyonlarından Turkcell ICT veri setinde karar
ağacı yaklaşımı olarak J48 karar ağacı sınıflandırıcı kullanılmıştır. 384 problem etki
analiz verisinin 350 adedini doğru olarak belirleyebilmiştir. 34 tanesini ise farklı
etiketlemiştir. Modelin doğruluk oranı ise %91,14’dür. Yazılım firma veri setlerinde
ise Weka arayüzünde sınıflandırma fonksiyonlarından Karar ağacı yaklaşımı olarak
J48 karar ağacı sınıflandırıcı kullanılmıştır. 8135 hatanın 6231 adedini doğru olarak
belirleyebilmiştir. 1904 tanesini ise farklı etiketlemiştir. Modelin doğruluk oranı ise
%76,59’dur.Test sonuçlarının doğrulama yöntemi 10 kere çapraz doğrulama olarak
uygulanmıştır.Karışıklık matrisine bakıldığında ise kritik, koşullu hata, hata değil,
orta derece hatalar genel olarak doğru olarak sınıflandırılmasına rağmen çok kritik ve
ihmal edilebilir hatalardaki sınıflandırma başarı yüzdelerinde düşüşler
gözlemlenmiştir.
3.3</p>
    </sec>
    <sec id="sec-6">
      <title>Naïve Bayes Yönetimi</title>
      <p>Klasik Naive Bayes uzun yıllardır farklı sınıflandırma problemlerinde yaygın olarak
kullanılan makine öğrenmesi yaklaşımıdır. Klasik Naive Bayes bağımsızlık
varsayımına dayanmaktadır. Klasik Naive Bayes’e göre özellikler sınıftan bağımsızdır.
Klasik Naive Bayes tüm verilere ait özelliklerden verinin sınıf bilgisi olarak
varsayımda bulunduğu sınıfa ait olma olasılık değerini her sınıfı etiketi için hesaplar ve
en yüksek olasılık değerini veren sınıfa ait varsayımı, doğru olarak kabul ederek
sınıflandırma işlemini gerçekler.</p>
      <p>Naive Bayes Yöntemi kullanılarak Weka arayüzünde sınıflandırma
fonksiyonlarından yararlanılarak Turkcell ICT veri setinde Naive Bayes risk modeli
oluşturulmuştur. 384 problem etki analiz verisinin 352 adedini doğru olarak
modelleyebilmiştir. 32 tanesini ise farklı etiketlemiştir. Modelin doğruluk oranı ise %91,66 dır.</p>
      <p>Yazılım firmasının veri setlerinde ise NaiveBayes yöntemi kullanıp Weka
arayüzünde sınıflandırma fonksiyonlarından yararlanılarak risk modeli
oluşturulmuştur. 8135 problem etki analiz verisinin 5914 adedini doğru olarak
modelleyebilmiştir. 2221 tanesini ise farklı etiketlemiştir. Modelin doğruluk oranı ise
%72,69dur.Test sonuçlarının doğrulama yöntemi 10 kere çapraz doğrulama olarak
uygulanmıştır. . Karışıklık matrisine bakıldığında ise kritik, koşullu hata, hata değil,
orta derece hatalar genel olarak doğru olarak sınıflandırılmasına rağmen çok kritik ve
ihmal edilebilir hatalardaki sınıflandırma başarı yüzdelerinde düşüşler
gözlemlenmiştir.
4</p>
      <sec id="sec-6-1">
        <title>Sonuçlar ve Öneriler</title>
        <p>Yapılan çalışmada risk faktörleri belirlenerek Turkcell ICT için veri setinde yer alan
problemlerin projelerdeki etki değerlerine ve önemine bakılmıştır. Yazılım sektöründe
faaliyet gösteren firmanın veri setine bakıldığında ise veri setinde yer alan hata
değerlerin incelenmiştir. Veri setlerindeki bu değerlere göre risk modelleri
oluşturulmuş ve oluşturulan bu modeller yardımıyla gelecek problemlerin etki değerlerini
kestirilmiştir. Veri setleri üzerinde Naive-Bayes, destek vektör makineleri ve karar
ağaçları yöntemleri kullanılarak oluşturulan modeller incelenmiştir.</p>
        <p>Turkcell Teknolojiden elde edilen veri kümesinde 6 risk faktörü ve problemin
etkisinden oluşan 7 özellikten oluşan 384 veri çalışmada kullanılmıştır. Yazılım
firmasındaki veri setlerinde ise 13 risk faktörü ve hata bilgilerinden oluşan 14 özellikten
oluşan 8135 veri çalışmada kullanılmıştır.</p>
        <p>Destek Vektör Makineleri(DVM), Karar Ağacı(j48) ve Naive-Bayes(NB)
yaklaşımlarıyla projede yer alan veriler eğitilerek 10 kere çapraz doğrulama yöntemiyle
test edilmiştir.</p>
        <p>Yazılım sektöründeki firma verilerinin sonuçlarına bakıldığında bulunan
sonuçlarda da görüldüğü üzere DVM ile sınıflandırılan verilerde doğru sınıflandırma oranı
karar ağaçlarından ve NaiveBayes sınıflandırıcılarından daha iyi sonuçlar verdiği
gözlemlenmiştir. DVM %78,45 oranında başarı gösterirken, KA %76,59, NB ise
%72,69 oranında başarılı sınıflandırma yapmıştır.</p>
        <p>Turkcell ICT verilerinin sonuçlarına bakıldığında bulunan sonuçlarda da görüldüğü
üzere DVM ile sınıflandırılan verilerde doğru sınıflandırma oranı karar ağaçlarından
ve NaiveBayes sınıflandırıcılarından daha iyi sonuçlar verdiği gözlemlenmiştir. DVM
%91,66 oranında başarı gösterirken, KA %91,14, NB ise %91,66 oranında başarılı
sınıflandırma yapmıştır.</p>
        <p>
          DVM her iki veri setinde en iyi sınıflandırma yöntemi olarak ortaya çıkmıştır. İlgili
çalışmalar kısmında incelenen makaleler ve projelerde elde edilen sonuçlara paralellik
göstermektedir [
          <xref ref-type="bibr" rid="ref10 ref9">9,10</xref>
          ]. Turkcell ICT’deki başarı yüzdeleri daha yüksek olmasına
rağmen daha az veri ve faktör kullanılmıştır. Yazılım sektöründeki firmanın veri
sayılar, faktör sayıları ve etki değerleri ise daha fazla olarak yer almaktadır.
        </p>
      </sec>
      <sec id="sec-6-2">
        <title>Kaynaklar</title>
      </sec>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          1.
          <string-name>
            <surname>Kitchenham</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          ve
          <string-name>
            <surname>Linkman</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <article-title>"Estimates,Uncertainty,andRisk"</article-title>
          ,
          <string-name>
            <surname>Software</surname>
            <given-names>IEEE</given-names>
          </string-name>
          ,
          <volume>14</volume>
          (
          <issue>3</issue>
          ):
          <fpage>69</fpage>
          -
          <lpage>74</lpage>
          (
          <year>1997</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          2.
          <string-name>
            <surname>Kwan</surname>
            ,T.W. ve Leung,
            <given-names>H.K.N.</given-names>
          </string-name>
          ,
          <article-title>"A Risk Management Methodologyfor Project Risk Dependencies"</article-title>
          ,
          <source>IEEE TRANSACTIONS ON SOFTWARE ENGINEERING</source>
          ,
          <volume>14</volume>
          (
          <issue>5</issue>
          ) (
          <year>2011</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          3.
          <string-name>
            <surname>Ray</surname>
          </string-name>
          ,M. ve
          <string-name>
            <surname>Mohapatra</surname>
            ,
            <given-names>D.P.</given-names>
          </string-name>
          ,
          <article-title>"Risk analysis: a guidingforce in theimprovement of testing"</article-title>
          ,
          <string-name>
            <surname>Software</surname>
            <given-names>IET</given-names>
          </string-name>
          ,
          <volume>7</volume>
          (
          <issue>1</issue>
          ):
          <fpage>29</fpage>
          -
          <lpage>46</lpage>
          (
          <year>2013</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          4.
          <string-name>
            <surname>Hu</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Huang</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Chen</surname>
            ,J. ve Liu,
            <given-names>M.</given-names>
          </string-name>
          ,
          <article-title>"Software Project Risk Management ModelingwithNeural Network andSupportVector Machine Approaches"</article-title>
          ,
          <source>Natural Computation</source>
          ,
          <year>2007</year>
          .ICNC,
          <string-name>
            <surname>Haikou</surname>
          </string-name>
          (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          5.
          <string-name>
            <surname>Hu</surname>
            ,
            <given-names>Y.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zhang</surname>
            ,
            <given-names>X.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Sun</surname>
            ,
            <given-names>X.</given-names>
          </string-name>
          ve Liu,
          <string-name>
            <surname>M.</surname>
          </string-name>
          ,
          <article-title>"An Intelligent Model for Software Project Risk Prediction"</article-title>
          ,Information Management, Innovation Management andIndustrialEngineering, 2009 International Conference,
          <source>Xi'an (</source>
          <year>2009</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          6.
          <string-name>
            <surname>Islam</surname>
            <given-names>M.J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Wu</surname>
            ,
            <given-names>Q.M.J. ve M.</given-names>
          </string-name>
          <string-name>
            <surname>Ahmadi</surname>
          </string-name>
          ,
          <string-name>
            <surname>"InvestigatingthePerformance of Naive- BayesClassifiersand K- NearestNeighborClassifiers"</surname>
          </string-name>
          ,
          <source>Convergence Information Technology</source>
          ,
          <year>2007</year>
          . International Conference,Gyeongju (
          <year>2007</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          7.
          <string-name>
            <surname>Tang</surname>
            ,
            <given-names>A. ve Wang</given-names>
          </string-name>
          ,
          <string-name>
            <surname>R.</surname>
          </string-name>
          ,
          <article-title>"Software project risk assessment model based on fuzzytheory",ComputerandCommunication Technologies in AgricultureEngineering (CCTAE</article-title>
          ), 2010 International Conference,Chengdu (
          <year>2010</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          8.
          <string-name>
            <surname>Bragina</surname>
            ,T. ve Tabunshcyk,
            <given-names>G.</given-names>
          </string-name>
          ,
          <article-title>"Fuzzy model forthe software projectsdesign risk analysis"</article-title>
          ,
          <source>CAD Systems in Microelectronics (CADSM)</source>
          , 11th International Conference TheExperience of DesigningandApplication,Polyana-Svalyava (
          <year>2011</year>
          )
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          9.
          <string-name>
            <surname>Cingiz</surname>
            ,
            <given-names>M. Ö.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Unudulmaz</surname>
          </string-name>
          , A. ve
          <string-name>
            <surname>Kalıpsız</surname>
            ,
            <given-names>O.</given-names>
          </string-name>
          , “
          <article-title>Farklı Kestirim Yaklaşımları Kullanılarak Yazılım Projelerindeki Problem Etkilerinin Risk Yönetiminin Gerçeklemesi”</article-title>
          ,
          <source>Ulusal Yazılım Mühendisliği Sempozyumu (UYMS)</source>
          , Ankara,
          <year>2012</year>
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          10.
          <string-name>
            <surname>Cingiz</surname>
            ,
            <given-names>M. Ö.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Unudulmaz</surname>
          </string-name>
          , A. ve
          <string-name>
            <surname>Kalipsiz</surname>
            ,
            <given-names>O.</given-names>
          </string-name>
          ,
          <source>“Prediction of Project Problem Effects on Software Risk Factors”, The 12th IEEE International Conference on Intelligent Software Methodologies tools and Techniques</source>
          , Hungary,
          <year>2013</year>
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>