Yazılım Hata Tahmininin Web Uygulamalarında Kullanılabilirligi

Yazılım Hata Tahmininin Web Uygulamalarında Kullanılabilirligi SerdarBiçer Yıldız Teknik Üniversitesi Bilgisayar Mühendisligi Bölümü

İstanbul Türkiye

BanuDiri Yıldız Teknik Üniversitesi Bilgisayar Mühendisligi Bölümü

İstanbul Türkiye

Yazılım Hata Tahmininin Web Uygulamalarında Kullanılabilirligi 9BDACBD6C986B552E971AC7B56D95539 GROBID - A machine learning software for extracting information from scholarly documents

Özet Yazılım testinde uygulanabilecek en basit yaklaşım verilen bir kod parçasındaki bütün olasılıkları test etmektir. Bu durum zaman ve bütçe kısıtları nedeniyle pratikte imkansızdır. Yazılım hata tahmini yöntemleri proje yöneticileri tarafından, test aşamasında, kısıtlı olan kaynakları efektif bir şekilde dagıtmak için kullanılmaktadır. Bu alandaki çalışmalar özellikle 2005 yılından itibaren artarak devam etmektedir. Bu çalışmada literatürde var olan metriklerin web uygulamaları için yeterli olup olmadıgı sorgulanmıştır. Web uygulamaları üzerinde yaptıgımız deneyler hata tahmininin web uygulamaları üzerinde optimum sonuçlar vermekten uzakta oldugunu göstermektedir. Bu tip uygulamaları geliştirmede kullanılan yaşam döngüsü, diger uygulamalar için kullanılanlarla aynı olsa da teknik bakımdan ayrıştıkları bazı noktalar bulunmaktadır. Bu nedenle yazılım hata tahmini alanında web uygulamalarına özel metrikler oluşturulmasını önermekteyiz.

Giriş

Bir yazılım projesinin başarısını belirleyen ana faktör kalitesidir [33]. Yazılım kalitesi için birden fazla tanım bulunmakla birlikte bunlar içinde öne çıkanı "yazılımın ne kadar iyi tasarlandıgı ve çıkan ürünün bu tasarıma ne kadar uydugu"dur [32]. Yazılımın kalitesi geliştirme sürecinin test aşamasıyla çok yakından ilişkilidir. Bu ilişki projenin zaman ve bütçe kısıtlarını da çok yakından etkiler. Örnegin 2002'deki IEEE Metrik Paneli'nde [5] araştırmacılar harcanan eforun yarısının aslında önlenebilecegini, bunların %80'inin de hataların küçük bir kısmından (yaklaşık %20) kaynaklandıgını öne sürmüşlerdir. Bu tip önlenebilir eforlar daha önceden keşfedilip daha az masrafla çözülebilecek veya tamamen önlenebilecek hatalardan kaynaklanmaktadır [7]. Dikkatli tasarlanmış test aktiviteleri başarılı ürünler dogururken kaotik, rastgele veya dogru yapılmayan test aktiviteleri kısıtları aşmış veya iptal edilmiş ürünlere yol açar. Yazılım testinde uygulanabilecek en basit yaklaşım verilen bir kod parçasındaki bütün olasılıkları test etmektir. Bu durum zaman ve bütçe kısıtları nedeniyle pratikte imkansızdır. Bu nedenle yazılım proje yöneticileri ürünlerindeki hataya yatkınlıgı ölçmek için çogunlukla ögrenme tabanlı tahmin yöntemleri kullanmaktadır.

Yazılım hata tahmini yöntemleri proje yöneticileri tarafından, test aşamasında, kısıtlı olan kaynakları efektif bir şekilde dagıtmak için kullanılmaktadır. Bu yöntemler yazılım testinde görev yapan kişilere test senaryolarının ne şekilde üretetilecegine ve organize edilecegine karar vermelerine yardımcı olmaktadır. Hatalı modüllerin dogru tahmin edilmesi yazılım testinin masrafını azaltır ve proje yöneticileri kısıtlı kaynaklarını işlere atama konusunda daha rahat hareket edebilirler [34]. İdealde bir hata tahmini modeli bütün hataları dogru tahmin ederken hatasız modülleri hatalı olarak işaretlememelidir. Ancak pratikte bu duruma çok az rastlanır [2]. En yeni tahmin modelleri bile bu noktaya erişmekten çok uzaktadır [15,23]. Yüksek tahmin oranına sahip modeller yüksek yanlış alarm oranına sahiptir. Yüksek yanlış alarm oranları hatasız kodların boş yere test edilmesine yol açar. Bu durum yüksek güvenlik gerektiren uygulamalar için bir soruna yol açmaz çünkü bu tip uygulamalarda karşılaşılacak bir hatanın bedeli çok yüksektir. Ama bu durum kaynak açısından kritik projeler için ciddi bir problemdir [13,14,20]. Kodun gereksiz yere gözden geçirilmesi test aşamasını uzattıgından bütçe ve zaman kısıtlarını aşma riskini arttırır. Bu nedenle mühendisler dogru ve yanlış tahmin oranlarını dengeleme yoluna gitmelidir [20].

Bu alanda çalışan araştırmacılar şimdiye kadar hata tahmini modellerini kurarken statik kod metrikleri, kod degişim metrikleri, geliştirici ve modül agları gibi farklı metrik kümelerinden yararlandılar. Bunlar arasında statik kod metrikleri 1970'lerden beri kullanılmaktadır [1,4,19]. Otomatik araçlar yardımıyla da projelerden metrikleri çıkarmak çok daha kolay hale gelmiştir. Geçen yıllarda araştırmacılar kullanılan metrik setlerinin tavan performansa ulaştıgını göstermiştir [23]. Bu tavan etkisini ortadan kaldırmanın 2 yolu vardır:

-Var olan metrik setlerine yeni veri madenciligi teknikleri uygulamak -Var olan veri madenciligi tekniklerini yeni metriklere uygulamak Araştırmalarda hata tahmini modellerinin performansını arttırmak için yeni veri madenciligi teknikleri bulmaya çalışmanın harcanan emege degmeyecegi gösterilmiştir [23]. Bundan dolayı egitim verisinin kalitesini arttırmak veya kullanılan metrik setlerinde yenilikçi davranmak tahmin modellerinin performansını arttırmak için daha efektif bir yöntem olacaktır.

2012 yılı verilerine göre Kuzey Amerika'nın %78'i, Avrupa'nın %63'ü Internet kullanmaktadır [40]. Dünya çapında yapılan Internet tabanlı işlemlerin yıllık tutarı trilyon dolarlarla ölçülmektedir [35]. E-ticaret dışında her gün milyonlarca kullanıcının arama motorları (örn: Google), sosyal paylaşım platformları (örn: Facebook, Twitter), bilgi paylaşımı (örn: Wikipedia) gibi farklı amaçlarla farklı web sitelerini kullandıkları bilinmektedir. Bu kadar büyük bir Internet kullanımı karşısında firmalar açısından erişilebilir olmak günümüzde büyük bir ihtiyaç halini almıştır. Son yıllarda kızışan tarayıcı savaşları ve buna paralel gelişen teknoloji ve performans artışı geliştiricilerin bu alanda ilerlemesine imkan saglamıştır. Bu alanda geliştirme yaparken kullanılan teknolojilerin de ilerlemesiyle web geliştiricileri artık daha özgürce daha iyi uygulamalar çıkarabilmektedir. Mobil cihaz kullanımındaki artışla birlikte web uygulamalarına artık çok daha farklı tipte ekranlardan erişilebilmek gibi gereksinimler eklenmeye başlanmıştır.

Ancak web uygulamalarındaki hatalar firmalara milyonlarca dolar kaybettirmeye devam etmektedir. Web uygulamalarının masaüstü uygulamalardan farklı olarak yüksek erişilebilirlige sahip olması gerekmektedir. Uygulamada yaşanacak en ufak sıkıntıların firmalara faturası büyük olmaktadır. Örnegin 2001 yılı şükran günü tatilinde Amazon'un yaşadıgı sıkıntılar 20 dakikada 500 bin dolar kaybetmesine neden olmuştur [3]. Hataların görünmeyen faturası ise daha büyüktür, her hata kullanıcı sadakatinin bozulmasına ve müşteri kaybına neden olmaktadır [30].

Web uygulamalarını geliştirmede kullanılan yaşam döngüsü, diger uygulamalar için kullanılanlarla aynı olsa da teknik bakımdan ayrıştıkları bazı noktalar bulunmaktadır.

-Öncelikle web uygulamalarının geliştirilmesinde birden fazla programlama dili, tasarım özelligi, dışarıdan kullanılmakta olan kütüphane ve bileşenler bulunur. Bunlara örnek olarak geleneksel programlama dilleri, script dilleri, düz HTML sayfaları, XML tabanlı şablon dosyaları, veritabanları, resimler ve CSS kodları verilebilir. -Geliştirilen uygulamalar tarayıcılara bagımlı halde çalışmaktadır. Aynı kod farklı tarayıcıda farklı şekilde çalışabilmektedir. Bunu önlemek için kodun tarayıcı bagımsız çalışacak şekilde yazılması ve uygulamanın farklı tarayıcılar için test edilmesi gerekmektedir. -Güvenlik zafiyeti daha fazladır. Öncelikle kullanıcı tarafında çalışan kodlara erişip incelemek çok kolaydır. Ayrıca Internet aracılıgıyla daha geniş bir kullanıcı kitlesine hitap ettiginden daha fazla tehdite maruz kalmaktadır. -Dış dünya degişimlerinden daha çok etkilenmektedir. Internet baglantısının kaybolması veya yavaşlaması durumları geliştirme sırasında hesap edilmezse istenmeyen durumlarla karşılaşma şansı yüksektir. -Uygulama bileşenleri gerçek ortamda ve hatta geliştirme sırasında farklı makinelere dagıtılmış halde bulunabilir ve bu halde birbirleriyle uyumlu ve bir bütün çalışmak durumundadırlar.

Bütün bunlar uygulamanın karmaşıklıgını arttırıcı faktörlerdir [29]. Bu çalışmada web uygulamaları için hata tahmini yapılarak performans degerlendirmesi yapılmaktadır. Araştırma sorumuz "Kullanılmakta olan yazılım hata tahmini yöntemleri web uygulamaları için ne kadar iyi sonuçlar vermektedir?" şeklindedir.

Araştırma sorumuzu yanıtlayabilmek için açık kaynak 6 web uygulamasının hataya yatkınlıklarını dosya bazında inceledik. Bu işlem için yaygın olarak kullanılmakta olan metrikler ve sınıflandırma algoritmalarını kullandık. Aldıgımız sonuçlar mevcut hata tahmini yöntemlerinin web uygulamaları için halen düşük performansla çalıştıgını göstermektedir.

İlgili C ¸alışmalar

Yazılım hata tahmini alanındaki çalışmalar özellikle 2005 yılından itibaren artarak devam etmektedir [8]. Bu çalışmalarda farklı tipte metrikler kullanılmakla birlikte statik kod metrikleri yaygın olarak kullanılan metrik tiplerinin başında gelmektedir [1,12,15,16,18,19,21,27,33]. Literatürdeki ilk hata tahmini çalışması satır sayısı kullanılarak yapılmıştır [1]. Daha sonra Halstead metrikleri [12] ve McCabe metrikleri [16] kullanılmaya başlanmıştır. Bu metrikler uygulamanın karmaşıklıgı ve boyutu hakkında fikirler vermektedir. Günümüzde en yaygın kullanılan metrik tipleri bunlardır. Ancak bu çalışmalarda genel olarak masaüstü uygulamalarından çıkarılan metrikler kullanılmış olup herhangi bir web uygulaması için çıkarılmış bir metrik seti bulunmamaktadır.

Yazılım hata tahmininde kullanılan metrik setlerinden bir digeri kod degişim (code churn) metrikleridir [9,10,26,28]. Bu metrik setleri Subversion ve GIT gibi versiyon kontrol sistemlerinden çıkarılmaktadır. Geliştiricilerin kod üzerinde yaptıgı degişiklikler kullanılarak, eklenen/silinen satır sayısı, yapılan degişiklik sayısı, degişiklik yapan geliştirici sayısı gibi özellikler çıkarılmaktadır. Kod degişim metrigi ilk olarak Munson tarafından [26] ortaya atılmıştır. Yapılan çalışmalarda statik kod metriklerinden daha iyi sonuç verdigi gözlenmiştir.

Bunlar dışında digerlerine göre nispeten daha yeni bir metrik tipi olarak sosyal ag metrikleri de yazılım hata tahmininde kullanılmaktadır [6,17,31,39,41]. Bu çalışmalarda kullanılan metrikler koddan bagımsız olup, sosyal aglar geliştirici veya dosyalardan oluşturulmaktadır. Bu alanda çalışanlar birbirine bagımlılıgı olan dosyalar veya aynı dosya üzerinde çalışmış olan geliştiricileri birbirleriyle baglayarak sosyal aglar kurmuş bu aglardan sosyal ag analizi yöntemleri ile metrikler çıkarmışlardır.

Yöntem

Bu bölümde çalışmada kullanılan veri kümeleri ve araştırma yöntemleri açıklanmaktadır.

Veri Kümeleri

Araştırma sürecinde ilk olarak literatürde var olan metriklerin web uygulamaları için yeterli olup olmadıgı sorgulanmıştır. Bu metrikler web uygulamalarına özel ortaya atılmış olmasa bile programlama dillerinin genel yapısından dolayı uygunluk göstermeleri olasıdır. PHP tabanlı 6 uygulama incelenerek, statik kod metrikleri ve kod degişim metrikleri kullanılarak uygulamalardaki hatalar tahmin edilmeye çalışılmıştır. Uygulamalar hakkında bazı istatistikler Tablo 1'den görülebilir. Yapılan denemelerde her proje için 2 farklı tipte metrik seti için farklı algoritmalar kullanılmıştır. Sonuçların degerlendirilmesi için 10 katlı çapraz geçerleme kullanılmıştır.

Hata Tahmin Modeli

Bu çalışmada makine ögrenmesi yöntemlerine dayanan bir hata tahmin yöntemi uygulanmıştır. Kullanılan yöntemin görsel temsili S ¸ekil 1'de görülebilir. Versiyon kontrol sistemleri kodlara ve kod geçmişlerine ulaşmak, buralardan metrikler çıkarmak için kullanılmıştır. Uygulamalarda yer alan dosyaların hataya Performans Ölçümü C ¸alışmada tahmin modellerinin performansı hata tahmini çalışmalarında yaygın olarak kullanılan dogru pozitif oranı (DPO) ve yanlış pozitif oranı (YPO) ölçümleri kullanılmaktadır [6,13,15,19,36]. Bu ölçümler tahmin algoritmalarının veri setleri kullanılarak egitilmesi ve oluşan tahmin modellerinin test edilmesiyle elde edilmektedir. DPO modelin gerçekten hataya yatkın olan modülleri bulmadaki başarısını gösterirken YPO aslında hatasız olan modülleri hatalı işaretledigini belirtir. Hata tahmininde DPO oranını yükseltip YPO oranını düşüren yöntemler daha degerli bulunmaktadır. Bu nedenle mümkün oldugunca (DPO, YPO) çiftini (1,0) ideal noktasına yaklaştıran tahmin yöntemlerine ulaşmaya ihtiyaç vardır. Maalesef bu ideal durum pratikte çok nadir görülmektedir. Ölçümlerin ideal duruma yakınlıgını ölçmek için denge adı verilen performans ölçütü kullanılmaktadır. Belirtilen ölçütler (1), ( 2) ve (3) kullanılarak Tablo 3'deki karışıklık matrisi yardımıyla hesaplanmaktadır. S ¸ekil 2: ROC egrisinde bölgeler Dogru tahmin bir modelin başarısını belirlemek için önemli bir etkendir ancak yanlış tahmin de oldukça önemlidir. Bu durum S ¸ekil 2'de gösterilmiştir. Risk odaklı bölgedeki tahmin modelleri yüksek DPO'ya sahip olmakla beraber YPO'ları da oldukça yüksektir. Bu durum hata içermeyen çok sayıda dosyanın hatalı olarak işaretlenmesi anlamına gelip, gereginden fazla dosyanın incelenmesi sonucunu dogurur. Bu da test aşamasının masrafının artmasına neden olmaktadır. Hatasızlıgın çok önemli oldugu projeler için bu kabul edilebilir bir durum olmakla beraber projelerin çogu bu kategoride yer almamaktadır. Masraf odaklı bölge orta-düşük DPO'ya ve çok düşük YPO'ya sahiptir. Bu bölgeye düşen tahmin modelleri sınırlı kaynaklara sahip projeler için daha kullanışlıdır [13].

Veri dagılımının normal dagılıma uyacagını dogrudan farz edemeyecegimiz için uygulanacak farklı yöntemlerle bulunan sonuçların birbirinden farklı olup olmadıgının kontrolü Mann-Whitney U testi kullanarak yapıldı.

DP O = DP DP + Y N

(1) Metrik setleri açısından baktıgımızda kod degişim metriklerinin statik kod metriklerine göre daha iyi sonuçlar verdigi görülebilir. Ortalama denge sonuçları arasındaki farklar istatistiksel açıdan anlamlı bulunmuştur. Bu sonuçlar önceki çalışmaları [9,15,24,25] dogrulamaktadır. Ancak en başarılı olan skorların büyük çogunlugunda, tahmin oranı çogu projede yüksek çıkmasına ragmen hatalı tahmin oranı da oldukça yüksektir. Bu durumun kaynak açısından kısıtlı projeler için pratikte sagladıgı bir yarar bulunmamaktadır. C ¸ünkü bu durum hata içermeyen çok sayıda modülün de hatalı olarak işaretlenmesine neden olacagı için test aşamasında yüksek efor harcanmasına sebep olup, hata tahmininin kullanılma amacıyla örtüşmemektedir. Ortalama degerlere bakıldıgı zaman DPO, YPO ve denge degerlerinin bu alanda benzer performans kriterleri kullanılarak yapılmış diger çalışmalarda bulunan ölçümlerden [9,19,22,24,25,37] daha düşük oldugu görülebilir. Bu sonuçlar web uygulamalarına özel bir hata tahmini çalışması yapılmasının gerekli oldugu yönündeki düşüncemizi kuvvetlendirmiştir.

Y P O = Y P Y P + DN (2) Denge = 1 − Y P O 2 + (1 − DP O) 2 √ 2(3)

Tartışma

Bu araştırmada yazılım hata tahmininde uygulanmakta olan tekniklerin web uygulamalarında ne kadar uygulanabilir oldugu araştırılmıştır. Web paradigması yükselişini 2000'li yılların başında yapmış olsa da günümüzde halen gayet revaçta olan bir alandır. Bu tip uygulamalarda yapılan hatalar firmalara çok daha pahalıya mal olmaktadır. Dogaları geregi barındırdıkları teknik detaylar nedeniyle web uygulamalarınının ayrı bir yere konması gerekmektedir. Yazılım hata tahmini alanında bugüne kadar yapılmış çok sayıda çalışma var olsa

Uygulama Adı Sürüm Geliştirici Sayısı Satır Sayısı Dosya Sayısı Commit Sayısı Hatalı Dosya OranıBu metrik tipleri sadece programlama dilleri için kullanılabildiginden, veri setine sadece PHP ve JavaScript dosyaları dahil edilmiştir. Kod degişim metriklerini çıkarmak için basit bir script yazılmıştır. Bu metrik tipi için PHP ve JavaScript dosyalarının yanında HTML, CSS ve XML dosyaları da veri setine dahil edilebilmiştir. Sadece temel alınan sürümden 1 sene öncesine kadar üzerinde degişiklik yapılmış dosyalar veri setine dahil edilmiştir.Metrik Tipleri C ¸alışmada kullanılmak üzere statik kod metrikleri ve kod degişim metrikleri seçilmiştir. Bu metrikler araştırmalarda en yaygın kullanılan metrik tipleri oldukları ve genelde iyi sonuç verdikleri gözlendigi için seçilmiştir. Kullanılan metrikler Tablo 2'de listelenmiştir.alınarak 1 sene içinde hata olarak işaretlenmiş kod degişimleri çıkarılmıştır Tablo 1: İncelenen Uygulamalar ve degiştirilmiş dosyalar hatalı olarak işaretlenmiştir. Bir kod degişimini hataLaravel olarak işaretleyebilmek için kod teslim mesajında (bug, error, fix, fail) gibi 3.0 54 51448 308 2559 %34Symfony anahtar kelimeler aranmıştır. 2.2 753285875404813144%49phpMyAdmin Guzzle Statik kod metriklerini çıkarmak için Understand [38] adlı uygulama kul-3.5 330 1140741 1142 70113 %24 3.0 29 48052 413 632 %15 Wordpress 3.0 53 382600 1246 25712 %44 Joomla 3.1 239 581606 5573 15726 %30 lanılmıştır. Tablo 2: Kullanılan MetriklerStatik Kod MetrikleriKod Degişim MetrikleriSatır sayısıKod teslimi sayısıKod satır sayısıKod teslim eden kişi sayısıBoş satır sayısıEklenen satır sayısıYorum satır sayısıSilinen satır sayısıYorum/kod oranıSon sürümde kod teslimi sayısıİfade sayısıSon sürümde kod teslim eden kişi sayısıDöngüsel karmaşıklıkSon sürümde eklenen satır sayısıTasarımsal karmaşıklıkSon sürümde silinen satır sayısıTemel karmaşıklıkPopüler kod teslim eden kişi yüzdesiYol sayısıKod blok seviyesi

meyilli olup olmadıkları farklı tipte metrikler ve sınıflandırma algoritmaları kullanılarak tahmin edilmeye çalışılmıştır. Sınıflandırma için Naive Bayes, Bayes Net ve Random Forest algoritmaları kullanılmıştır. Bu algoritmalar yazılım hata tahmini alanında yaygın olarak kullanıldıkları ve genelde iyi sonuç verdikleri gözlendigi için tercih edilmiştir[8,15,19,23]. Girdi olarak statik kod metrikleri ve kod degişim metrikleri kullanılmıştır. Örnekleme sapmasını engellemek için 10 katlı çapraz geçerleme kullanılmıştır. Deneylerin gerçeklenmesi için Weka uygulaması[11] kullanılmıştır. Veri setlerine egitim ve test işlemlerinin uygulanması ile hata tahmini sonuçları elde edilmiştir. Bu sonuçlar performans ölçümü aşamasına girdi olarak kullanılmıştır.S ¸ekil 1: Ögrenme tabanlı hata tahmini sistemi mimarisiVeri C ¸ıkarma Veri çıkarma işlemi her proje için benzer şekilde ilerlemiştir. Öncelikle proje kodları Tablo 1'de belirtilen sürümler için Github sayfalarından indirilmiştir. Hatalı modüllerin işaretlenmesi için indirilen sürümler temel

Naive Bayes Bayes Net Random Forest DPO YPO Denge DPO YPO Denge DPO YPO Denge Laravelbile bu çalışmalar araştırmanın ana fikrinden farklı nitelikler ortaya koymaktadır. Var olan yöntemlerin farklı uygulamalar için kullanılmasından çıkarılan sonuç, yazılım hata tahmini yöntemlerinden bu alanda yeterince faydalanamadıgı kanısı dogurmuş ve bu alana özel bir çalışma yapılması gerektigi yönündeki fikrimizi güçlendirmiştir. İlgili çalışmalarda ortaya çıkarılmış olan veri setinin zenginleştirilmesi fikrine paralel olarak ilerisi için web uygulamalarında hata tahmini yapılması için özel bir metrik seti çıkarılması, bu sayede hata tahmininde kullanılan veri setlerinin iyileştirilip bu tip uygulamalarda daha iyi sonuçlar alınması tavsiye edilmektedir. Özellikle kozmetik hataların öne çıktıgı bu tip uygulamalarda HTML/CSS için metrik seti çıkarılması düşünülebilir.Tablo 4: Statik Kod MetrikleriNaive BayesBayes NetRandom ForestDPO YPO Denge DPO YPO Denge DPO YPO DengeLaravel0.39 0.21 0.54 0.78 0.44 0.65 0.88 0.48 0.65Symfony0.90 0.65 0.53 0.72 0.32 0.70 0.88 0.65 0.53phpMyAdmin 0.40 0.16 0.56 0.42 0.20 0.57 0.42 0.14 0.58 Guzzle 0.90 0.53 0.62 0.78 0.31 0.73 0.94 0.70 0.50 KaynaklarWordpress0.89 0.72 0.48 0.76 0.60 0.54 0.73 0.42 0.65Joomla0.12 0.03 0.38 0.75 0.19 0.78 0.89 0.30 0.77Ortalama0.6 0.38 0.52 0.70 0.34 0.66 0.79 0.45 0.61Tablo 5: Kod Degişim Metrikleri0.91 0.55 0.61 0.71 0.13 0.78 0.83 0.36 0.72Symfony0.93 0.73 0.48 0.87 0.57 0.59 0.87 0.66 0.52phpMyAdmin 0.25 0.06 0.47 0.51 0.16 0.64 0.47 0.15 0.61Guzzle0.91 0.61 0.56 0.88 0.58 0.58 0.93 0.77 0.45Wordpress0.96 0.41 0.71 0.80 0.03 0.86 0.84 0.12 0.86Joomla0.93 0.45 0.68 0.86 0.32 0.75 0.86 0.29 0.77Ortalama0.82 0.47 0.59 0.77 0.30 0.70 0.80 0.39 0.66

An example of software system debugging FAkiyama IFIP Congress (1) 1971 Introduction to Machine Learning EAlpaydın 2010 The MIT Press 2nd edn. California power outages suspended-for now 2014-04-12 Software errors and complexity: An empirical investigation VRBasili BTPerricone 10.1145/69605.2085 Commun. ACM 27 1 1984 Lessons learned from 25 years of process improvement: the rise and fall of the nasa software engineering laboratory VBasili FMcgarry RPajerski MZelkowitz Proceedings of the 24rd International Conference on the 24rd International Conference on 2002. 2002 Software Engineering Defect prediction using social network analysis on issue repositories SBiçer ABBener B¸aglayan 10.1145/1987875.1987888 Proceedings of the 2011 International Conference on Software and Systems Process the 2011 International Conference on Software and Systems Process

New York, NY, USA

ACM 2011 ICSSP '11 Software defect reduction top 10 list BBoehm VRBasili 10.1109/2.962984 Computer 34 1 2001 Review: A systematic review of software fault prediction studies CDiri B 10.1016/j.eswa.2008.10.027 Expert Syst. Appl 36 4 May 2009 Merits of using repository metrics in defect prediction for open source projects BC ¸aglayan ABener SKoch Emerging Trends in Free/Libre/Open Source Software Research and Development 2009. May 2009 FLOSS '09. ICSE Workshop on Predicting fault incidence using software change history TLGraves AFKarr JSMarron HSiy 10.1109/32.859533 IEEE Trans. Softw. Eng 26 7 Jul 2000 The weka data mining software: An update MHall EFrank GHolmes BPfahringer PReutemann IHWitten 10.1145/1656274.1656278 SIGKDD Explor. Newsl 11 1 Nov 2009 MHHalstead Elements of Software Science (Operating and Programming Systems Series

New York, NY, USA

Elsevier Science Inc 1977 Fault prediction using early lifecycle data YJiang BCukic TMenzies ISSRE '07. The 18th IEEE International Symposium on 2007. 2007 Software Reliability Cost curve evaluation of fault prediction models YJiang BCukic TMenzies ISSRE 2008. 19th International Symposium on 2008. 2008 Software Reliability Engineering Benchmarking classification models for software defect prediction: A proposed framework and novel findings SLessmann BBaesens CMues SPietsch 10.1109/TSE.2008.35 IEEE Trans. Softw. Eng 34 4 2008 A complexity measure. Software Engineering TMccabe IEEE Transactions on SE 2 4 Dec 1976 Predicting failures with developer networks and social network analysis AMeneely LWilliams WSnipes JOsborne 10.1145/1453101.1453106 Proceedings of the 16th ACM SIGSOFT International Symposium on Foundations of Software Engineering the 16th ACM SIGSOFT International Symposium on Foundations of Software Engineering

New York, NY, USA

ACM 2008 SIGSOFT '08/FSE-16 Metrics that matter TMenzies JDi Stefano MChapman KMcgill Proceedings. 27th Annual NASA Goddard/IEEE 27th Annual NASA Goddard/IEEE 2002. Dec 2002 Software Engineering Workshop Data mining static code attributes to learn defect predictors TMenzies JGreenwald AFrank Software Engineering 33 1 2007 IEEE Transactions on When can we test less? In TMenzies JStefano KAmmar KMcgill PCallis JDavis RChapman Proceedings. Ninth International Ninth International 2003. 2003 Software Metrics Symposium Assessing predictors of software defects TMenzies JDistefano S AO(mike Chapman R Proceedings, workshop on Predictive Software Models workshop on Predictive Software Models 2004 Defect prediction from static code features: current results, limitations, new approaches TMenzies ZMilton BTurhan BCukic YJiang ABener Automated Software Engineering 17 4 2010 Implications of ceiling effects in defect predictors TMenzies BTurhan ABener GGay BCukic YJiang 10.1145/1370788.1370801 Proceedings of the 4th International Workshop on Predictor Models in Software Engineering the 4th International Workshop on Predictor Models in Software Engineering

New York, NY, USA

ACM 2008 PROMISE '08 Different strokes for different folks: A case study on software metrics for different defect categories ATMısırlı B¸aglayan AVMiranskyy ABener NRuffolo 10.1145/1985374.1985386 Proceedings of the 2Nd International Workshop on Emerging Trends in Software Metrics the 2Nd International Workshop on Emerging Trends in Software Metrics

New York, NY, USA

ACM 2011 WETSoM '11 A comparative analysis of the efficiency of change metrics and static code attributes for defect prediction RMoser WPedrycz GSucci 10.1145/1368088.1368114 Proceedings of the 30th International Conference on Software Engineering the 30th International Conference on Software Engineering

New York, NY, USA

ACM 2008 ICSE '08 Code churn: A measure for estimating the impact of code change JCMunson SGElbaum Proceedings of the International Conference on Software Maintenance the International Conference on Software Maintenance

Washington, DC, USA

IEEE Computer Society 1998 24 ICSM '98 Static analysis tools as early indicators of pre-release defect density NNagappan TBall 10.1145/1062455.1062558 Proceedings of the 27th International Conference on Software Engineering the 27th International Conference on Software Engineering

New York, NY, USA

ACM 2005 ICSE '05 Use of relative code churn measures to predict system defect density NNagappan TBall 10.1145/1062455.1062514 Proceedings of the 27th International Conference on Software Engineering the 27th International Conference on Software Engineering

New York, NY, USA

ACM 2005 ICSE '05 Quality attributes of web software applications JOffutt 10.1109/52.991329 IEEE Softw 19 2 2002 Causes of failure in web applications SPertet PNarasimhan CMU- PDL-05-109 2005 Parallel Data Laboratory, Carnegie Mellon University Tech. Rep. Can developer-module networks predict failures? MPinzger NNagappan BMurphy 10.1145/1453101.1453105 Proceedings of the 16th ACM SIGSOFT International Symposium on Foundations of Software Engineering the 16th ACM SIGSOFT International Symposium on Foundations of Software Engineering

New York, NY, USA

ACM 2008 SIGSOFT '08/FSE-16 Software Engineering: A Practitioner's Approach RSPressman 2005 McGraw-Hill Higher Education 6th edn What we have learned about fighting defects FShull VBasili BBoehm AWBrown PCosta MLindvall DPort IRus RTesoriero MZelkowitz Proceedings of the 8th International Symposium on Software Metrics the 8th International Symposium on Software Metrics

Washington, DC, USA

IEEE Computer Society 2002 249 METRICS '02 Software defect association mining and defect correction effort prediction QSong MShepperd MCartwright CMair 10.1109/TSE.2006.1599417 IEEE Trans. Softw. Eng 32 2 2006 Strategies for Automatically Exposing Faults in Web Applications SESprenkle 2007 Newark, DE, USA University of Delaware Ph.D. thesis Practical considerations in deploying ai for defect prediction: A case study within the turkish telecommunication industry ATosun BTurhan ABener 10.1145/1540438.1540453 Proceedings of the 5th International Conference on Predictor Models in Software Engineering the 5th International Conference on Predictor Models in Software Engineering

New York, NY, USA

ACM 2009 11 9 PROMISE '09 On the relative value of crosscompany and within-company data for defect prediction BTurhan TMenzies ABBener JDi Stefano 10.1007/s10664-008-9103-7 Empirical Softw. Engg 14 5 Oct 2009 Understand -source code analysis & metrics 2014-05-03 Predicting build failures using social network analysis on developer communication TWolf ASchroter DDamian TNguyen 10.1109/ICSE.2009.5070503 Proceedings of the 31st International Conference on Software Engineering the 31st International Conference on Software Engineering

Washington, DC, USA

IEEE Computer Society 2009 ICSE '09 World internet users statistics usage and population stats 2014-04-12 Predicting defects using network analysis on dependency graphs TZimmermann NNagappan 10.1145/1368088.1368161 Proceedings of the 30th International Conference on Software Engineering the 30th International Conference on Software Engineering

New York, NY, USA

ACM 2008 ICSE '08