Hastalıkların Tedavi Sürecinin Protokollere Uygunluğunun Analizi: Süreç Madenciliğine Yönelik Araç Geliştirme Kübra Akeren1, Ayça Tarhan2 1,2 Bilgisayar Mühendisliği, Hacettepe Üniversitesi Beytepe Kampüs, 06800, Ankara, TÜRKİYE 1 kubraakeren@cs.hacettepe.edu.tr, 2atarhan@hacettepe.edu.tr Özetçe. Veri bilimleri; (büyük) veriyi akıllıca kullanarak ürün/hizmet sunmaya yönelik süreçlerinde doğru kararlar almaya ve bu şekilde istikrar sağlamaya çalışan kurumlar sebebiyle geleceğin uzmanlık alanlarından biri haline gelmiştir. Süreç Madenciliği model tabanlı süreç analizi ile veriye yönelik analiz teknikleri arasındaki kayıp bağlantıdır ve farklı alanlarda; uygulanan sürecin keşfi, beklenen modele uygunluk kontrolü veya süreç iyileştirme amaçlarıyla kullanılmaktadır. Bu çalışmada, büyük veri içeren kayıtlar üzerinde üç temel nitelik (durum/vaka numarası-aktivite-zaman) kullanılarak analiz yapmak ve herhangi bir teşhis-tedavi sürecinin uzmana açıkça gösterilmesi sonucunda zaman, maliyet ve yaşamsal kazançlar sağlanabileceğini göstermek amacıyla, Java dilinde masaüstü uygulama olarak geliştirilmesi hedeflenen bir aracın prototipi tanıtılmıştır. Süreç Madenciliği kullanarak performans analizi için dört temel adım önerilmektedir: 1) Olması beklenen süreç modelinin (tedavi protokolü) .csv dosyası türünde alınarak araç üzerinde tanımlanması, 2) Pratikte uygulanan sürecin ilgili büyük veriden madenlenmesi, 3) Süreç uygulamalarının süreç modeline göre uygunluğunun analizi ve süreç örüntülerinin tespiti, 4) Seçilen / tanımlanan bir özellik için süreç performansının ve olası iyileştirmelerin "what-if" senaryoları yardımıyla analiz edilmesi. Prototipin işleyişi ilk üç adım için, daha önce benzer kullanımlar için hazırlanmış sağlık verisi ile örneklenmiş ve çıkarımlar raporlanmıştır. Anahtar Kelimeler: süreç madenciliği, sağlık verisi, süreç analizi, büyük veri, uygunluk tespiti, sağlıkta süreç madenciliği. Conformance Analysis of Disease Treatment Process To Protocols: Process Mining Oriented Tool Development Abstract. Data science has become one of the professions of the future because organizations that are able to use (big) data in a smart way to give the right decision about their processes of creating product/services will survive by this means. Process mining is the missing link between model-based process analysis and data-oriented analysis techniques and it is used in many different fields for the discovery of process, conformance between process model and event logs, or enhancement of process. This study, intended to introduce; time, cost and vital gains are achievable by providing clearly presented process in the diagnosis and treatment of any disease to the experts; as a result of processing healthcare data with a prototype tool which is targeted as a desktop application and written in Java language, in order to make the analysis on the records that contain large data by using three basic properties (case id – activity – timestamp). At this point, four basic steps are recommended for performance analysis by using the mining process: 1) Identifying the expected process model (treatment protocol) by importing a .csv file format on the vehicle, 2) Mining the present process by using relevant big data, 3) Conformance analyzing between present models and expected models and detection of process patterns, 4) Analysing process performance and possible improvements for selected/identified property by the help of "what-if" scenarios. For the first three steps, the operation of the prototype is sampled with the healthcare data which prepared previously for similar purposes and the results are reported. Keywords: process mining, healthcare data, process analysis, big data, conformance detection, process mining in healthcare data. 207 1 Giriş Ağırlıkla insan odaklı ve bilgi yoğunluklu olan sağlık süreçleri her gün yüksek riskli hizmetleri önemli sayıda hastaya sunmaktadır[1]. Bu nedenle, klinik kılavuzlar ve iş süreci iyileştirme, sağlık alanında önemli araştırma konularıdır. Süreç Madenciliği son on yılda iş süreci yönetimi için popüler bir teknik haline gelmiştir[2]. Bu keşif olay günlüklerine dayalı iş süreçlerinin keşfi, doğrulanması ve geliştirilmesi dâhil olmak üzere çeşitli alanlarda uygulanmıştır[3]. Sağlık alanında sağlık süreçleri veya onlarla ilişkili bilgi sistemlerinin değerlendirilmesini hedefleyen Süreç Madenciliği uygulamaları vardır. Ancak, bunlardan sadece birkaç tanesi uygulamalardan performans iyileştirme için nicel sonuçlar çıkardığını raporlamıştır[4]. Süreç Madenciliği model tabanlı süreç analizi ile veriye yönelik analiz teknikleri arasındaki kayıp bağlantıdır.[3] (Büyük) Veriyi akıllıca kullanamayan şirketler istikrar sağlamakta zorlanacağından, veri bilimleri; geleceğin uzmanlık alanlarından biri haline gelmiştir. Veri bilimciler veri depolama ve analizine ek olarak, veri ile süreç analizini ilişkilendirmeye ihtiyaç duyar. Süreç Madenciliği olay verisi (örneğin; gözlenen davranışlar) ve süreç modelini (elle oluşturulmuş ya da otomatik keşfedilmiş) karşı karşıya getirmeyi amaçlar. Bu teknoloji yalnızca son dönemlerde erişilebilir olsa da herhangi bir tipteki işlemsel sürece (organizasyonlar ve sistemler) uygulanabilir. [3] Tekniğin örnek uygulamaları arasında; hastane tedavi süreçleri analizi, uluslararası müşteri servis süreçlerinin iyileştirilmesi, rezervasyon sistemlerindeki müşteri göz atma davranışlarının anlaşılması, bagaj taşıma sistemi hatalarının analizi, vb yer alır. Sağlık alanı seçilmesindeki temel neden, bu alanda ilerleme kaydedilmesinin etkilerinin, diğer pek çok alandan daha önemli olduğunun düşünülmesidir. Süreç Madenciliğinin ilk türü keşiftir. Keşif tekniği bir olay kaydı (log) alır ve hiçbir önsel bilgi kullanmadan bir süreç modeli üretir. Süreç Madenciliğinin ikinci türü uygunluk kontrolüdür. Bu aşamada var olan süreç modeli, aynı sürecin olay kaydı ile karşılaştırılır. Uygunluk kontrolü kaydedilmiş olay kaydı verilerinin doğruluğunu ve modelin doğrulanmasını, karşılıklı olarak sağlamakta kullanılabilir. Süreç Madenciliğinin üçüncü türü ise iyileştirmedir. Bu aşamada temel amaç var olan süreç modelinin, bazı olay kayıtlarından asıl süreç hakkındaki bilgiye göre genişletilmesi ya da geliştirilmesidir. Süreç modelinin performans bilgisi ile genişletilmesine örnek olarak darboğazların gösterilmesi söylenebilir. [3] [5] Bu çalışmada tanıtılan prototip araçta, Süreç Madenciliğinin ilk iki türü (keşif ve uygunluk kontrolü) üzerine yoğunlaşılmıştır. Süreç Madenciliğinin üçüncü türü olan iyileştirmenin ise Şekil 1’de gösterildiği gibi olay kaydından madenlenen süreç modelinin (tedavi protokolü), uzmana doğru şekilde sunulması sayesinde sağlanabileceği düşünülmektedir.[6] 208 Şekil 1. Sağlık Alanında Süreç Madenciliği[6] Bu bildirinin ikinci bölümünde konuyla ilişkili çalışmalar ve araçlar anlatılmıştır. Üçüncü bölümde Süreç Madenciliğinin sağlık verisi üzerinde koşturulabilmesini sağlayan araç prototipi tanıtılmıştır. Dördüncü bölümde benzer amaçlar için hazırlanmış radyoloji verisi üzerinde, geliştirilen prototiple bir örnekleme gerçekleştirilmiş ve gözlemlenen sonuçlar anlatılmıştır. Beşinci bölümde ise yapılan çalışmanın sonuçları, kısıtları ve gelecek çalışmalar paylaşılmıştır. 2 İlişkili Çalışmalar ve Araçlar Bu çalışmayla ilişkili alanlarda yayınlanan çalışmalar literatür taraması şeklinde çalışmanın başlangıcında incelenmiş ve gerekli noktalarda referans olarak alınmıştır [4]. Türkçe olarak sağlık alanında Süreç Madenciliği ile ilgili yapılmış bir çalışmaya rastlanmamıştır. Yapılan çalışmaların genelinin durum analizi veya var olan araçların kullanımı ile çıkarım elde edilmesi şeklinde olduğu görülmektedir. Bazı çalışmalarda, geliştirilen araçların yazılım süreçleri, iş süreçleri gibi alanlardan elde edilen büyük veriler ile koşturulması sonucundaki gözlemler ve araçların özellikleri aktarılmıştır. İlişkili araçlar kısmında ise var olan açık-kaynaklı araçlardan erişilebilir olan araçların[7] [8] özellikleri aktarılmıştır. Bu çalışmada ayrıca, örnek veriden elde edilen sonuçların doğruluğu bu araçların çıktılarıyla karşılaştırılmıştır. Aşağıda verilen Tablo 1 ve Tablo 2’de bu alanla ilgili ya da bu alanı etkileyen çalışmalar ve araçlar listelenmiştir. 209 Tablo 1. İlişkili Bazı Ulusal Çalışmalar Çalışma Temel Amacı Sonuçları Süreç Süreç Bu bildiri, Süreç Madenciliği tekniği kapsamında etkinlik Madenciliğinin Madenciliğinin madenciliğinin, yazılım süreç doğrulama için kullanımını Yazılım Süreç yazılım anlatmaktadır. Bir kamu kurumuna ait görev yönetimi Doğrulama İçin süreçlerinde sürecinin keşfi, keşfedilen sürece göre uygulamaların Kullanımı[9] kullanıldığı bir doğrulanması ve uygulamadaki varyasyonların tespiti için; örnektir. ProM Süreç Madenciliği aracı kullanılmıştır. Doğrulamanın başarımı istatistiksel olarak sınanmıştır. Sınama sonucunda özellikle durum esaslı işleyen yazılım süreçleri için, Süreç Madenciliğinin kullanılabileceği görülmüştür. Süreç Süreç Bu çalışmada işletmelerin artan rekabet koşulları karşında İyileştirme Madenciliğinin altı ayakta kalabilmesi için kaçınılmaz olarak hedeflenen sürekli Çalışmaların sigma yaklaşımı iyileştirme ve bu amacı benimseyen Altı Sigma yaklaşımı ve Veri ile birleştirilmesi teknikleri incelenmiştir. Veri madenciliği teknikleri ile Madenciliği amaçlanmıştır. verilerin depolanmasını sağlamak ve çok büyük veri yığını Yaklaşımlarının içinde istenilen desenleri ortaya çıkarmanın hedeflendiği Kullanılması çalışmada, bu sayede iyileştirme yapılacak olan sürecin daha Üzerine Bir iyi anlaşılması ve analiz edilmesinin sağlanacağı belirtilmiştir. Çalışma[10] Yazılım Yazılım projeleri Bu çalışmada, SAP kullanan bir yazılım kurumundaki yazılım Geliştirme ve ve iş süreçlerinde geliştirme ve test döngüsü olay günlükleri alınarak bir analiz Test Döngüsü Süreç Madenciliği yapılmaktadır. Süreç Madenciliği sayesinde karar yolları, Üzerinde Süreç uygulanması kontrol akışı ve performans gibi yürütme bilgileri elde Madenciliği amaçlamıştır. edilebilir. Bu bilgiler kullanılarak simülasyon modelleri Yaklaşımı[11] üretmek mümkündür. Çalışma kapsamında yeni bir alan olarak anılan bu yaklaşıma ait araştırma ve geliştirmeye yönelik konular belirlenerek bir çalışma yapılmıştır. Çalışmamız ile benzer nitelikler taşıyan yerel olmayan çalışmalar da bulunmaktadır. “Sağlıkta Süreç Madenciliğinin Bir Uygulaması – Hollanda Hastanesindeki Bir Durum Çalışması”[12] isimli çalışmada Sağlık alanında Süreç Madenciliği yaklaşımı; kontrol akış, organizasyon ve performans olmak üzere üç perspektife dayandırılmıştır. Alan ve kapsam olarak bu çalışmaya en çok benzeyen çalışmadır. Aracın örnek kullanımı bölümünde kullanılan radyoloji türündeki sağlık verisi de bu çalışmada kullanılan veriden türetilmiştir. Çalışmada aynı tanı konulmuş bir hasta grubu için prosedür (bakım yolları) tanımlamak ve bölümler arası işbirliği sağlamak için Süreç Madenciliği kullanılabileceği gösterilmiştir. Sonuçları mevcut bakım akışlarının iyileştirilmesini kolaylaştıracak yeni bir anlayış sağlamak için Süreç Madenciliğinin kullanılabileceğini göstermektedir. Çalışmanın yayınladığı kaynaktan ve yakın zamanda yaptığımız çalışmadan[4] sağlık alanında madencilik uygulanan başka çalışmalara da erişilebilir. Çalışmamız sonucunda oluşturduğumuz aracın gereksinimlerinin ve tasarımının belirlenmesi noktasında var olan ve kullanılan diğer uygulamalardan yola çıkılarak yeni bir araç geliştirilmesi yoluna gidilmiştir. Aracın ilişkili araçlar tablosunda anlatılan diğer uygulamalardan farklı olarak temelde “ticari olmaması ve sağlık personelinin kullanması hedeflendiğinden mühendislik/teknisyenlik düzeyinde herhangi bir niteliğe ihtiyaç duyulmadan kullanılacak kolaylıkta” olması hedeflenmiştir. Tablo 2’de ayrıntıları verilen araçlardan; ProM aracı ile basitliği (kurulumu, kullanımı ve yorumlanmasının kolaylığı) yönüyle, Disco aracı ile ise ticari olmaması yönüyle farklılaştırılmıştır. Kapsamı daha dar ve odaklı olmakla birlikte geliştirdiğimiz aracın, bu iki özelliği bir arada bulundurmasıyla halihazırda kullanılan araçlara sağlık alanında kullanımda alternatif olması beklenilebilir. 210 Tablo 2. İlişkili Araçlar Araç Hakkında Özellikleri ProM ProM aracının geliştirilmesindeki temel - Ortak temeller için Süreç Madenciliği (2004) neden Süreç Madenciliğinde var olan tekniklerinin tüm türlerini destekler. Açık- araçların zayıf varsayımlara dayanması ve - Plug-in formunda Süreç Madenciliği Kaynak gerçek zamanlı Süreç Madenciliği projeleri tekniklerinin çeşitli türlerini destekleyen Süreç için neredeyse hiçbir destek sağlamamasıdır. dosya dışarı aktarımını, dönüştürmeyi ve Maden- Var olan araçların bu zayıflıkları nedeniyle olay verisini yüklemeyi düşünmeye gerek ciliği her yeni düşünülmüş süreç keşif tekniği için duymadan genişletilebilir iskelete sahiptir. Aracı[7] özel atanmış Süreç Madenciliği aracı - Platform bağımsızdır. üretilmesi gerekmekteydi. Süreç - Ücretsiz indirilebilir. Madenciliğini MXML formatında kullanan - Akademik çalışmaları destekleyen bir bu gözlem, ortamlar için “tak-çıkar” (plug- geliştirici ekip ile yeni araştırmalar ve able) ProM altyapısının geliştirilmesini eklentilere destek sunar. tetikledi ve 2004 yılından bu yana Süreç - Analiz sonucunu model ve bölümlen- Madenciliği alanında kullanılmaya başlandı. dirilmiş liste olarak göstermektedir. Disco Disco, Süreç Madenciliği analizi için yüksek - Basit, hızlı bir araçtır. (2011) performans (büyük ve karmaşık veri setleri - Ticari bir araçtır. Ticari ile başa çıkma) ve kullanım kolaylığı odaklı - Geliştirime açık değildir. Süreç olan bir tak-çıkar (bağımsız) araçtır. Bu - Analiz sonucunu model olarak Maden- araçtaki Süreç Madenciliği algoritması göstermektedir. ciliği bulanık madencilik (fuzzy mining) - Haritacılık metaforunda kullanılan Aracı[8] yaklaşımına dayanır. Performans gibi diğer genelleme ve kusursuz soyutlamayı boyutlar da madenlenen süreç modelleri ileri desteklemektedir. görüntüleme ile analiz edilebilmektedir. - Karmaşık (Spagetti) türü süreçlerde de Disco yayınlandığı 2011 yılından günümüze etkili olabilmektedir. kullanılmakta olan popüler bir araçtır. Süreç Madenciliğindeki araçlara girdilenecek verinin özel bir veri çıkarım (export) aracıyla ya da kaynak sistemlerin çeşitli çıkartım özellikleri kullanılarak elde edilmesi gerekir.[13] Bu noktada bu çalışmanın ve oluşturulan aracın; sağlığa özel amaçlı olması (özellikle bağımsız bir uygulama olması nedeniyle verinin hastane dışına çıkartılmasını gerektirmemesi), tedavi bazında uygunluk ve performans analizine imkân tanıyor olması, yerel olarak yapılan bir çalışma olması, açık kaynak olması gibi nedenlerle diğer çalışmalardan farklı olduğu görülmektedir. 3 Prototip ve Özellikleri Geliştirilen araç prototipi, Java dilinde masaüstü uygulama olarak yazılmıştır. Uygulama kullanıcıdan iki ayrı .csv dosyası isteyerek bu dosyalar içerisindeki (büyük) verinin algoritma sonucunda analizinin sonuçlarını kullanıcıya sunar (Şekil 2). Uygulamanın kullanımı ile uzmanın, madenlediği süreç verisi ile tedavi protokolü arasındaki farklılıkları gözlemlemesi amaçlanmıştır. Bunu takiben uzmanın, gerekli süreç iyileştirmeler için kendi alan bilgisini kullanarak yorumda bulunması beklenmektedir. Önce seçilen (yaygın kullanılması ve dönüştürümünün kolay olması nedeniyle) .csv formatındaki sağlık verisinden okuma yapılır ve uzmanın veriyi madenlemesi sağlanır. Sonrasında madenleme sonucunda oluşan model ile aynı ekrandan seçilen tedavi protokolü verisinden oluşturulan model karşılaştırılır. Son olarak da ilgili çizgelerin örüntülerinin ekrana görsel olarak çizdirilmesi, varyant örüntülerinin sıklıkları ile beraber sıralı şekilde listelenmesi ve uzmanın yorumuna sunulması gerçekleştirilir. 211 Şekil 2. Araç Tasarımı Aracın yazılımı, model ve GKA (grafiksel kullanıcı arayüzü) olmak üzere iki ana öğede değerlendirilebilir. Yazılımın model kısmında ilk olarak uzmandan alınan .csv dosyasının okutulması gerçekleşmektedir. Veri okunup ayrıştırıldığında zorunlu olan alanların eşleştirimi istenir ve hemen sonrasında bu zorunlu alanlara göre analize başlanır. Modelde veri içerisindeki her bir durum numarası için aktiviteler zaman bilgisine göre öbeklenir ve kayıt edilir. Sonrasında analiz tamamlandığında aktiviteler arasındaki geçiş için bir çizge (graph) oluşturulur. Buna uygun olarak eğer uzman belirli bir hastalık için seçimde bulunmuş ise o hastalığa ait çizge de oluşturulur. Eğer uzman veride filtreleme yapmış ise veri temizlendikten sonra analiz gerçekleştirilir. Araç, bulunan her bir "uygulama örüntüsü" (varyant) için kayıt tutmaktadır. Bu demektir ki araç, uzmanın analiz sonrası sık rastlanan varyantlar veya çok az rastlanan varyantları liste şeklinde görebilmesine olanak tanır ve böylelikle uzmanın sağlık verisindeki uygulama örüntüleri hakkında yorumlar yapması desteklenir. Yazılımın grafiksel kullanıcı arayüzü kısmında ilk olarak, uzmanın ‘analiz edilecek olan süreç verisini’ ve ‘süreç verisi ile karşılaştırılacak olan gerçek-hayat prosedürünü içeren model verisini’ dosya seçme tuşuna basarak seçmesi için gerekli ekran bulunmaktadır. Bu ekranda dosyalar seçildikten sonra dosyalara ait olan sütun isimleri listelenir. Uzman, analiz verisi ile model verisindeki sütun adları arasında eşleme yaparak; araca, hangi niteliğin veride hangi sütunda yer aldığı bilgisini girmiş olur. Sonrasında eşleme yapılan sütunlarda genel analiz başlatılır. Eğer uzman yalnızca belirli bir hastalık için analiz yapmak isterse ikinci ekran açılır ve veride yer alan tüm hastalıklar uzmana bu ekranda listelenir. İlgili hastalık seçilerek yine tüm veride yapıldığı şekilde analiz başlatılır ve sonuçları ekrana yansıtılır. Diğer bir ekranda ise bulunan varyantlar verideki görülme sıklıkları bilgisine göre çoktan aza listelenmektedir (Şekil 3). 212 Şekil 3. Araç Aktivite Akış Diyagramı Analizin başlangıcında uzman, süreç için sisteme tanımlayarak kullandığı .csv uzantılı dosyayı uygulama içinde bir kez tanıtarak aynı dosya üzerinden tekrar tekrar ayrık süreçleri başlatabilir. Seçilen hastalıkla ilgili kayıtlar görüntülenebildiği gibi bu kayıtlara ait grafiklerin de görsel olarak çizimi oluşturularak kullanıcı dostu bir yapıda olması amaçlanmaktadır. Bu nedenle grafiklerin görsel çizimi üzerindeki çalışmalar devam etmektedir. Araç Java8 üzerinde geliştirildiği için herhangi bir işletim sistemine bağlı olmadan ilgili JDK’nın mevcut olduğu her bilgisayarda kolaylıkla çalıştırılabilir. Ayrıca .jar dosyası olması sebebiyle kurulum gerektirmeden çalıştırılabilir. Tablo 3. Araç ve Çalışmada Kullanılan Veri ile Alakalı Terimlerin Tanımlamaları Case ID Hasta (vaka) numarasıdır. Kayıt altına alınan her bir hasta için farklıdır. Activity Uzman tarafından gerçekleştirilip cihazlarca kayıt altına alınan eylemdir. Örneğin buradaki radyoloji verisi için ct abdomen (karın bilgisayarlı tomografisi) bir aktivitedir. Timestamp Her bir aktivitenin gerçekleşme zaman bilgisidir. Diagnosis Her bir hastalığın ismidir. Protokol Tıp uzmanının gerçekte herhangi bir hastalıkta teşhis ve tedavi için uyguladığı sıralı işlemler bütünüdür. Örneğin buradaki radyoloji verisi için maligniteit endometrium (rahim içi kanseri) hastalığında; önce echo onderbuik (karın boşluğu echo’su) sonra ct abdomen (karın bilgisayarlı tomografisi) yapılması gerektiğinin bilgisini içerir. Bu çalışmada uzmanın tıpkı analiz edilecek veri gibi protokol verisini de .csv dosyası şeklinde sisteme tanıtması düşünülmektedir. Şekil 2’deki ve Şekil 3’teki Model dosyası bu dosyadır. Süreç Tıp uzmanının analiz etmek istediği büyük veriyi içeren dosyadır. Bu dosyada herhangi bir cihaz üzerinden alınan sağlık verisinin ilgili bilgileri yer almaktadır. Bu çalışmada bu dosyanın .csv dosyası şeklinde tıp uzmanı tarafından sisteme ekrandan seçilerek yüklenmesi beklenmektedir. Varyant Herhangi bir hastalık için görülen çeşitli yolların listesidir. Burada amaçlanan tıp (Uygulama uzmanının süreç verisinden seçtiği herhangi bir hastalık için tüm vakalarda (Case ID) Örüntüsü) nasıl yöntemler izlendiğini görebilmesi ve sıklık sayıları sayesinde en sık-en seyrek rastlanan yöntemleri de ayrıca inceleyebilmesi ve analiz edebilmesidir. 4 Prototipin Örnek Kullanımı Bu bölümde çalışmada geliştirilen aracın Flemenkçe (Dutch) dilinde benzer bir çalışmadan elde edilip daraltılan bir sağlık verisi[14] ile koşturulması örneklenecektir. Bu veri daha büyük bir veriden yalnızca org:group bilgisi Radiology (Radyoloji)* olarak seçilmiş bir örneklem kümesidir. Araç ve veri ile alakalı terimler Tablo 3’te verilmiştir. 213 Örneklemede kullanılan veri hakkındaki bilgiler Tablo 4’de verilmiştir. Tablo 4. Örnek Veri[14] Bilgileri Satır Sayısı : 3172 Sütun Sayısı : 97 Sütünların İçerdiği Case ID, Acvitiy, Complete Timestamp, Variant, (case) Age, (case) Bilgiler Diagnosis, (case) Diagnosis Combination ID, (case) Diagnosis code, (case) Specialism code, (case) Treatment code, Activity Code, Number of Executions, Producer code, Section, Specialism code, lifecycle:transition, org:group Etkinlik Sayısı : 124 *(Radyoloji, x ışınları ve diğer görüntüleme yöntemlerinin tıpta tanı ve tedavi amacıyla kullanılmasıdır. Tanı ve tedavi amacıyla kullanılan yöntemlerden bazıları; ultrason, bilgisayarlı tomografi (CT), manyetik rezonans görüntüleme(MR), mamografi, floroskopi ve X ışını kullanan diğer bazı yöntemler olarak sıralanabilir.) [15] Araç tek başına çalışmaktadır ve başlangıç olarak uzmandan iki adet .csv dosyası alarak işleme başlar. Bu dosyalardan biri uzmanın incelediği alanda gerçek hayatta uygulanması beklenilen tedavi protokolünden bir model oluşturulması amacı ile alınır. Alınan diğer .csv dosyası ise uzmanın asıl inceleyeceği süreci barındıran dosyadır. Süreç ve Model Eşleştirme Ekranında uzmandan ilgili dosyalar alındıktan sonra süreç dosyasında madenleme için gerekli alanların karşılıklarının işaretlenmesi için bir ekran sunulur. Bu ekran üzerinden uzman madenlemek istediği alanları işaretler (Şekil 4). Bu çalışmada geliştirilen araç dört temel ekrana sahiptir; “Süreç ve Model Eşleştirme Ekranı”, “Hastalık Seçme Ekranı”, “Süreç Modeli Ekranı”, “Uygulama Örüntüsü Listeleme Ekranı”. Bu ekranlara ilişkin tanımlar ve örnek görünümler izleyen paragraflarda verilmiştir. Süreç ve Model Eşleştirme Ekranı (Şekil 4): Uzman Süreç ve Model dosyasını seçerek bu iki dosyada ilgili ekranların eşleştirilmesini sağlar. Bu örneklemde ilgili veri süreç dosyası olarak, ilgili veriden elde edilecek analize odaklı özelliğe uygun daha küçük bir veri ise model (tedavi protokolü) dosyası olarak kullanılmıştır. Şekil 4. Süreç ve Model (Tedavi Protokolü) Arasında Madenleme İçin Gerekli Özellikleri Eşleştirme 214 Hastalık Seçme Ekranı (Şekil 5): Uzman madenleme işlemini ilgili büyük verinin tamamı yerine veride tespit edilen tek bir hastalık üzerinden yapmak isterse bu ekrandaki listede seçilen verideki hastalıklar listenecek ve uzman bu listeden herhangi bir hastalık seçerek yalnızca ilgili hastalığa ait modeli oluşturabilecektir. Şekil 5. Süreçte Yer Alan Hastalıklar Listesi İçerisinden Seçim Yapma Süreç Modeli Ekranı (Şekil 6): Önceki ekranda seçilmiş olan hastalık ile ilgili bir grafiksel modelin oluşturulması sağlanır. Bu çizgenin okuması örnek olarak şu şekilde yapılabilir*: “Bu uygulama örüntüsüne ait süreç kayıtlarında (hastalık StartTrace’den yalnızca iki kez başlatıldığından), hastalık yalnızca iki vakada (iki farklı Case ID’de) görülmüştür. Başlangıç izi olarak bir kez göğüs filmi (thorax) ve bir kez de karın bilgisayarlı tomografisi (ct abdomen) görülmüştür. Vakalar göğüs filmi ile başladığında ardından karın bilgisayarlı tomografisi ya da böbrek üriner sistem echo’su (echo nieren-urinewegen), karın bilgisayarlı tomografisi ile başladığında tekrar karın bilgisayarlı tomografisi ya da beyin bilgisayarlı tomografisi (ct hersenen) görülmüştür. Göğüs filmi görülen vakada ardından Böbrek üriner sistem echo’su görülmüş ise ardından karın bilgisayarlı tomografisi ya da boyun bilgisayarlı tomografisi (ct hals) görülmüştür. …” *(Kullanılan radyoloji verisi Flemenkçe dilinde olduğu için şekilde görülen olay kayıtlarına ait çevirilerin tamamı parantez içerisinde belirtilmiştir.) 215 Şekil 6. Seçilen Hastalığa Ait Sürecin Grafiksel Olarak Modelinin Çizdirilmesi Uygulama Örüntüsü Listeleme Ekranı (Şekil 7): Uzmana ilgili büyük veri üzerinden madenlenerek çıkarılan tüm olası süreç örüntülerini dosyada bulunma sıklıklarına göre listelenebilmesi ve her bir örüntünün modelinin tek tek görüntülenebilmesi sağlanır. Şekil 7. Sürece Ait Uygulama Örüntülerinin (Varyant) Listelenmesi 216 5 Sonuç, Kısıtlar ve Gelecek Çalışmalar Bu çalışmada, Süreç Madenciliğinin sağlık alanında temin edilen bir veri üzerinde uygulanabilirliğinden örneklem yapılmış, bu amaçla geliştirilen aracın prototipi tanıtılmış, benzer çalışmalar ve araçlar hakkında açıklamalar verilmiştir. Süreç Madenciliğinin neden önemli olduğu ve sağlık alanında kullanımının olası faydaları tartışılmıştır. Yapılan örnekleme için bir radyoloji uzmanından geribildirim alınmıştır ve dönüt, tekniğin sağlık alanındaki analizlerde fayda sağlayabileceği yönündedir. Ne var ki aracın kullanılabilirliğine ve işe yararlığına ilişkin deneysel çalışmalara ihtiyaç vardır ve gelecek çalışmalar dâhilinde planlanmaktadır. Süreç Madenciliği özellikle önemli operasyonel süreçleri olan organizasyonlar için önemli bir araçtır. Bir taraftan bilgi sistemlerinde kaydedilen verilerdeki artış oldukça fazladır. Diğer yandan da; süreçler ve içerdikleri bilgiler; uyum, verimlilik ve müşteri memnuniyeti gibi sebepler nedeniyle mükemmelleştirilmelidir. Süreç Madenciliği oldukça kolay uygulanabilir. Ancak belirtilmelidir ki; Süreç Madenciliği gelişmekte olan bir disiplin olduğundan, çeşitli zorlukları ve kısıtları vardır. Bu zorluklar; olay verilerinin bulunması, ayarlanması ve temizlenmesi, farklı karakteri olan karmaşık olay logları ile başa çıkmak, temsil noktalarını yaratmak, kavramsal sapmalar ile başa çıkmak, vs. olarak sıralanabilir.[5] Bu çalışmada; veri entegrasyonu, etik kısıtlar ve verinin tümleşik olmaması temel kısıtlar olarak düşünülebilir. Geliştirilen aracın gerek yeni sayılabilecek bir alanda yapılması gerekse gelişen teknolojik ve tıbbi imkânların hızlı artışı sayesinde gelecek çalışmalara örnek teşkil edeceği düşünülmektedir.[16][17] Özellikle sağlık alanındaki sistemler süreç-haberdar hale dönüştürülüp sağlık alanında veri kaydı için standartlar geliştirilebilirse Sağlıkta Süreç Madenciliği daha anlamlı hale gelebilir.[18] Bu çalışmada geliştirilen araç, sağlık verisinin etik nedenlerle kurum dışına çıkartılamaması durumunda yerinde analiz edebilme imkânı tanımak üzere hedeflenmiştir. Çalışma sonucunda elde edilenlerin ileride başka alanlarda kullanılması ya da bu alanda daha derinlemesine yapılacak çalışmalara kaynak oluşturması beklenmektedir. Bu bağlamda araç üzerinde grafiksel ve algoritmik iyileştirmeler sürmektedir. 217 Referanslar [1] Brender, J., Nøhr, C., McNair, P.: “Research needs and priorities in health informatics”. Int. Journal of Medical Informatics 58–59, pp. 257–289 (2000). [2] Dumas, M., Rosa, M.L., Mendling, J., Reijers, H.A.: Fundamentals of Business Process Management. Springer (2013). [3] W.M.P. van der Aalst, Process Mining: Discovery, Conformance and Enhancement of Business Processes. DOI 10.1007/978-3-642-19345-3_1, © Springer-Verlag Berlin Heidelberg 2011. [4] Erdoğan, T., Tarhan, A.: “Process Mining for Healthcare Process Analytics”, in proceedings of IWSM Mensura 2016, 5-7 Ekim 2016, Berlin. (kabul edildi) [5] IEEE Task Force on Process Mining, Process Mining Manifesto (Süreç Madenciligi Mani- festosu-Türkçeye çeviren: Aylin Çahin), in BPM Workshops, volume 99 of Lecture Notes in Business Information Processing. SpringerVerlag, Berlin, 2011, 169–194. [6] Eric Rojas, Jorge Munoz-Gama, Marcos Sepúlveda, Daniel Capurro, “Process Mining in Healthcare: A litersture Review” Journal of Biomedical Informatics 61 (2016) 224–236 [7] ProM(2004) Açık-Kaynak Süreç Madenciliği Aracı; http://www.promtools.org/doku.php [8] Disco(2011) Ticari Süreç Madenciliği Aracı; https://fluxicon.com/disco/ [9] Gürgen, Tuğba ve Tarhan, Ayça, (2011). Süreç Madenciliğinin Yazılım Süreç Doğrulama İçin Kullanımı; http://www.uyms.org.tr/2011/bildiriler/b37.pdf [10] Yalçın Pirinçliler, Esin Cumhur ve Şen, Ali, (2012). Süreç İyileştirme Çalışmaların Veri Madenciliği Yaklaşımlarının Kullanılması Üzerine Bir Çalışma; http://www.sobbiad.mu.edu.tr/index.php/asd/article/viewFile/265/395 [11] Saylam, Rabia ve Sahingoz, Ozgur Koray, (2014). Yazılım Geliştirme ve Test Döngüsü Üzerinde Süreç Madenciliği Yaklaşımı; http://ceur-ws.org/Vol-1221/62\_Bildiri.pdf [12] R. S. Mans, M. H. Schonenberg, M. Song, W. M. P. van der Aalst, P. J. M. Bakker, “Application of Process Mining in Healthcare – A Case Study in a Dutch Hospital”, Biomedical Engineering Systems and Technologies Communications in Computer and Information Science Volume 25, 2009, pp 425-438, Springer Berlin Heidelberg. [13] https://www.wiso.uni- hamburg.de/fileadmin/wiso_fs_wi/Publikationen/Michael/Gehrke_und_Werner_-_2013_- _Process_Mining_Pre-print_Version.pdf [14] Prototip İçin Kullanılan Verinin Kaynağı; http://data.4tu.nl/repository/uuid:d9769f3d-0ab0- 4fb8-803b-0d1120ffcf54 [15] https://tr.wikipedia.org/wiki/Radyoloji [16] C. Fernandez-Llatas, T. Meneu, J. Miguel Benedi, and V. Traver, “Continuous Clinical Pathways Evaluation By Using Automatic Learning Algorithms,” in Healthinf 2011: Proceedings of the International Conference on Health Informatics, 2011, pp. 228–234. [17] T.G. Erdogan, A. Tarhan and N.A. Karagoz. An Integrated Infrastructure Using Process mining Techniques for Software Process Verification, Uncovering Essential Software Artifacts through Business Process Archaeology, Idea Group Inc., 2013. (DOI: 10.4018/978-1-4666-4667-4). [18] Sağlıkta Süreç Madenciliği; http://www.processmining.org/health/start 218