<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="tr">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">İşlem Yükü Yüksek Sinyal İşleme Algoritmalarının İşlemci (CPU) ve Grafik İşlemci (GPU) Üzerinde Paylaşılarak Gerçeklenmesi</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">Sevda</forename><surname>Erdoğdu</surname></persName>
							<email>erdogdu@aselsan.com.tr</email>
							<affiliation key="aff0">
								<orgName type="department">Gömülü ve Gerçek Zamanlı Yazılım Tasarım Müdürlüğü</orgName>
								<orgName type="institution">SST Sektör Bşk</orgName>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Burcu</forename><forename type="middle">Sağel</forename><surname>Tawk</surname></persName>
							<affiliation key="aff0">
								<orgName type="department">Gömülü ve Gerçek Zamanlı Yazılım Tasarım Müdürlüğü</orgName>
								<orgName type="institution">SST Sektör Bşk</orgName>
							</affiliation>
						</author>
						<author>
							<persName><forename type="first">Erdal</forename><surname>Mehmetcik</surname></persName>
							<email>emehmetcik@aselsan.com.tr</email>
							<affiliation key="aff0">
								<orgName type="department">Gömülü ve Gerçek Zamanlı Yazılım Tasarım Müdürlüğü</orgName>
								<orgName type="institution">SST Sektör Bşk</orgName>
							</affiliation>
						</author>
						<title level="a" type="main">İşlem Yükü Yüksek Sinyal İşleme Algoritmalarının İşlemci (CPU) ve Grafik İşlemci (GPU) Üzerinde Paylaşılarak Gerçeklenmesi</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">0F057A07E0B25FD5453FC7A67DF0B12D</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-25T02:05+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<textClass>
				<keywords>
					<term>Sinyal İşleme Algoritmaları Gerçekleme</term>
					<term>GPU</term>
					<term>CPU Implementation Of Signal Processing Algorithms</term>
					<term>GPU</term>
					<term>CPU</term>
				</keywords>
			</textClass>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>Birçok algılayıcı içeren sistemlerde, sistemin amacının gerçekleştirilebilmesi için, bu algılayıcılardan elde edilen büyük boyutlardaki veriler üzerinde işlem yükü yüksek sinyal işleme algoritmalarını kabul edilebilir bir performans sağlayacak şekilde gerçek zamanlı olarak uygulamak gerekmektedir. Geliştirilen sinyal işleme algoritmalarının paralel ya da ardışık işlenebilir yapıda olmasına göre, grafik işlemci (GPU) ya da işlemci (CPU) gibi daha uygun olan donanımlar üzerinde işlenmesi, işlem süresinin azaltılmasını sağlayacaktır. Bu makale kapsamında, algılayıcı olarak birçok hidrofon kullanan, çevredeki olası tehditleri tespit etmeyi amaçlayan bir sonar sisteminin sinyal işleme algoritma dizisinin, işlemci (CPU) ve grafik işlemci (GPU) üzerinde paylaşılarak ve bu yapılara özel kütüphaneler kullanılarak gerçeklenmesi anlatılacaktır.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="tr">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1">Giriş</head><p>Birçok algılayıcı içeren sistemlerde, sistemin amacının gerçekleştirilebilmesi için, bu algılayıcılardan elde edilen büyük boyutlardaki veriler üzerinde işlem yükü yüksek sinyal işleme algoritmalarını kabul edilebilir bir performans sağlayacak şekilde gerçek zamanlı olarak uygulamak gerekmektedir. İşlem yükü yüksek sinyal işleme algoritmalarının (görüntü işleme, sonar sinyal işleme, vs.) gerçeklenmesi için güçlü donanımlara (grafik işlemci vs.) ya da işlem yükünün (algoritmaların) farklı donanımlara dağıtılmasına ihtiyaç olduğu görülmüştür.</p><p>Bu makale kapsamında, algılayıcı olarak birçok hidrofon kullanan örnek bir pasif sonar sisteminin sinyal işleme algoritma dizisinin, işlemci (CPU) ve grafik işlemci (GPU) üzerinde paylaşılarak ve bu yapılara özel kütüphaneler kullanılarak gerçeklenmesi ve gerçeklenme sırasında yapılan adımlar anlatılacaktır. Bir algoritmanın gerçekleneceği işlemci seçiminde izlediğimiz yoldan da bahsedilecektir.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2">Pasif Sonar Sistemi</head><p>Bu makalede anlatılan örnek pasif sonar sistemi, düşük frekanslı hedef özgürültüsü ve DEMON ("Detection Of Envelope Modulation On Noise") bilgisi ile her türlü sualtı hedefini tespit etme, sınıflandırma, konumlandırma, takip etme kabiliyetlerine sahip bir sistemdir. Aynı zamanda hedefin yüksek frekanslı aktif yayınını tespit ederek kullanıcıya sınıflandırma bilgisi olarak da sunmaktadır.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Şekil 1 Sinyal İşleme Algoritma Akışı</head><p>Sistemde düşük frekanslardaki hedef öz gürültüsünün tespiti için doğrusal dizin yapısında bir hidrofon dizini bulunmaktadır. Bu dizin triplet adı verilen sensör istasyonlarından oluşmaktadır. Bunun dışında dizinde hareket esnasında meydana gelen ve sinyal işlemeyi etkileyebilecek geometrik değişiklikleri algılayabilmek için akustik olmayan sensörler ve yüksek frekans bandında hedef aktif yayınlarının dinlenmesi için tüm yönlü yayın (intersept) algılayıcıları yer almaktadır.</p><p>Tüm hidrofonlardan ve akustik olmayan sensörlerden gelen veri, ışın demetleme algoritmaları tarafından işlenir ve işlenmiş veri tespit, sınıflandırma, takip, konumlandırma algoritmalarına aktarılır. Sistemin sinyal işleme algoritma akışı ve algoritmaların birbirleri ile olan ilişkileri Şekil 1'de verilmiştir.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>3</head><p>Sinyal İşleme Algoritmaları Gerçekleme</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1">Donanım Seçimi</head><p>Sistemde düşük frekans için yaklaşık 7.5MB, yüksek frekans için yaklaşık 1 MB'lık verinin 500 ms içerisinde işlenmesi gerekmektedir. Bu büyüklükte bir verinin sinyal işleme alanında sıkça kullanılan Power PC, DSP gibi tek bir birim üzerinde gerçeklenemeyeceği yapılan testler ile görülmüştür.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Şekil 2 FFT işlemi zamanlama değerleri</head><p>Bu nedenle ilk olarak görüntüleme amaçlı kullanılmak için tasarlanmış ama sonradan çok çekirdekli (100 çekirdek üzeri) büyük verilerle tek, basit ve tekrarlı algoritmaları gerçeklemek için kullanılır hale gelmiş GPU'lar <ref type="bibr" target="#b1">[1]</ref> üzerinde çalıştırılarak denenmesinin uygun olacağı düşünülmüştür. Sinyal işleme algoritmalarında kullanılan temel işlemler (çıkarma, çarpma, FFT gibi) farklı büyüklükteki veriler için bir Power PC, CPU, DSP ve GPU üzerinde çalıştırılarak, çalışma süreleri karşılaştırılmıştır. Şekil 2'de görüldüğü gibi GPU özellikle büyük verilerde en kısa sürede çıktı üreten donanımdır. Bu nedenle sistemde büyük verileri paralel olarak işlemeye olanak veren sinyal işleme algoritmalarının gerçeklenmesinde GPU kullanımına karar verilmiştir.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2">Algoritma Gerçekleme</head><p>GPU'lar yardımcı işlemci (co processor) olarak kullanılmaktadırlar, tek başlarına çalışamazlar. GPU'lara erişim ve kullanım CPU üzerinden olmaktadır. CPU, GPU üzerinde algoritmaların akışını gerçeklemek için kullanılmaktadır. Ayrıca tüm algoritmaların GPU üzerinde gerçeklemeye uygun olmadığı görülmüştür bu nedenle bazı algoritmalar CPU üzerinde gerçeklenmektedir. GPU üzerinde gerçeklenecek algoritmalara, algoritmanın yapısına bakılarak karar verilmektedir. Algoritma büyük veriler üzerinde ve paralel çalışabilir fonksiyonlardan oluşuyor ise GPU üzerinde, aksi durumda CPU üzerinde gerçeklenmektedir. Algoritmalar tarafından kullanılan ve akış esnasında değişmeyen tüm parametreler GPU hafızasına ilkleme esnasında yazılır ve hep burada tutulur. Ön İşleme: Ön işleme ile hidrofonlardan alınan veriler önceki verilerle %50 örtüştürülürek FFT'si alınır. Ön işleme, ön işleme çıktısı sinyalin hidrofon verileri bilgilerinin (RMS, maksimum değer vs.) oluşturulması için de kullanıldığından CPU üzerinde yapılmaktadır.</p><p>Işın demetleme: Sistemde kullanılan pasif sonar dizini, triplet yapıya sahip algılayıcı (hidrofon) istasyonlarından oluşan doğrusal dizindir. Triplet yapı, iskelesancak belirsizliğini anlık olarak çözmek için kullanılan bir yapıdır. Triplet sinyal işleme <ref type="bibr" target="#b2">[2]</ref> sonucu elde edilen sinyal, dizin ışın demetleme algoritmasına girdi olmaktadır (Şekil 4Şekil 1).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Şekil 4 Işın Demetleme Blok Şeması</head><p>Konvansiyonel ışın demetleme işlemi zaman veya frekans uzamında yapılabilir. Bu çalışma kapsamında frekans uzamında ışın demetleme yapılmaktadır. Konvansiyonel ışın demetleme olarak ifade edilen yöntem, hidrofonlardan alınan veriye gecikme uygulayarak toplama işlemine karşılık gelmektedir. Yapılan işlem her bir hidrofondan gelen sinyalin FFT'si alındıktan sonra, yönelim açısına göre uygun ağırlıklar ve fazlarla (gerçek zamanla değişen yönelim vektörü ile) çarpılıp toplanmasına karşılık gelmektedir.</p><p>Işın demetleme algoritması hem işlem yükü yoğun hem de paralel çalıştırılabilecek bir algoritmadır. GPU üzerinde çalıştırılmasının performans açısından daha verimli olacağı öngörülmüştür ancak; CPU'nun da performansını gözlemlemek ve kararın doğruluğunu teyit etmek amacıyla Intel IPP/MKL kütüphaneleri kullanılarak da gerçeklenmiştir. Karşılaştırmalar sonucunda GPU(Tesla K40c) üzerindeki performansa erişebilmek için 21 tane Intel E5 işlemcili kart üzerinde algoritmanın koşması gerekmektedir.</p><p>Oluşturulan ışın demetleme çıktısı frekans uzamındadır. Bu sinyal ters FFT alınarak zaman uzamına çevrilir ve NxFs boyutundaki ışın demetleme çıktısı sinyal oluşturulur. Ters FFT alma işlemi, hem bu işleme girdi olan sinyal GPU üzerinde olduğu için, hem de çıktısı işlem yükü yoğun DEMON algoritmasında kullanıldığı için yine GPU üzerinde yapılır.</p><p>DEMON: Hedef platform pervaneleri kavitasyona uğradığında geniş bantlı gürültü üretirler. Bu gürültü, pervanenin kanatçıkları tarafından genlik modülasyonuna uğrar ve pervanenin dönüş hızı ve kanatçık sayısı gibi bilgiler kavitasyon gürültüsünün düzgün bir şekilde demodüle edilmesiyle elde edilebilir <ref type="bibr" target="#b3">[3]</ref>.</p><p>Şekil 5 DEMON algoritması blok şeması DEMON algoritması GPU üzerinde gerçeklenmektedir.</p><p>Tespit: Tespit algoritması, hedef tespit dizininden gelen zaman tabanlı akustik veriden ışın demetleme sonucunda oluşturulan verileri kullanarak olası bir hedefin tespitini gerçekleştirir. Sistem düşük frekanslar için, güç tabanlı geniş bant ve güç tabanlı dar bant tespit algoritmaları koşturmaktadır.</p><p>Geniş bant tespit algoritması, her bir açıdan gelen güç bilgisini kullanarak hedef bulunması olası açılarla, hedef bulunması olasılığı olmayan açıları ayırarak tespit sonucunu üretir. Bu işlemde arka plan gürültüsünün seviyesi kestirilmekte, daha sonra da hedefin bulunması olası açılar için eşik seviyesi değerleri "sabit yanlış alarm sıklığı" (CFAR, <ref type="bibr" target="#b5">[5]</ref>, <ref type="bibr" target="#b5">[5]</ref>) yöntemi hesaplanmaktadır. Geniş bant tespit algoritması ortam gürültüsünü kestirebilen ve değişen ortam gürültüsü karşısında tespit eşik değerini otomatik olarak güncelleyebilen bir yapıya sahiptir. Dar bant tespit algoritması, geniş bant tespit algoritması ile oldukça benzerdir. Geniş bant algoritmasından farklı olarak, her bantta bağımsız bir tespit işlemi yapılır. Her bir banttan gelen ham tespit sonuçları (geniş ve dar bant) birleştirilerek, nihai tespit çıktısı oluşturulur.</p><p>Sınıflandırma: Pasif sonar sisteminde, sınıflandırma algoritmasında kullanılan özellikler, tespit bloğundan gelen tonal frekans bilgisi (dar bant tespitler) ile aktif yayın kestirim bloğundan gelen bilgilerdir.</p><p>Sınıflandırma algoritmasında, dar bant tespit bloğundan alınan hedef tonal bilgilerinin kütüphanede yer alan hedef özellikleriyle karşılaştırılması gerekmektedir. Bu işlem, her tespit kararı için, kütüphanedeki her hedef sınıfıyla bir korelasyon hesaplamasına ihtiyaç duyar. K adet tespit kararı için kütüphanede bulunan L adet sınıfla, toplamda KxL adet korelasyon hesaplaması gerekmektedir. Bu korelasyon hesaplamaları, birbirlerinden bağımsız oldukları için (herhangi birinin sonucu diğerinin hesaplaması sırasında kullanılmadığından) GPU üzerinde hesaplanmalarının daha uygundur ve bu nedenle sınıflandırma GPU üzerinde yapılmaktadır.</p><p>Aktif yayın tespitlerinin sınıflandırılması "Bayes" karar verme kuralına göre yapılmaktadır, burada kullanılan veri daha küçük olduğundan bu işlem CPU üzerinde yapılmaktadır.</p><p>Takip: Takip algoritması, sınıflandırılmış temas (tespit) çıktılarını kullanarak bir veya birden fazla hedefin kerteriz bilgilerini çıkartmaktadır. Takip algoritması en etkin 10 hedefi izlemek üzere tasarlanmıştır. En "etkin" hedeflerin belirlenmesi, takip edilen hedeflerden sınıflandırma olanların önceliklendirilmesi ile yapılmaktadır. Bu şekilde, tehdit potansiyeli daha yüksek ya da kullanıcı tarafından "önemli" olarak işaretlenen hedeflerin takibine öncelik verilmektedir.</p><p>Takip algoritmasının durum vektörü kerteriz ve kerteriz değişiminden oluşmaktadır ve sabit hız süreç modeli kullanılmaktadır. Veri ayıklama yöntemi olarak da "Global Nearest Neighborhood, (GNN)" seçilmiştir <ref type="bibr" target="#b6">[6]</ref>, <ref type="bibr" target="#b7">[7]</ref>.</p><p>Algoritmanın akış diyagramı Şekil 6'da gösterilmiştir. Her güncelleme sonrasında var olan izler kontrol edilerek, belli bir süre bir tespit kararıyla güncellenmeyen izler silinmektedir.</p><p>Takip algoritması sınıflandırılmış temas bilgilerini kullanmaktadır. Sınıflandırılmış temas bilgileri, temel olarak kerteriz bilgisi ile hedefin sınıflandırma bilgilerinden(veri tabanındaki bir tehdide benzeme oranı, tehdit bilgileri vs.) oluşur, bu veriler hidrofon verileri gibi büyük olmadıklarından CPU üzerinde gerçeklenmektedir.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Şekil 6 Takip Algoritması Blok Şeması</head><p>Aktif Yayın Tespit: Aktif yayın tespit algoritması, aktif yayın yapan platformların yayınlarını tespit etmekte ve bu yayınların parametrelerinin kestirimini yapmaktadır (Şekil 7). Yüksek frekans bandında alış yapabilen hidrofonlardan gelen yüksek frekanslı zaman tabanlı akustik veri, aktif yayın tespit algoritmasından geçirilerek, yayının tespiti ve yayın parametrelerinin çıkartılması sağlanmaktadır. Literatürde bu tarz algoritmalar genellikle enerji dedektörü (radyometre, <ref type="bibr" target="#b8">[8]</ref>) ve sabit yanlış alarm olasılığı (CFAR, <ref type="bibr" target="#b4">[4]</ref>) tabanlıdır. Sistemde bu yöntemlerin kombinasyonu kullanılmaktadır.</p><p>Aktif Yayın tespit algoritması tüm yönlü yüksek frekans hidrofonundan alınan verileri kullanılır. Bu veriler de düşük frekans verileri gibi büyük verilerdir fakat algoritma tüm veriyi tek seferde işlemez, küçük bloklar halinde işler. Bu nedenle bu algoritma CPU üzerinde gerçeklenmesi daha uygun bulunmuştur. Veri transferi, (hem GPU'ya veri aktarma hem de GPU'dan veri okuma) zaman alan işlemlerdir, bu nedenle algoritmaların gerçeklenmesi esnasında mümkün olduğunca az veri transferi yapılmasına dikkat edilmektedir.</p><p>Güncel algoritmaların gerçekleme zamanları Tablo 1'de verilmiştir. Algoritmaların bir kısmı önce CPU üzerinde gerçeklenmiş, algoritma gerçekleme zamanı beklenenden uzun alındığında GPU üzerine taşınmıştır. Örneğin Işın demetleme algoritması Intel IPP/MKL kütüphaneleri kullanılarak gerçeklendiğinde, GPU ile gerçeklediğimiz sürenin 21 katı civarında bir sürede ancak işlenebilmiştir. </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5">Sonuç ve Yapılabilecek İyileştirmeler</head><p>Pasif sonar sisteminin sinyal işleme yazılımının CPU-GPU paylaşımı ile gerçeklenmesi ile işlem yükü yoğun algoritmaların tek bir bilgisayar üzerinde ve tek bir uygulama (executable) ile gerçeklenmesi sağlanmıştır. CPU-GPU kullanımı ile algoritmik olmayan sistem fonksiyonları Intel CPU(E5, I7 v.b.) üzerinde gerçeklenirken, algoritmaların çoğu GPU üzerinde sistemin ihtiyacını sağlayacak şekilde koşturulabilmiştir. Sistemde kullanılan sinyal işleme algoritmaları, çalışmaların başladığı günden bu yana sistem performansının iyileştirilmesi için sürekli güncellenmiştir. Özellikle geliştirilen CUDA Kütüphanesi ile algoritmalardaki güncellemeler kolaylıkla algoritma gerçekleme yazılımına yansıtılabilmiştir.</p><p>Sistem performansını artırabilmek amacıyla kullanılabilecek iki yöntem vardır. Bu yöntemlerden ilki olan CPU ve GPU'ların beraber kullanımı ile GPU ve CPU üzerinde heterojen olarak algoritma parçacığı koşturmak mümkündür. Bu yöntemde asenkron CUDA fonksiyonları, fonksiyon çağrıldıktan sonra CPU'ya kontrolü geri vermekte ve böylece CPU üzerinde veri işlenebilmekte ve bundan GPU etkilenmemektedir. Bu şekilde kullanılabilen kernel çağrıları, asenkron bellek kopyalama ya da 64KB'dan küçük belleğe veri kopyalama (CPU'dan GPU'ya), bellek set etme v.b fonksiyonlardır. Heterojen veri işlemede GPU'da veri işlenirken CPU'nun da veri işlemeye en hızlı şekilde dönmesine olanak verecek şekilde kodlama yapılmalıdır.</p><p>İkinci yöntem çoklu GPU kullanımıdır. Bu yöntemde çoklu GPU'lar aynı kodu ya da farklı kodu paralel işleyecek şekilde kullanılabilmektedir. GPU'lar arasında iletişim için yeni versiyon GPU (Fermi v.b.)'larda ve güncel CUDA versiyonlarında (5.0 ve üzeri) birbirlerinin belleklerine erişim izni verilerek CPU üzerine veriyi</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>Şekil 3</head><label>3</label><figDesc>Algoritma akışı ve CPU -GPU paylaşımı CPU-GPU kullanım kararı için ilk olarak algoritmaların yapısı incelenmiştir. Error! Reference source not found.'te Pasif Sonar sisteminin sinyal işleme algoritma akışı ve CPU-GPU paylaşımı verilmiştir. Kullanılan algoritmalar ve neden CPU ya da GPU'da gerçeklendikleri aşağıda kısaca verilmiştir.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_2"><head>Şekil 7</head><label>7</label><figDesc>Aktif yayın tespit algoritması blok şeması Yüksek frekans hidrofonu ses verisinin oluşturulması da yine CPU üzerinde yapılmaktadır. Bu işlem yüksek frekanstaki verilerin duyulabilir ses frekansına çekilmesi ile gerçeklenir. Kullanıcı arayüzüne gönderilerek ekranlarda gösterilecek tüm sinyallerin (geniş bant, dar bant, DEMON) dB (Decibel) skalasında olması gerekmektedir. Bu çevrim veri gönderimi esnasında CPU üzerinde yapılmaktadır.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="2,156.30,421.00,284.20,212.24" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head></head><label></label><figDesc>Sistemde Intel tabanlı CPU'lar tercih edilmiş ve Intel CPU'lara özgü olan IPP (Intel Integrated Performance Primitives) ve MKL (Math Kernel Library) kütüphaneleri kullanılmıştır. Bu kütüphanelerin kullanımıyla, çok işlemcili çok çekirdekli bilgisayarlarda yapılan işlemler, işlemciler ve çekirdekler üzerinde otomatik olarak dağıtılmakta ve bu yapıların en etkin kullanımı sağlanmaktadır. Torpido tespit sistemi sinyal işleme bilgisayarı olarak çok işlemcili, çok çekirdekli güçlü bir bilgisayar tercih edilmiştir.GPU ile çalışırken CUDA (Computer Unified Device Architecture) kütüphaneleri kullanılmış, temel CUDA kütüphanesi fonksiyonları bir araya getirilip uygun şekillerde paketlenerek CUDA Sinyal İşleme Kütüphanesi (CudaSPL) geliştirilmiş ve algoritmaların gerçeklenmesinde kullanılmıştır.</figDesc><table><row><cell></cell><cell cols="3">ˡ Algoritma işlem süresinin algoritmanın gerçeklenmesi için ayrılan toplam zamana oranı</cell></row><row><cell></cell><cell cols="2">2 IPP/MKL ile gerçeklenmiş optimize edilebilir algoritma</cell></row><row><cell>4</cell><cell>Kütüphaneler</cell><cell></cell></row><row><cell></cell><cell cols="2">Tablo 1 Normalize Algoritma Gerçekleme Zamanları</cell></row><row><cell></cell><cell>Algoritma</cell><cell cols="2">Gerçeklendiği Yer Normalize İşlem Süresi(ˡ)</cell></row><row><cell></cell><cell>Ön işleme</cell><cell>CPU</cell><cell>0,063258</cell></row><row><cell></cell><cell>Işın Demetleme</cell><cell>GPU</cell><cell>0,308558</cell></row><row><cell></cell><cell>DEMON</cell><cell>GPU</cell><cell>0,122506</cell></row><row><cell></cell><cell>Tespit</cell><cell>GPU</cell><cell>0,06996</cell></row><row><cell></cell><cell>Sınıflandırma</cell><cell>GPU</cell><cell>0,02963</cell></row><row><cell></cell><cell>Takip</cell><cell>CPU</cell><cell>0,00411</cell></row><row><cell></cell><cell>Aktif Yayın Tespit</cell><cell>CPU</cell><cell>0,04616</cell></row><row><cell></cell><cell>Toplam Süre</cell><cell>CPU + GPU</cell><cell>0,644182</cell></row><row><cell></cell><cell>Işın Demetleme 2</cell><cell>CPU</cell><cell>8,00000</cell></row></table></figure>
		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<monogr>
		<title level="m">Çoklu GPU kullanımı için farklı teknikler ve altyapılar kullanılması gerekmektedir</title>
				<imprint/>
	</monogr>
	<note>Önümüzdeki dönemde bu yöntemler üzerinde çalışma yapılması planlanmaktadır</note>
</biblStruct>

<biblStruct xml:id="b1">
	<analytic>
		<title level="a" type="main">CUDA Altyapısı Kullanılarak Sinyal İşleme Yazılımı Optimizasyonu</title>
		<author>
			<persName><forename type="first">B</forename><surname>Sagel</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Ceylan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><forename type="middle">C</forename><surname>Akpulat</surname></persName>
		</author>
		<author>
			<persName><forename type="first">H</forename><surname>Türken</surname></persName>
		</author>
		<author>
			<persName><forename type="first">S</forename><surname>Erdogdu</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">UYMS</title>
		<imprint>
			<date type="published" when="2011">2011</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<monogr>
		<title level="m" type="main">Cardioid Receive Array Calibration for Active Systems</title>
		<author>
			<persName><forename type="first">A</forename><surname>Baldacci</surname></persName>
		</author>
		<author>
			<persName><forename type="first">G</forename><surname>Haralabus</surname></persName>
		</author>
		<author>
			<persName><forename type="first">M</forename><surname>Van Velzen</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2006">2006</date>
			<pubPlace>UDT Europe</pubPlace>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<monogr>
		<title level="m" type="main">Advances in Sonar Technology</title>
		<author>
			<persName><forename type="first">S</forename><forename type="middle">R</forename><surname>Silva</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2009">2009</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<analytic>
		<title level="a" type="main">A performance comparison of four noise background normalization schemes proposed for signal detection sytems</title>
		<author>
			<persName><forename type="first">W</forename><forename type="middle">A</forename><surname>Struzinski</surname></persName>
		</author>
		<author>
			<persName><forename type="first">E</forename><forename type="middle">D</forename><surname>Lowe</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Journal of The Acoustical Society of America</title>
		<imprint>
			<date type="published" when="1984">1984</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<title level="m" type="main">Detection, Estimation and Modulation Theory, Part-1 Detection, Estimation and Linear Modulation Theory</title>
		<author>
			<persName><forename type="first">H</forename><forename type="middle">L</forename><surname>Van Trees</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2001">2001</date>
			<publisher>John Wiley and Sons Inc</publisher>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b6">
	<monogr>
		<title level="m" type="main">Design and Analysis of Modern Tracking Systems</title>
		<author>
			<persName><forename type="first">S</forename><surname>Blackman</surname></persName>
		</author>
		<author>
			<persName><forename type="first">R</forename><surname>Popoli</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1999">1999</date>
			<publisher>Artech House</publisher>
			<pubPlace>Norwood, MA</pubPlace>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<monogr>
		<author>
			<persName><forename type="first">Y</forename><surname>Bar-Shalom</surname></persName>
		</author>
		<author>
			<persName><forename type="first">X</forename><forename type="middle">R</forename><surname>Li</surname></persName>
		</author>
		<title level="m">Multitarget-Multisensor Tracking: Principles, Techniques</title>
				<meeting><address><addrLine>Storrs, CT</addrLine></address></meeting>
		<imprint>
			<publisher>YBS Publishing</publisher>
			<date type="published" when="1995">1995</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<analytic>
		<title level="a" type="main">Energy detection of unknown deterministic signals</title>
		<author>
			<persName><forename type="first">H</forename><surname>Urkowitz</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proc. IEEE</title>
				<meeting>IEEE</meeting>
		<imprint>
			<date type="published" when="1967-04">April 1967</date>
			<biblScope unit="volume">55</biblScope>
			<biblScope unit="page" from="523" to="531" />
		</imprint>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
