<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="ru">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">Сокращение числа виртуальных экспериментов с помощью оценки корреляций параметров взаимодействующих гипотез</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">©</forename><forename type="middle">Е А</forename><surname>Тарасов</surname></persName>
						</author>
						<title level="a" type="main">Сокращение числа виртуальных экспериментов с помощью оценки корреляций параметров взаимодействующих гипотез</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">6FF4A055283A3785D8B378B74FA911BD</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-24T07:17+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<abstract/>
		</profileDesc>
	</teiHeader>
	<text xml:lang="ru">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Аннотация</head><p>В данной работе представлен подход, позволяющий исследователю сократить число виртуальных экспериментов, уменьшив количество наборов тестовых сценариев. Рассматриваемый подход основывается на вычислении корреляций между параметрами различных гипотез. Для решения данной задачи был выполнен обзор и сравнительный анализ существующих систем: Hephaestus, FCCE, ϒ-DB, реализующих схожий функционал. Далее, был произведен обзор алгоритмов отбора признаков, позволяющих уменьшить исследуемое пространство параметров и выявить взаимосвязь между ними. Были сформулированы функциональные требования к проектируемой системе. Рассмотрена практическая задача, которая может быть решена в рамках реализации данной платформы и описан ее частный случай, а именно, оценка корреляции параметров гипотез в астрономической задаче, которая будет использоваться в качестве тестового задания на этапе отладки системы.</p><p>Работа поддержана РФФИ (гранты 14-07-00548, 16-07-01028).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="1">Введение</head><p>В современном мире исследования всё более зависимы от данных, которые становятся ключевым источником для получения новых знаний в той или иной области человеческой деятельности <ref type="bibr" target="#b3">[4]</ref>. Такой подход получил название исследований с интенсивным использованием данных (ИИИД) <ref type="bibr" target="#b9">[10]</ref> и развивается в соответствии с 4-й парадигмой научного развития <ref type="bibr" target="#b7">[8]</ref>. Одним из ключевых элементов ИИИД является явное использование гипотез в определении виртуального эксперимента <ref type="bibr" target="#b2">[3]</ref>.</p><p>Гипотезам соответствует некоторая формальная спецификация свойств исследуемого явления, которая чаще всего имеет математическое представление. Сформулированные гипотезы нуждаются в тщательной проверке. В процессе выполнения виртуального эксперимента происходит манипулирование параметрами гипотез, т.е. набором переменных, которые в некоторых случаях могут быть коррелированы между собой, а также с параметрами других гипотез <ref type="bibr" target="#b9">[10]</ref>.</p><p>Так как число потенциальных гипотез в виртуальном эксперименте может быть огромным, а их взаимодействие нетривиальным, то в результате образуется пространство с большим числом виртуальных экспериментов, часть из которых плохо описывает наблюдения и нуждается в отсеивании ещё до выполнения эксперимента. Как следствие, исследователю необходимо средство, позволяющее заранее выявить и отсеять виртуальные эксперименты с прогнозируемо плохим результатом. В тоже время наличие сложных зависимостей в данных затрудняет их понимание исследователем и не позволяет делать это вручную <ref type="bibr" target="#b2">[3]</ref>. Машинные средства оценки корреляции позволяют автоматически разделить виртуальные эксперименты на группы с заранее прогнозируемо хорошим и плохим результатом эксперимента <ref type="bibr" target="#b3">[4]</ref>.</p><p>Разрабатываемая архитектура платформы рассматривается в рамках более широкого проекта лаборатории, следовательно, будет интегрирована в него отдельным модулем <ref type="bibr" target="#b9">[10]</ref>.</p><p>Статья организована следующим образом. В разделе 2 приводится обзор существующих систем, позволяющих решать схожую задачу поиска корреляций и причинно-следственных связей. В разделе 3 приводится обзор алгоритмов отбора признаков. В разделе 4 формулируются требования к проектируемой системе. В разделе 5 формулируется тестовая задача поиска корреляции между двумя гипотезами. В разделе 6 формулируются дальнейшие шаги по развитию данной работы.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2">Обзор платформ для поиска корреляций над большими массивами данных 2.1 Hephaestus</head><p>В основе системы Hephaestus <ref type="bibr" target="#b2">[3]</ref>  </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.2">FCCE</head><p>Платформа FCCE <ref type="bibr" target="#b15">[16]</ref>  </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3">Методы отбора признаков</head><p>Для уменьшения пространства параметров гипотез и виртуальных экспериментов используются методы отбора признаков <ref type="bibr" target="#b12">[13]</ref>. Они позволяют увеличить скорость обработки данных и получения результат, не снижая показатели точности <ref type="bibr" target="#b17">[18]</ref>, путем выделения только тех информативных признаков, которые требуются для выполнения виртуального эксперимента.</p><p>Выделение набора признаков позволяет упростить понимание модели исследователем и, следовательно, использовать их в качестве входных данных для широко известных алгоритмов машинного обучения <ref type="bibr" target="#b5">[6]</ref>. Так же данные методы позволяют уменьшить шум в данных и выявить взаимодействие между параметрами.</p><p>Методы отбора признаков возможно классифицировать следующим образом: Фильтры, Обертки, Встроенные <ref type="bibr" target="#b0">[1,</ref><ref type="bibr" target="#b12">13]</ref>.</p><p>Фильтры. Опираются на общие характеристики обучающих данных и осуществляют процесс выборки признаков в качестве шага предварительной обработки независимо от индукционного алгоритма. Обладают низкой стоимостью вычислений. Фильтры используются в кластеризации для построения начального приближения. Не предназначены для выявления сложных связей между признаками, т.к. обладают низкой чувствительностью.</p><p>К таким методам можно отнести: CFS <ref type="bibr" target="#b5">[6]</ref> -где выбор признаков на основе корреляций. Является простым многофакторным фильтрующим алгоритмом, который раскладывает подмножество признаков согласно эвристической функции оценки, основанной на корреляции. INTERACT <ref type="bibr" target="#b19">[20]</ref> -двух этапный алгоритм, основанный на симметричной неопределенности и согласованности. ReliefF <ref type="bibr" target="#b10">[11]</ref> который является расширением алгоритма Relief, и работает путем случайной выборки экземпляра из данных, а затем находит его ближайшего соседа из того же или противоположного класса. mRMR <ref type="bibr" target="#b13">[14]</ref> выбирает признаки, которые имеют самое высокое значение информативности с целевым классом и обладающие минимальной избыточностью. Его разновидностью является Md фильтр <ref type="bibr" target="#b16">[17]</ref> -который использует меру монотонной зависимости для оценки информативности.</p><p>Обертки. Включают оптимизацию предиктора как часть процесса выбора. Позволяют выявлять зависимости признаков. Качество выборки зависит от индукционного алгоритма. Основным недостатком является вычислительная нагрузка, которая исходит от вызова алгоритма индукции для оценки каждого подмножества интересующих параметров.</p><p>К ним можно отнести: WrapperSubsetEval <ref type="bibr" target="#b18">[19]</ref> вычисляет наборы признаков с использованием схемы обучения. Для оценки точности схемы обучения для набора признаков используется перекрестная проверка. В качестве схемы обучения могут использоваться SVM и C4.5.</p><p>Встроенные. Выполняют функции выборки в процессе обучения. Как правило специфичны для алгоритмов машинного обучения. Применимость метода всегда зависит от типа решаемой задачи. Позволяют выявлять зависимости признаков. Обладают хорошей скоростью работы.</p><p>К ним относятся: SVM-RFE <ref type="bibr" target="#b14">[15]</ref> -метод осуществляет выбор признаков итеративным обучением SVM классификатора с текущим набором признаков и удаляет наименее важный признак, указанный SVM. Существуют две версии этого метода: с линейным и нелинейным ядром. FS-P <ref type="bibr" target="#b11">[12]</ref> основанный на перцептроне. Идея метода заключается в обучении перцептрона в контексте контролируемого обучения. Веса взаимосвязей используются как индикатор того, какие признаки могут быть наиболее информативными.</p><p>Другие методы. Так же к методам, позволяющим снизить размерность данных и оценить зависимость параметров можно отнести следующие техники. Анализ главных компонент (PCA) <ref type="bibr" target="#b6">[7]</ref>, которая включает в себя преобразование ряда коррелируемых переменных в меньшее число не коррелируемых. Анализ независимых компонент (ICA) <ref type="bibr" target="#b8">[9]</ref> </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Reducing the number of virtual experiments by estimating the correlation parameters of interacting hypotheses</head><p>Evgeny Tarasov This paper presents the approach that helps to researcher to reduce the number of virtual experiments through decrease the count of tested hypotheses. This approach is based on correlation search between parameters of different hypotheses. A review and analysis of modern platforms with similar functionality is done. Methods for reducing the number of virtual experiments are surveyed, including the features selection algorithm, which allows to reduce investigated parameters space and identify the interaction between them. Next, functional requirements of designed system are formulated. We consider the practical problem which can be solved in the framework of this system and consider its particular case -assessment of the correlation parameters in astronomical hypotheses problem, which will be used as the test task during system debugging.</p></div>		</body>
		<back>
			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<analytic>
		<title level="a" type="main">A review of feature selection methods on synthetic data</title>
		<author>
			<persName><forename type="first">Veronica</forename><surname>Bolon-Canedo</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Noelia</forename><surname>Sanchez-Marono</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Amparo</forename><surname>Alonso-Betanzos</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Knowledge and Information Systems</title>
		<imprint>
			<biblScope unit="volume">34</biblScope>
			<biblScope unit="issue">3</biblScope>
			<biblScope unit="page" from="483" to="519" />
			<date type="published" when="2013">2013</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b1">
	<monogr>
		<title level="m" type="main">Galaxy evolution: A new version of the Besancon Galaxy Model constrained with Tycho data</title>
		<author>
			<persName><forename type="first">Maria</forename><forename type="middle">A</forename><surname>Czekaj</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Annie</forename><forename type="middle">C</forename><surname>Robin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Francesca</forename><surname>Figueras</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Xavier</forename><surname>Luri</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2012">2012</date>
			<pubPlace>Barcelona</pubPlace>
		</imprint>
		<respStmt>
			<orgName>Universitet de Barcelona, PhD Thesis</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<title level="a" type="main">Hephaestus: Data Reuse for Accelerating Scientific Discovery</title>
		<author>
			<persName><forename type="first">Jennie</forename><surname>Duggan</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Michael</forename><surname>Brodie</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of 7th Biennial Conference on Innovative Data Systems Research (CIDR&apos;15)</title>
				<meeting>7th Biennial Conference on Innovative Data Systems Research (CIDR&apos;15)<address><addrLine>Asilomar, California, USA</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2015">2015</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<analytic>
		<title level="a" type="main">Managing large-scale scientific hypotheses as uncertain and probabilistic data with support for predictive analytics</title>
		<author>
			<persName><forename type="first">Bernardo</forename><surname>Goncalves</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Fabio</forename><surname>Porto</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">IEEE Computing in Science and Engineering</title>
		<imprint>
			<biblScope unit="volume">17</biblScope>
			<biblScope unit="issue">5</biblScope>
			<biblScope unit="page" from="35" to="43" />
			<date type="published" when="2015">2015</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b4">
	<monogr>
		<author>
			<persName><forename type="first">Bernardo</forename><surname>Goncalves</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Frederico</forename><forename type="middle">C</forename><surname>Silva</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Fabio</forename><surname>Porto</surname></persName>
		</author>
		<ptr target="http://arxiv.org/abs/1411.7419" />
		<title level="m">ϒ-DB: A system for data-driven hypothesis management and analytics</title>
				<imprint>
			<date type="published" when="2014">2014</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<title level="m" type="main">Correlation-based Feature Selection for Machine Learning</title>
		<author>
			<persName><forename type="first">Mark</forename><forename type="middle">A</forename><surname>Hall</surname></persName>
		</author>
		<imprint>
			<date type="published" when="1999">1999</date>
			<pubPlace>Hamilton, New Zeland</pubPlace>
		</imprint>
		<respStmt>
			<orgName>The University of Waikato</orgName>
		</respStmt>
	</monogr>
	<note type="report_type">PhD Thesis</note>
</biblStruct>

<biblStruct xml:id="b6">
	<analytic>
		<title level="a" type="main">Canonical correlation analysis: an overview with application to learning methods</title>
		<author>
			<persName><forename type="first">David</forename><forename type="middle">R</forename><surname>Hardoon</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Sandor</forename><surname>Szedmak</surname></persName>
		</author>
		<author>
			<persName><forename type="first">John</forename><surname>Shawe-Taylor</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Neural Computation</title>
		<imprint>
			<biblScope unit="volume">16</biblScope>
			<biblScope unit="issue">12</biblScope>
			<biblScope unit="page" from="2639" to="2664" />
			<date type="published" when="2004">2004</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<monogr>
		<title level="m" type="main">The Fourth paradigm: Data-intensive scientific discovery</title>
		<author>
			<persName><forename type="first">Tony</forename><surname>Hey</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Stewart</forename><surname>Tansley</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Kristin</forename><surname>Tolle</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2009">2009</date>
		</imprint>
		<respStmt>
			<orgName>Redmond, Microsoft Research</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<monogr>
		<author>
			<persName><forename type="first">Zeljko</forename><surname>Ivezic</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Andrew</forename><forename type="middle">J</forename><surname>Connolly</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Jacob</forename><forename type="middle">T</forename><surname>Vanderplas</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Alexander</forename><surname>Gray</surname></persName>
		</author>
		<title level="m">Statistics, data mining, and machine learning in astronomy: A practical Python guide for the analysis of survey data</title>
				<imprint>
			<publisher>Princeton University Press</publisher>
			<date type="published" when="2014">2014</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b9">
	<analytic>
		<title level="a" type="main">Methods and tools for hypothesis-driven research support: a survey</title>
		<author>
			<persName><forename type="first">Leonid</forename><surname>Kalinichenko</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Dmitry</forename><surname>Kovalev</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Dana</forename><surname>Kovaleva</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Oleg</forename><surname>Malkov</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">Informatica and Appications</title>
		<imprint>
			<biblScope unit="volume">9</biblScope>
			<biblScope unit="issue">1</biblScope>
			<biblScope unit="page" from="28" to="54" />
			<date type="published" when="2015">2015</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b10">
	<analytic>
		<title level="a" type="main">Estimating attributes: analysis and extensions of RELIEF</title>
		<author>
			<persName><forename type="first">Igor</forename><surname>Kononenko</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the European conference on machine learning (ECML&apos;94)</title>
				<meeting>the European conference on machine learning (ECML&apos;94)<address><addrLine>Catania, Italy</addrLine></address></meeting>
		<imprint>
			<date type="published" when="1994">1994</date>
			<biblScope unit="page" from="171" to="182" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b11">
	<analytic>
		<title level="a" type="main">Feature selection with a perceptron neural net</title>
		<author>
			<persName><forename type="first">Manuel</forename><surname>Mejia-Lavalle</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Enrique</forename><surname>Sucar</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Gustavo</forename><surname>Arroyo</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the international workshop on feature selection for data mining: Interfacing Machine Learning and Statistics</title>
				<meeting>the international workshop on feature selection for data mining: Interfacing Machine Learning and Statistics</meeting>
		<imprint>
			<date type="published" when="2006">2006</date>
			<biblScope unit="page" from="131" to="135" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b12">
	<analytic>
		<title level="a" type="main">Feature Selection Algorithms: A Survey and Experimental Evaluation. Data Mining</title>
		<author>
			<persName><forename type="first">C</forename><surname>Luis</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Lluis</forename><surname>Molina</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Angela</forename><surname>Belanche</surname></persName>
		</author>
		<author>
			<persName><surname>Nebot</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of 2002 IEEE International Conference on Data Mining</title>
				<meeting>2002 IEEE International Conference on Data Mining</meeting>
		<imprint>
			<date type="published" when="2002">2002. 2002</date>
			<biblScope unit="page" from="306" to="313" />
		</imprint>
	</monogr>
	<note>ICDM 2003</note>
</biblStruct>

<biblStruct xml:id="b13">
	<analytic>
		<title level="a" type="main">Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy</title>
		<author>
			<persName><forename type="first">Hanchuan</forename><surname>Peng</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Fuhui</forename><surname>Long</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Chris</forename><surname>Ding</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">IEEE Transactions on Pattern Analysis and Machine Intelligence</title>
		<imprint>
			<biblScope unit="volume">27</biblScope>
			<biblScope unit="issue">8</biblScope>
			<biblScope unit="page" from="1226" to="1238" />
			<date type="published" when="2005">2005</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b14">
	<analytic>
		<title level="a" type="main">Variable selection using SVM-based criteria</title>
		<author>
			<persName><forename type="first">Alain</forename><surname>Rakotomamonjy</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">The Journal of Machine Learning Research</title>
		<imprint>
			<biblScope unit="volume">3</biblScope>
			<biblScope unit="page" from="1357" to="1370" />
			<date type="published" when="2003">2003</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b15">
	<analytic>
		<title level="a" type="main">FCCE: Highly Scalable Distributed Feature Collection and Correlation Engine for Low Latency Big Data Analytics</title>
		<author>
			<persName><forename type="first">Douglas</forename><surname>Schales</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Xin</forename><surname>Hu</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Jiyong</forename><surname>Jang</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Reiner</forename><surname>Sailer</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Marc</forename><surname>Stoecklin</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Ting</forename><surname>Wang</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceeding of 2015 IEEE 31st International Conference on Data Engineering</title>
				<meeting>eeding of 2015 IEEE 31st International Conference on Data Engineering<address><addrLine>Seoul,</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2014">2014</date>
			<biblScope unit="page" from="1316" to="1327" />
		</imprint>
		<respStmt>
			<orgName>IBM Research Report</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b16">
	<analytic>
		<title level="a" type="main">Variable selection: A statistical dependence perspective</title>
		<author>
			<persName><forename type="first">Sohan</forename><surname>Seth</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Jose</forename><forename type="middle">C</forename><surname>Prıncipe</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the international conference of machine learning and applications (ICMLA&apos;10)</title>
				<meeting>the international conference of machine learning and applications (ICMLA&apos;10)</meeting>
		<imprint>
			<date type="published" when="2010">2010</date>
			<biblScope unit="page" from="931" to="936" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b17">
	<analytic>
		<title level="a" type="main">A Preliminary Performance Comparison of Five Machine Learning Algorithms for Practical IP Traffic Flow Classification</title>
		<author>
			<persName><forename type="first">Nigel</forename><surname>Williams</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Sebastian</forename><surname>Zander</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Grenville</forename><surname>Armitage</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="j">ACM SIGCOMM Computer Communication Review</title>
		<imprint>
			<biblScope unit="volume">36</biblScope>
			<biblScope unit="issue">5</biblScope>
			<biblScope unit="page" from="5" to="16" />
			<date type="published" when="2006">2006</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b18">
	<monogr>
		<title level="m" type="main">Data mining: practical machine learning tools and techniques</title>
		<author>
			<persName><forename type="first">Ian</forename><forename type="middle">H</forename><surname>Witten</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Eibe</forename><surname>Frank</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2005">2005</date>
			<publisher>Morgan Kaufmann Publishers</publisher>
			<pubPlace>San Francisco</pubPlace>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b19">
	<analytic>
		<title level="a" type="main">Searching for interacting features</title>
		<author>
			<persName><forename type="first">Zheng</forename><surname>Zhao</surname></persName>
		</author>
		<author>
			<persName><forename type="first">Huan</forename><surname>Liu</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the international joint conference on artificial intelligence (IJCAI&apos;07)</title>
				<meeting>the international joint conference on artificial intelligence (IJCAI&apos;07)<address><addrLine>Hyderabad, India</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2007">2007</date>
			<biblScope unit="page" from="1156" to="1161" />
		</imprint>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
