<?xml version="1.0" encoding="UTF-8"?>
<TEI xml:space="preserve" xmlns="http://www.tei-c.org/ns/1.0" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://www.tei-c.org/ns/1.0 https://raw.githubusercontent.com/kermitt2/grobid/master/grobid-home/schemas/xsd/Grobid.xsd"
 xmlns:xlink="http://www.w3.org/1999/xlink">
	<teiHeader xml:lang="en">
		<fileDesc>
			<titleStmt>
				<title level="a" type="main">Автоматическая классификация эллиптических конструкций в русской спонтанной речи Automatic Classification of Elliptical Constructions in Russian Spontaneous Speech</title>
			</titleStmt>
			<publicationStmt>
				<publisher/>
				<availability status="unknown"><licence/></availability>
			</publicationStmt>
			<sourceDesc>
				<biblStruct>
					<analytic>
						<author>
							<persName><forename type="first">Алина</forename><surname>Путинцева</surname></persName>
						</author>
						<author>
							<persName><forename type="first">Alina</forename><surname>Putintseva</surname></persName>
							<email>aaputintseva@niuitmo.ru</email>
						</author>
						<author>
							<persName><forename type="first">Любовь</forename><surname>Ковригина</surname></persName>
						</author>
						<author>
							<persName><forename type="first">Liubov</forename><surname>Kovriguina</surname></persName>
							<email>lyukovriguina@corp.ifmo.ru</email>
						</author>
						<author>
							<persName><forename type="first">Иван</forename><surname>Шилин</surname></persName>
						</author>
						<author>
							<persName><forename type="first">Ivan</forename><surname>Shilin</surname></persName>
							<email>shilinivan@corp.ifmo.ru</email>
						</author>
						<author>
							<affiliation key="aff0">
								<orgName type="department" key="dep1">Университет ИТМО</orgName>
								<orgName type="department" key="dep2">Санкт-Петербург</orgName>
								<orgName type="institution" key="instit1">Российская</orgName>
								<orgName type="institution" key="instit2">Федерация</orgName>
							</affiliation>
						</author>
						<author>
							<affiliation key="aff1">
								<orgName type="institution">ITMO University</orgName>
								<address>
									<settlement>Saint-Petersburg</settlement>
									<country key="RU">Russian Federation</country>
								</address>
							</affiliation>
						</author>
						<title level="a" type="main">Автоматическая классификация эллиптических конструкций в русской спонтанной речи Automatic Classification of Elliptical Constructions in Russian Spontaneous Speech</title>
					</analytic>
					<monogr>
						<imprint>
							<date/>
						</imprint>
					</monogr>
					<idno type="MD5">D7492D09A15D9782FE361A6E49FD9314</idno>
				</biblStruct>
			</sourceDesc>
		</fileDesc>
		<encodingDesc>
			<appInfo>
				<application version="0.7.2" ident="GROBID" when="2023-03-23T22:46+0000">
					<desc>GROBID - A machine learning software for extracting information from scholarly documents</desc>
					<ref target="https://github.com/kermitt2/grobid"/>
				</application>
			</appInfo>
		</encodingDesc>
		<profileDesc>
			<textClass>
				<keywords>
					<term>ellipsis detection in spoken Russian</term>
					<term>ellipsis type classification</term>
					<term>linear adjacency features for ellipsis detection</term>
				</keywords>
			</textClass>
			<abstract>
<div xmlns="http://www.tei-c.org/ns/1.0"><p>The paper describes experimental results on ellipsis detection in Russian spontaneous speech. The algorithm, which detects certain types of elliptical constructions in the input data, uses morphological features and features based on linear adjacency of utterance fragments, showing competitive results alongside with the algorithms exploiting parsing results.</p></div>
			</abstract>
		</profileDesc>
	</teiHeader>
	<text xml:lang="en">
		<body>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Аннотация</head><p>В статье описывается эксперимент по автоматическому обнаружению и восстановлению эллиптических конструкций в корпусе спонтанной русской речи. Алгоритм, классифицирующий высказывания по признаку наличия или отсутствия эллипсиса определенного типа, использует признаки, вычисляемые на основании морфологической разметки, что является существенным преимуществом в случаях, когда в рассматриваемых корпусах отсутствует синтаксическая разметка. Качество работы алгоритма сопоставимо с алгоритмом восстановления эллипсиса, использущим информацию о частоте синтаксических связей.</p><p>Ключевые слова: автоматическое обнаружение эллиптических конструкций в русской спонтанной речи, автоматическая классификация эллиптических конструкций 1 Введение. Эллипсис как лингвистическое явление Лингвистическая теория трактует эллипсис как феномен отсутствия: см., напр., определение эллипсиса как "невыраженности тех фрагментов предложения, значение которых может быть восстановлено из контекста" <ref type="bibr" target="#b4">[Testelets, 2011]</ref>. С.В.Чебанов при описании представлений о форме в работе <ref type="bibr" target="#b10">[Chebanov, 1984]</ref> относит стерезис к средствам описания и постижения формы ("Стерезис (лишенность) -свое иное формы"(Аристотель), схожие взгляды на явление эллипсиса встречаются и у других исследователей: "Эллипсис есть значение без формы 1 "[Merchant, 2016].. Можно предположить, что нелинейность речи<ref type="foot" target="#foot_0">2</ref> и стерезис лежат в основе механизмов реализации эллипсиса. Эллипсис, по-видимому, ни в одном языке не подчиняется единому правилу и реализуется в виде нескольких конструкций, которые подчиняются разным правилам и по-разному вписываются (или не вписываются) в принятую исследователем теоретическую модель <ref type="bibr" target="#b4">[Testelets, 2011]</ref>. Возникновение эллипсиса обусловлено стремлением к экономии языковых средств, времени и усилий и повышению эффективности коммуникации: во многих случаях мысль может быть выражена в сокращенной форме и при этом оставаться понятной для слушателя <ref type="bibr" target="#b1">[Bogdanova-Beglaryan, 2014]</ref>. Эллипсис позволяет избавиться от избыточности в речи, и, вероятно, разнообразие эллиптических конструкций (гэппинг, псевдогэппинг, эллипсис вершины именной группы, слусинг и др.) обусловлено прагматическим компонентом высказывания.</p><p>Дополнительная сложность заключается в том, что правила эллипсиса зависят от языка <ref type="bibr" target="#b4">[Testelets, 2011]</ref>. Кроме того, в русском языке существуют схожие с эллипсисом синтаксические явления, и важной задачей является разграничение эллипсиса и таких понятий, как неполные предложения, парцелляция, синтаксический нуль и зевгма <ref type="bibr" target="#b3">[Kasaeva, 2014]</ref>, при этом И.В.Камагина уточняет, что между эллипсисом и сходными явлениями неполноты, имплицитности, зевгмы может не быть четкой границы <ref type="bibr" target="#b6">[Kamagina, 2015]</ref>.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2">Типология эллиптических конструкций</head><p>Общепринятой типологии эллиптических конструкций на данный момент не существует, а в позициях учёных наблюдаются расхождения. В данном разделе собраны типы эллиптических конструкций, выделяемые большинством исследователей.</p><p>В работе <ref type="bibr" target="#b9">[Paducheva, 2004]</ref> предложено разделение эллипсиса на анафорический и ситуативный. Первый тип предполагает отсылку к другим фрагментам текста и связь опущенных элементов высказывания с контекстом слов текущего предложения (1)<ref type="foot" target="#foot_1">3</ref> или соседних предложений (2):</p><p>(1) Второй способ заключается в том что ORACLE поднимает одну таблицу на од на один 1 Далее приведена расширенная цитата в оригинале:"Ellipsis continues to be of central interest to theorists of language exactly because it represents a situation where the usual form/meaning mappings, the algorithms, structures, rules, and constraints that in non-elliptical sentences allow us to map sounds and gestures onto their corresponding meanings, break down. In fact, in ellipsis, the usual mappings seem to be entirely absent. In ellipsis, there is meaning without form" <ref type="bibr" target="#b12">[Merchant, 2016]</ref> инстанс, вторую таблицу (поднимает) -на второй инстанс и пытается как-то по сети это всё рассинхронизовать.</p><p>(2) Ты читал замечательную книжку Стентона Глэнца про медицинскую статистику? Она написана очень доходчиво, там (объясняются ошибки применения статистических методов) на марсианах, на юпитериан на людях с Юпитера, людях с Венеры.</p><p>При ситуативном эллипсисе пропущенный элемент не упоминается в речи эксплицитно и не может быть восстановлен однозначно. Интерпретация таких высказываний, поверхностно-синтаксическая структура которых позволяет квалифицировать их только как фрагменты, возможна лишь при знании ситуации (3-6):</p><p>(3) Покажите! (4) Мне чёрный (хлеб, чай).</p><p>(5) А я (зайду) вон туда. ( <ref type="formula">6</ref>) "Три билборда"лежат в очереди на просмотр, но, говорят, мрачный, депрессивный (фильм) и так далее.</p><p>Задача восстановления ситуативного эллипсиса является наиболее сложной и сводится к анализу прагматического компонента содержания высказывания, дискурс-анализу и анализу экстралингвистического контекста.</p><p>Анафорический эллипсис, в свою очередь, разделяют на несколько видов <ref type="bibr" target="#b4">[Testelets, 2011]</ref>, <ref type="bibr" target="#b11">[Testelets et al., 2005]</ref>, которые перечислены ниже.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.1">Эллипсис составляющих именной группы</head><p>Эллипсис составляющих именной группы "с сохранением представителя"(англ. noun ellipsis, N-ellipsis, noun phrase ellipsis, NPE ) может возникнуть в предложении (предложениях) с повторяющимися существительными или именными группами и реализуется как опущение одной из составляющих (часто -существительного-вершины именной группы, см.примеры (7-9). При этом в эллиптических предложениях сохраняется представитель пропущенной составляющей, обладающий теми же грамматическими категориями, что и она сама. В качестве представителя могут выступать:</p><p>-прилагательное, местоимение или причастие, согласующееся в числе, роде и падеже с опущенной составляющей: (7) "Не будет никакого цветового кодирования, а если и будет, то минимальное (кодирование)" ;</p><p>-числительное, согласующееся в падеже и/или роде (8-9) с опущенной составляющей: (8) "теоретически, две (недели), может, три недели"; (9) "ну, я заплатил за самолет около двадцати тысяч, а зимой он не стоит и восьми (тысяч) ";</p><p>-генитивная конструкция<ref type="foot" target="#foot_2">4</ref> (или ее фрагмент), входящая в более крупную именную группу, в данном случае восстановлению подлежит именная группа, содержащая генитивную конструкцию: (10) "смотри, в этой папке (находятся) документы прошлого года, а в этой -(документы) текущего (года) ";</p><p>-существительное, при котором элиминируется синтаксическая группа или целая определительная клауза, при этом существительное-представитель имеет то же число и падеж, что и существительное-вершина в полной конструкции: (11) "Слева вот во втором ряду на фотографии -племянница брата, а в первом по центру -дочь (брата)".</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.2">Слусинг</head><p>Слусинг (англ. sluicing) эллиптическая конструкция, в которой зависимая клауза со специальным косвенным вопросом заменяется вопросительно-относительным местоимением (или местоимением с предлогом) <ref type="bibr" target="#b13">[Kibrik et al., 2017]</ref>. "Предложение стирается целиком, остается только вопросительное местоимение" <ref type="bibr" target="#b11">[Testelets et al., 2005]</ref>, см. примеры (12, 13) ниже:</p><p>(12) Кто-то тебе звонил, но я не знаю, кто (тебе звонил).</p><p>(13) Он вроде как собирался уехать в командировку, только вот когда (он собирался уехать)...</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.3">Эллипсис глагольной группы, стриппинг, гэппинг и псевдогэппинг</head><p>Четыре перечисленных типа эллиптических конструкций (VP-эллипсис, стриппинг, гэппинг и псевдогэппинг) связаны с исключением глагола, как изолированного, так и в составе глагольных групп и целых клауз (о различительных тестах между этими конструкциями, см., напр., работы Т.Графа<ref type="foot" target="#foot_3">5</ref> ). Стриппинг наблюдается в тех случаях, когда из высказывания удаляется неначальный конъюнкт сочинительной конструкции (в общем случае, все неначальные конъюнкты) <ref type="bibr" target="#b12">[Merchant, 2016</ref><ref type="bibr" target="#b14">] [Kolokonte, 2008]</ref>, при этом сочинительная конструкция может состоять как из клауз ( <ref type="formula">14</ref>), так и из синтаксических групп меньшего объема: (14) Я готовился всю ночь, и они тоже (готовились всю ночь).</p><p>В английском языке некоторые исследователи не различают стриппинг и эллипсис глагольной группы (V P -ellipsis) <ref type="bibr" target="#b14">[Kolokonte, 2008]</ref>. При гэппинге (англ. gapping) из высказывания удаляется "вершина одной или нескольких неначальных сочиненных составляющих" <ref type="bibr" target="#b15">[Bogdanov, 2012]</ref>, см. пример (15). Псевдогэппинг реализуется схожим образом, но место опущенного фрагмента занимает вспомогательный глагол или связка. В английском языке к гэппингу предъявляется более сильное требование: из высказывания удаляется глагол -вершина неначальной клаузы <ref type="bibr" target="#b14">[Kolokonte, 2008]</ref>. Я.Г.Тестелец указывает, что в русском языке это требование смягчено, и к гэппингу относятся все случаи "внутренних пробелов"независимо от того, опущен предикат или один из аргументов <ref type="bibr" target="#b4">[Testelets, 2011]</ref>, см. пример ( <ref type="formula">16</ref>): (15) Мы, например, записали десять мегабайт час назад и (записали) один мегабайт только что. ( <ref type="formula">16</ref>) Он открывает окно, я закрываю (окно).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.4">Фрагментирование</head><p>Фрагментирование (эллипсис при ответе на вопрос, англ. answer ellipsis) тип эллипсиса, возникающий в диалогах при ответах на вопросы. (17) Кому ты звонил? (Я звонил) Александру Евгеньевичу.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="2.5">Сравнительный эллипсис</head><p>Сравнительный эллипсис (англ. comparative deletion) подразумевает пропуск слов в конструкциях со сравнительной степенью (18) и в конструкциях со сравнительными союзами и частицами ( <ref type="formula">19</ref>):</p><p>(18) В первом зале людей было больше, чем во втором (зале было людей).</p><p>(19) Сидя он спит так же крепко, как и лёжа (он спит).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3">Представление эллиптических конструкций в синтаксически размеченных корпусах</head><p>Методы автоматического восстановления эллипсиса, как правильно, используют корпусы текстов с морфологической, синтаксической и, при наличии, семантической разметкой. Ниже приведены подходы к представлению эллиптических конструкций в корпусе текстов.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.1">Синтаксически размеченный подкорпус Национального корпуса русского языка</head><p>Национальный корпус русского языка (НКРЯ) включает в себя ряд подкорпусов, различающихся составом, видами разметки и способами её получения. В частности, СинТагРус представляет собой синтаксически размеченную часть НКРЯ<ref type="foot" target="#foot_4">6</ref> . Синтаксическая структура каждого предложения корпуса имеет вид дерева зависимостей, узлами которого являются слова, а рёбрами синтаксические отношения между ними. В НКРЯ применяются сходные процедуры для представления эллиптических конструкций, в которых опущенный фрагмент однозначно восстановим из контекста, и эллиптических конструкций, в которых отсутствующий фрагмент может быть восстановлен лишь гипотетически.</p><p>В эллиптичных клаузах опущенные слова восстанавливаются, и им приписывается дополнительный признак фантом: "Например, в случае предложения Я купил чемодан, а он сумку между он и сумку вставляется узел КУПИТЬ <ref type="bibr">[V, сов, изъяв, прош, ед, муж, фантом]</ref> с пустым текстовым элементом. От этих фантомных слов проводятся все необходимые связи. Леммы в таких словах совпадают с теми, которые уже встретились в предложении, а отдельные морфологические характеристики могут меняться (так, в предложении Я купил чемодан, а она сумку характеристика муж в новом, фантомном глагольном узле купила заменяется на жен). Подчеркнем, что фантомные слова вводятся только в синтаксическую структуру предложения. Текстовый вид предложения остается неизменным"<ref type="foot" target="#foot_5">7</ref> .</p><p>В случаях, "когда в предложении опущен глагол некоторой размытой семантики, как в следующем тексте: Парочку морей бы еще в Сибирь. Африку можно бы ниже. Индия пусть. (Т. Толстая) добавляется узел, аналогичный фантому , ему приписываются наиболее естественные характеристики, а в качестве леммы пишется НЕОПР-ГЛАГОЛ (неопределенный глагол) и затем в скобках глагол, который является естественной гипотезой . Так, в последнем примере после пусть добавляется узел с леммой НЕОПР-ГЛАГОЛ (ОСТАВАТЬСЯ)"<ref type="foot" target="#foot_6">8</ref> .</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.2">Хельсинкский аннотированный корпус русского языка</head><p>Подход к синтаксической разметке, применяемый в хельсинкском аннотированном корпусе русских текстов ХАНКО, подразумевает параметризацию клауз <ref type="bibr" target="#b16">[Frolova, 2012]</ref>. Каждая клауза имеет такие характеристики, как:</p><p>-роль (самостоятельная, главная, подчинённая); -структура (двусоставная, односоставная, фразеологизированная); -наличие эллипса (эллиптическая клауза).</p><p>Таким образом, положение пропущенных элементов высказываний в текстах ХАНКО не указано явно, а наличие эллиптической конструкции характеризует клаузу в целом.</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="3.3">Представление эллиптический конструкций в стандарте Universal Dependencies</head><p>Основные принципы стандарта Universal Dependencies, касающиеся разметки предложений, содержащих эллиптические конструкции<ref type="foot" target="#foot_7">9</ref> , можно сформулировать следующим образом:  При анализе спонтанной речи традиционные представления о предложении оказываются неприменимы или применимы с трудом, поэтому при разработке алгоритма были использованы контекстные признаки следующих единиц анализа спонтанной речи:</p><p>-контекст слов элементарной дискурсивной единицы; -контекст соседних элементарных дискурсивных единиц; -контекст псевдопредложения; -контекст целого текста (монолога, полилога), моделируемый с помощью векторных представлений.</p><p>Эллипсис относится к темам, активно обсуждаемым научным сообществом. Среди работ авторства российских учёных стоит выделить труды М.Г.Мальковского и его коллег с кафедры алгоритмических языков МГУ им. М.В.Ломоносова, связанные с разработкой системы морфологического и синтаксического анализа Treeton <ref type="bibr" target="#b17">[Mal'kovskij et al., 2014]</ref>, <ref type="bibr" target="#b18">[Mal'kovskij et al., 2012]</ref>. В работе <ref type="bibr" target="#b18">[Mal'kovskij et al., 2012]</ref> описан подход, опирающийся на понятие синтаксической валентности: часть речи словоформы и, при наличии, набор значений её морфологических характеристик определяют, с какими другими словоформами она может быть связана в предложении. Облигаторные валентности, не заполненные в высказывании, авторы предлагают считать показателем эллипсиса. Задача восстановления пропущенных элементов и, таким образом, заполнения свободных валентностей сводится к составлению набора шаблонов и правил, а результатом анализа является совокупность возможных вариантов синтаксического дерева рассматриваемого предложения, каждому из которых поставлено в соответствие некоторое значение вероятности. В работе <ref type="bibr" target="#b19">[Minyajlov, 2016]</ref> рассмотрено обнаружение и восстановление эллиптических конструкций с помощью различных алгоритмов классификации. При этом ведётся разделение анализируемых предложений на два класса нулевые (эллиптические) и обычные . В качестве материала для работы используется синтаксически размеченная часть НКРЯ, содержащая предложения обоих классов. Классификация ведётся на основе как морфологических, так и синтаксических признаков. В качестве значений метрик для каждого предложения рассчитывается:</p><p>-частота слов каждой части речи; -частота связей каждого из возможных типов связей; -частота каждой из возможных пар частей речи среди биграмм; -частота каждой из возможных пар частей речи среди узлов синтаксического дерева, непосредственно связанных друг с другом;</p><formula xml:id="formula_0">-для каждой тройки (p 1 , p 2 , p 3 ) частота троек (v 1 , v 2 , v 3 ), где p i часть речи, v i узел синтаксического дерева, имеющий частеречный тэг (POS-тэг) p i , v 2 непосредственно зависит от v 1 , а v 3 от v 2 (v 1 → v 2 → v 3 ); 6) для каждой пары (r 1 , r 2 ) частота троек (v 1 , v 2 , v 3 ), где r i тип синтаксической связи, v i узел синтаксического дерева, v 1 и v 2 связаны отношением r 1 , v 2 и v 3 отношением r 2 .</formula><p>Классификация производилась без кросс-валидации, корпус был разделен на обучающую и тестовую выборки в соотношении 70% : 30%, использовались следующие алгоритмы:</p><p>-метод k ближайших соседей (k-nearest neighbors algorithm, kNN), -метод опорных векторов (support vector machine, SVM), -деревья принятия решений (decision tree), -метод AdaBoost (adaptive boosting), -бэггинг (bootstrap aggregating).</p><p>Лучшие значения точности классификации автору удалось получить при использовании метода опорных векторов: при разных наборах признаков, указанных выше, точность составила от 0.666 до 0.722 <ref type="bibr" target="#b19">[Minyajlov, 2016]</ref>. В.С.Миняйлов указывает, что "существенно повысить эту точность не удалось, даже за счет добавления признаков или использования различных алгоритмов классификации" <ref type="bibr" target="#b19">[Minyajlov, 2016]</ref>.</p><p>Другой подход к решению проблемы исследования описан в работе <ref type="bibr" target="#b20">[Giuliani et al., 2014]</ref>. Авторы справедливо указывают, что алгоритмы, основанные на использовании результатов парсинга, могут быть неэффективны при обработке спонтанной речи, если были использованы модели синтаксического анализа, разработанные на текстах, появившихся в результате подготовленного рече-/ текстопорождения. Это связано в общем случае с нелинейностью речи и отличающимся набором правил порождения высказываний в спонтанной речи. Ключевая идея предлагаемого ими подхода основывается на том, что псевдопредложение спонтанной речи можно разделить на несколько грамматически правильных фрагментов, стыки которых являются потенциальными позициями для эллипсиса. Таким образом, поиск пропущенных слов сводится к выделению с начала и конца псевдопредложения таких подстрок максимальной длины, которые могут быть корректно интерпретированы парсером.</p><p>5 Алгоритм обнаружения эллиптических конструкций спонтанной русской речи</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.1">Описание алгоритма и данных</head><p>Разработанный алгоритм состоит из двух основных модулей: модуля извлечения признаков и модуля классификации. Вспомогательные модули включают модули загрузки и выгрузки данных, модуль обмена данными. На вход алгоритму поступает размеченное псевдопредложение из корпуса PARS <ref type="bibr" target="#b8">[Kovriguina et al., 2018]</ref> в формате CoNLL-U<ref type="foot" target="#foot_8">10</ref> . Используя только контекстную и морфологическую информацию, метод извлечения признаков (об используемых признаках см. подраздел 5.2) анализирует входные данные и записывает соответствующие значения в вектор признаков. Метки класса в датасете были проставлены вручную. Датасет включает 60 примеров с гэппингом, 40 с N -эллипсисом и 200 -без эллипсиса.</p><p>Следует дать некоторые пояснения о псевдопредложении, принятом в качестве операциональной структуры в корпусе PARS и некоторых других корпусах <ref type="bibr" target="#b22">[Shitaoka et al, 2004]</ref>, <ref type="bibr" target="#b8">[Kovriguina et al., 2018]</ref>. Фразовая структура отдельной элементарной дискурсивной единицы может быть достаточно примитивной, но при синтаксическом анализе спонтанной речи часто бываает необходимо установить связи синтаксических групп текущей ЭДЕ с синтаксическими группами соседних ЭДЕ. Уровень разметки, соответствующий псевдопредложению, был введен с целью адекватного представления связей на уровне микросинтаксиса (в смысле И.А.Мельчука) и соблюдения требований, предъявляемых к формату CoNLL-U. Элементарные дискурсивные единицы a и b объединяется в псевдопредложение, если в a и b существуют словоформы, связанные синтаксическим отношением из списка Universal Dependencies 11 , или перечня дополнительных синтаксических отношений из корпуса PARS 12 .</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.2">Признаковое пространство</head></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Признак 1</head><p>Среднее расстояние между адъективом и его потенциальной вершиной Атрибутивные слова (или адъективы: прилагательные, местоимения-прилагательные, числительные-прилагательные, причастия глаголов, анафорические местоимения типа он, который 13 ) в русском языке, как правило, линейно близки к их вершинам. Тогда можно предположить, что отсутствие потенциальной вершины в пределах определённого окна c некоторой долей вероятности свидетельствует о её опущении и, таким образом, наличии в предложении (псевдопредложении) эллипсиса вершины именной группы.</p><p>При этом, согласно результатам анализа текстов корпуса СинТагРус, в предложениях без эллиптических конструкций адъективы, для которых в стандарте Universal Dependencies используются синтаксические отношения amod и nummod:gov, в подавляющем большинстве случаев зависят от существительных (см. таблицу 1). При расчете относительной частоты f в столбце 4 количество связей N рассчитывается как количество случаев, когда адъектив, имеющий POS-тег, указанный в столбце 1, связано синтаксическим отношением из столбца 2, с вершиной X, имеющей один из POS-тегов из стандарта Universal Dependencies.</p><p>Распределения расстояний между адъективом и его вершиной, как в корпусе SynTagRus,так и в корпусе спонтанной речи PARS позволяют утверждать, что адъективы чаще всего находятся на расстоянии одного или двух словоупотреблений от своей вершины (см. рисунки 2, 4).</p><p>На основании данных, приведённых выше, были сформулированы шаблоны именных групп с адъективами (см. таблицу 2).</p><p>[6pt]article Значение признака рассчитывается как среднее расстояние от каждого слова, относящегося к одной из частей речи, перечисленных в столбце 1 таблицы 2, до его потенциальной вершины. Под потенциальной вершиной понимается ближайшее слово, часть речи 11 http://universaldependencies.org/u/dep/ 12 https://github.com/MANASLU8/PARS/blob/master/additional_relations_spoken_syntax 13 См. Русская корпусная грамматика http://rusgram.ru/ Рис. 2: Распределение расстояний между определениями и их вершинами в корпусе SynTagRus Рис. 3: Распределение расстояний между определениями и их вершинами в корпусе PARS которого приведена в соответствующей строке столбца 2 таблицы 2, такое, что перечисленные в столбце 3 таблицы 2 словоизменительные признаки обоих слов совпадают. Чем больше будет полученное значение, тем выше вероятность N -эллипсиса. Очевидно, что поиск потенциальной вершины имеет смысл только в рамках ближайшего контекста. В ходе работы было сделано предположение, что его протяжённость в словоупотреблениях в большинстве случаев ограничивается числом Ингве-Миллера (7 ± 2), характеризующим объем кратковременной памяти человека <ref type="bibr" target="#b22">[Miller, 1956]</ref>.</p><p>Для экспериментальной проверки предположения было построено распределение расстояний между фантомными (восстановленными) узлами и их вершинами в корпусе Син-ТагРус (Рисунок 4).</p><p>Как видно из рисунка 4, большая часть фантомных узлов находится на расстоянии 3-7 слов от вершин, от которых они зависят.</p><p>Признак 2 Среднее расстояние между повторяющимися словами При расчёте значений рассмотренного выше признака было замечено, что иногда отсутствие по-  </p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Группа признаков</head><p>Частота различных частей речи в псевдопредложении Метки частей речи используются во многих работах в качестве маркера эллипсиса <ref type="bibr" target="#b19">[Minyajlov, 2016]</ref>, <ref type="bibr" target="#b17">[Mal'kovskij et al., 2014]</ref>. Аналогичную группу признаков было решено ввести и в разрабатываемое признаковое пространство. Частеречная структура псевдопредложения кодируется в виде вектора, в котором указываются частоты частей речи, встретившихся в данном псевдопредложении (если в нем не встретились слова определенной части речи, то в векторе на их месте записываются нули).</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.3">Классификация</head><p>Каждая строка в обучающей выборке соответствует псевдопредложению из корпуса PARS и представляет собой вектор признаков, описанных в разделе 5.2, и метку класса (Nэллипсис, V P -эллипсис, отсутствие эллипсиса).</p><p>Для обучения классификатора и оценки признакового пространства были использованы алгоритмы классификации, ранее применявшиеся для решения задач идентификации и восстановления эллипсиса в работах <ref type="bibr" target="#b19">[Minyajlov, 2016]</ref>, <ref type="bibr" target="#b21">[Nielsen, 2004]</ref>. Обучение классификаторов проводилось с использованием процедуры скользящего контроля по 10 блокам<ref type="foot" target="#foot_10">16</ref> . Для классификации использовались следующие пакеты из языка R: rpart, class, e1071, adabag, kernlab<ref type="foot" target="#foot_11">17</ref> .</p><p>-метод k-ближайших соседей (k-nearest neighbors algorithm, kNN), -метод опорных векторов (support vector machine, SVM), -деревья принятия решений (decision tree), -метод AdaBoost (adaptive boosting), -бэггинг (bootstrap aggregating).</p><p>Для оценки качества работы классификатора и применимости созданного признакового пространства и собранного набора данных использовались метрики точности (1), полноты (2) и F-меры (3):</p><formula xml:id="formula_1">P recision = T P T P + F P ,<label>(1)</label></formula><formula xml:id="formula_2">Recall = T P T P + F N ,<label>(2)</label></formula><formula xml:id="formula_3">F = 2 • P recision • Recall P recision + Recall ,<label>(3)</label></formula></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head n="5.4">Результаты и обсуждения</head><p>Результаты оценки качества автоматической классификации для каждого из используемых алгоритмов приведены в таблице 3. Лучшие результаты были получены с помощью методов, строящих композиции классификаторов (бустинг, бэггинг).</p><p>Таблица 3: Результаты классификации типов эллиптических конструкций в русской спонтанной речи</p></div>
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Классификатор</head><p>Вид эллипсиса V P -эллипсис N -эллипсис Без эллипсиса P R F 1 P R F 1 P R F 1 Деревья решений 0,89 0,71 0,79 0,65 0,86 0,74 0,70 0,71 0,70 k-ближайших соседей, k=3 0,89 0,74 0,81 0,76 0,69 0,72 0,71 0,92 0,80 Метод опорных векторов (SVM) 0,89 0,68 0,77 0,50 0,33 0,40 0,51 0,81 0,63 AdaBoost 0,90 0,81 0,85 0,81 0,86 0,83 0,73 0,79 0,76 Бэггинг 0,92 0,82 0,87 0,75 0,92 0,83 0,76 0,71 0,73</p><p>Как видно из таблицы 3, результаты классификации превосходят результаты, полученные другими авторами <ref type="bibr" target="#b19">([Minyajlov, 2016]</ref>, см. тж. раздел 4). Однако, прямое сравнение провести невозможно, так как предыдущие эксперименты проводились на материале корпуса СинТагРус, который значительно больше и разнообразнее по своей структуре. Учитывая это, можно говорить о том, что основным результатом данной работы является пробная оценка качества классификации эллиптических конструкций на материале спонтанной речи с помощью признаков, вычисляемых исключительно на морфологических и линейных характеристиках высказываний.</p></div><figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_0"><head></head><label></label><figDesc>obj (object) и iobj (indirect object). Дальнейшая очерёдность выглядит следующим образом: obl → advmod → csubj → xcomp → ccomp → advcl. Рис. 1: Иллюстрация принципа переноса связей вершины именной группы, подвергшейся эллипсису, на зависящее от нее прилагательное в предложении Он пьет зеленый чай, а я пью черный чай из Англии. Кроме того, стандарт UD включает в себя так называемое расширенное представление (enhanced dependencies), допускающее ввод дополнительных (вспомогательных) узлов на местах пропущенных (процедура аналогична подходу, принятому в НКРЯ).4 Обзор подходов к автоматическому обнаружению и восстановлению эллипсисаЗадача восстановления эллипсиса в большинстве случаев не представляет особой трудности для человека, но достаточно сложна при машинной обработке. Однако, в обоих случаях используется один и тот же приём восстановление из контекста. При этом восстановление разных видов эллипсиса подразумевает привлечение различных видов контекста, а сложность поставленной задачи варьируется в зависимости от вида контекста. Выделяют следующие виды контекста[Mal'kovskij et al.,  </figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" xml:id="fig_1"><head>Рис. 4 :</head><label>4</label><figDesc>Расстояние между фантомным узлом и его вершиной в корпусе SynTagRus Рис. 5: Пример разметки речевого сбоя -повтора из корпуса спонтанной русской речи PARS 14 из наиболее распространённых маркеров стриппинга пропуск повторяющегося глагола/глагольной группы, за которым следует наречие тоже . Рисунок 6 демонстрирует соотношение POS-тэгов в рамках множества вершин слова тоже корпуса СинТагРус. Стоит отметить, что все перечисленные на нём части речи, кроме глагола, по-видимому, могут быть вершиной этого наречия только в эллиптических конструкциях. Рис. 6: Распределение вершин наречия "тоже"по меткам частей речи Анализ расстояний между наречием тоже и его вершиной в неэллиптических предложениях (т. е. в предложениях, где она выражена глаголом) свидетельствует о том, что в большинстве случаев тоже соседнее с глаголом слово.</figDesc></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="11,163.10,69.18,299.70,185.31" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0"><head></head><label></label><figDesc></figDesc><graphic coords="11,163.02,312.76,299.86,185.19" type="bitmap" /></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_0"><head></head><label></label><figDesc>1) Если исключённая вершина синтаксического дерева не имеет зависимых вершин, никакая дополнительная разметка не осуществляется. 2) Если исключённая вершина имеет зависимые вершины, одна из них принимает на себя роль опущенного элемента. 3) Если исключённая вершина является предикатом, а заменившая её вершина одним из её актантов или адъюнктов, для связи с остальными элементами используется зависимость orphan. Стандарт регламентирует представление конструкций с эллипсисом в именных группах и эллипсис в клаузах. Согласно стандарту, при опущении существительного его роль в дереве передаётся в следующем порядке: amod → nummod → det → nmod → case. Другими словами, наиболее приоритетным среди потенциальных замещающих узлов является узел, связанный с опускаемым отношением amod, наименее приоритетным case.</figDesc><table /><note>Механизм замещения вершины при N-эллипсисе изображён на рисунке 1. В случае опущения предиката наиболее вероятный претендент на его роль его субъект (nominal subject nsubj). Далее в порядке убывания приоритетов идут оставшиеся аргументы</note></figure>
<figure xmlns="http://www.tei-c.org/ns/1.0" type="table" xml:id="tab_2"><head></head><label></label><figDesc>Для идентификации предложений с гэппингом было решено ввести признак, основанный на удалённости аргументов (core arguments) от предиката. Cтандарт UD предусматривает для них три синтаксических отношения: субъект (nsubj ), объект (obj ) и косвенное дополнение (iobj ) 15 . Значение признака рассчитывается как усреднённое расстояние от существительных и местоимений до ближайших глаголов.</figDesc><table><row><cell cols="4">Таблица 2: Шаблоны для вычисления значения признака</cell></row><row><cell></cell><cell></cell><cell></cell><cell>Общие</cell><cell>Примеры</cell></row><row><cell cols="2">Метка части речи и морфологические признаки атрибута</cell><cell>Метка части речи потенциальной вершины</cell><cell>слово-изменительные категории атрибута и</cell><cell>предложений с эллипсисом вершины именной</cell></row><row><cell></cell><cell></cell><cell></cell><cell>вершины</cell><cell>группы</cell></row><row><cell>1</cell><cell></cell><cell>2</cell><cell>3</cell><cell>4</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>Я предпочитаю</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>яркие цвета,</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>он чаще</cell></row><row><cell cols="2">Прилагательное, Причастие, порядковое числительное, указательное местоимение</cell><cell>Существительное, собственное существительное</cell><cell>Gender, Number, Case</cell><cell>одевается в чёрный. Вчера мы шли по</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>этой улице,</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>а сегодня</cell></row><row><cell></cell><cell></cell><cell></cell><cell></cell><cell>идём по той.</cell></row><row><cell cols="2">Количественное числительное</cell><cell>Существительное, собственное существительное, порядковое числительное</cell><cell>Gender, Number, Case</cell><cell>Чаще за занятие удаётся разобрать одну тему, но иногда успеваем изучить две или три.</cell></row><row><cell cols="5">тенциальной вершины в ближайшем окружении наблюдается при повторе речевом сбое.</cell></row><row><cell cols="5">При этом такое предложение не обязательно содержит эллипсис. В примере на рисунке</cell></row><row><cell cols="5">5 первое словоупотребление две относится к речевому сбою -повтору (возможно, го-</cell></row><row><cell cols="5">ворящий хотел перестроить высказывание, но вербализованная часть позволяет говорить</cell></row><row><cell cols="5">только о повторе), поэтому, несмотря на наличие формальных маркеров, N -эллипсис в</cell></row><row><cell cols="5">данном примере отсутствует. В корпусе PARS повторы рамечаются с помощью дополни-</cell></row><row><cell cols="4">тельного синтаксического отношения repair : repetition.</cell></row><row><cell cols="5">Для учёта таких случаев было решено ввести признак, отвечающий за повторы адъ-</cell></row><row><cell cols="5">ективов. Значение признака в корпусе без синтаксической разметки определяется как</cell></row><row><cell cols="5">усреднённое расстояние от каждой словоформы, подходящей под критерии из столбца</cell></row><row><cell cols="4">1 таблицы 2, до ближайшей к ней словоформы с такой же леммой.</cell></row><row><cell>Признак 3</cell><cell cols="4">Среднее расстояние между корневыми актантами и их по-</cell></row><row><cell cols="5">тенциальными вершинами Признак 4 Расстояние от наречия тоже до ближайшего глагола Одна</cell></row></table></figure>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="2" xml:id="foot_0"> С.В.Чебанов, личное сообщение, 2005 г.   </note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="3" xml:id="foot_1">Примеры эллиптических конструкций приведены из корпуса PARS<ref type="bibr" target="#b8">[Kovriguina et al., 2018]</ref>, за исключением примеров из литературных произведений, приведенных в цитируемых работах. Части высказывания, подвергшиеся эллипсису, восстановлены в скобках курсивом.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="4" xml:id="foot_2">Об эллипсисе в генитивных конструкциях смотри подробнее труды Е.В.Падучевой<ref type="bibr" target="#b9">[Paducheva, 2013]</ref>.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="5" xml:id="foot_3">http://thomasgraf.net/doc/other/ellipsis.pdf</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="6" xml:id="foot_4">http://ruscorpora.ru/instruction-main.pdf</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="7" xml:id="foot_5">http://www.ruscorpora.ru/instruction-syntax.html</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="8" xml:id="foot_6">\T2A\CYRT\T2A\cyra\T2A\cyrm\T2A\cyrzh\T2A\cyre.</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="9" xml:id="foot_7">http://universaldependencies.org/v2/ellipsis.html</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="10" xml:id="foot_8">http://universaldependencies.org/format.html</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="15" xml:id="foot_9">http://universaldependencies.org/u/dep/</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="16" xml:id="foot_10">http://www.machinelearning.ru/wiki/index.php?title=CV</note>
			<note xmlns="http://www.tei-c.org/ns/1.0" place="foot" n="17" xml:id="foot_11">https://cran.r-project.org/web/packages/available_packages_by_name.html</note>
		</body>
		<back>

			<div type="acknowledgement">
<div xmlns="http://www.tei-c.org/ns/1.0"><head>Acknowledgments</head><p>Статья выполнена по результатам проекта № 16-36-60055, поддержанного РФФИ в 2016-2018 гг.</p></div>
			</div>

			<div type="references">

				<listBibl>

<biblStruct xml:id="b0">
	<analytic>
		<title level="a" type="main">Slovar&apos;-spravochnik lingvisticheskih terminov: Posobie dlya uchitelya [Dictionary-reference of linguistic terms</title>
		<author>
			<persName><forename type="first">'</forename><surname>Rozental</surname></persName>
			<affiliation>
				<orgName type="collaboration">Список литературы</orgName>
			</affiliation>
		</author>
	</analytic>
	<monogr>
		<title level="m">Russian) = Розенталь Д., Теленкова М. Словарь-справочник лингвистических терминов: Пособие для учителя. М</title>
				<imprint>
			<publisher>Просвещение</publisher>
			<date type="published" when="1985">1985. 1985. 1985. 1985</date>
			<biblScope unit="page">357</biblScope>
		</imprint>
	</monogr>
	<note>Manual for teachers</note>
</biblStruct>

<biblStruct xml:id="b1">
	<monogr>
		<author>
			<persName><forename type="first">N</forename><surname>Bogdanova-Beglaryan ; Bogdanova-Beglaryan</surname></persName>
		</author>
		<title level="m">Eshche raz o zakone ekonomii v povsednevnoj spontannoj rechi // Kommunikativnye issledovaniya [Once again on the economy law in everyday spontaneous speech // Communicative Research</title>
				<imprint>
			<date type="published" when="2014">2014. 2014. 2014. 2014</date>
			<biblScope unit="page" from="241" to="251" />
		</imprint>
	</monogr>
	<note>Еще раз о законе экономии в повседневной спонтанной речи // Коммуникативные исследования</note>
</biblStruct>

<biblStruct xml:id="b2">
	<analytic>
		<title level="a" type="main">Automatic Ellipsis Resolution: Recovering Covert Information from Text</title>
		<author>
			<persName><surname>Mcshane</surname></persName>
		</author>
		<idno>-2015</idno>
	</analytic>
	<monogr>
		<title level="m">// AAAI</title>
				<imprint>
			<date type="published" when="2015">2015. 2015</date>
			<biblScope unit="page" from="572" to="578" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b3">
	<analytic>
		<author>
			<persName><forename type="first">Z</forename><surname>Kasaeva ; Kasaeva</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Russian) = Касаева З. Об основных чертах устной спонтанной речи (общие замечания) //Вестник Московского государственного областного университета</title>
		<title level="s">Vestnik of the Moscow State Regional University</title>
		<meeting><address><addrLine>Серия</addrLine></address></meeting>
		<imprint>
			<publisher>Русская филология</publisher>
			<date type="published" when="2014">2014. 2014. 2014. 2014</date>
			<biblScope unit="page" from="241" to="251" />
		</imprint>
	</monogr>
	<note>Ob osnovnyh chertah ustnoj spontannoj rechi (obshchie zamechaniya) //Vestnik Moskovskogo gosudarstvennogo oblastnogo universiteta</note>
</biblStruct>

<biblStruct xml:id="b4">
	<monogr>
		<author>
			<persName><forename type="first">Ya</forename><surname>Testelets ; Testelets</surname></persName>
		</author>
		<title level="m">Ellipsis v russkom yazyke: teoreticheskij i opisatel&apos;nyj podhody //Konferenciya Tipologiya morfosintaksicheskih parametrov : doklad [Ellipsis in Russian: theoretical and descriptive approaches // Conference Typology of morphosyntactic parameters : report</title>
				<editor>
			<persName><surname>Mggu</surname></persName>
		</editor>
		<imprint>
			<date type="published" when="2011">2011. 2011. 2011</date>
		</imprint>
	</monogr>
	<note>Russian) = Тестелец Я.Г. Эллипсис в русском языке: теоретический и описательный подходы //Конференция Типология морфосинтаксических параметров : доклад</note>
</biblStruct>

<biblStruct xml:id="b5">
	<monogr>
		<title level="m" type="main">Fragments and ellipsis // Linguistics and philosophy</title>
		<author>
			<persName><forename type="first">J</forename><surname>Merchant ; Merchant</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2005">2005. 2005. 2005</date>
			<biblScope unit="volume">27</biblScope>
			<biblScope unit="page" from="661" to="738" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b6">
	<monogr>
		<author>
			<persName><forename type="first">I</forename><surname>Kamagina ; Kamagina</surname></persName>
		</author>
		<title level="m">Ellipsis i skhodnye sintaksicheskie yavleniya v sovremennom russkom yazyke //Vestnik RUDN. Seriya: Teoriya yazyka. Semiotika. Semantika [Ellipsis and similar syntactic phenomena in the modern Russian language //Vestnik RUDN. Series: Theory of Language. Semiotics. Semantics</title>
				<imprint>
			<date type="published" when="2015">2015. 2015. 2015</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b7">
	<monogr>
		<title level="m">Russian) = Камагина И. Эллипсис и сходные синтаксические явления в современном русском языке //Вестник РУДН. Серия: Теория языка. Семиотика. Семантика</title>
				<imprint>
			<date type="published" when="2015">2015</date>
			<biblScope unit="page" from="168" to="174" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b8">
	<analytic>
		<title level="a" type="main">Multilevel Annotation in the Corpus for Parsing Russian Spontaneous Speech</title>
		<author>
			<persName><surname>Kovriguina</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">// 20th International Conference, SPECOM 2018</title>
				<editor>
			<persName><forename type="first">E</forename><forename type="middle">V</forename><surname>Paducheva</surname></persName>
		</editor>
		<meeting><address><addrLine>Leipzig, Germany</addrLine></address></meeting>
		<imprint>
			<publisher>Paducheva</publisher>
			<date type="published" when="2013">2018. 2018. 2018. 2013. 2013. 2013</date>
			<biblScope unit="page">166</biblScope>
		</imprint>
	</monogr>
	<note>Proceedings -2018. Russkoe otricatel&apos;noe predlozhenie. M.: Yazyki slavyanskoj kul&apos;tury. Russian negative sentence. M. In Russian) = Падучева Е. Русское отрицательное предложение</note>
</biblStruct>

<biblStruct xml:id="b9">
	<monogr>
		<author>
			<persName><forename type="first">М</forename><surname>Paducheva</surname></persName>
		</author>
		<title level="m">Dinamicheskiye modeli v semantike leksiki. M.: Yazyki slavyanskoj kul&apos;tury</title>
				<editor>
			<persName><forename type="first">E</forename><forename type="middle">V</forename><surname>Paducheva</surname></persName>
		</editor>
		<imprint>
			<date type="published" when="2004">2013. 2004. 2004. 2004. 2004</date>
			<biblScope unit="page">608</biblScope>
		</imprint>
	</monogr>
	<note>Языки славянской культуры</note>
</biblStruct>

<biblStruct xml:id="b10">
	<monogr>
		<author>
			<persName><forename type="first">S</forename><surname>Chebanov ; Chebanov</surname></persName>
		</author>
		<title level="m">Russian) = Чебанов С.В. Представления о форме в естествознании и основания общей морфологии //Orgaanilise vormiteooria Tartu. TRU</title>
				<imprint>
			<date type="published" when="1984">1984. 1984. 1984. 1984</date>
			<biblScope unit="page" from="25" to="41" />
		</imprint>
	</monogr>
	<note>Notion of the forma in natural science and the foundations of general morphology//Orgaanilise vormiteooria Tartu. TRU</note>
</biblStruct>

<biblStruct xml:id="b11">
	<monogr>
		<author>
			<persName><surname>Testelets</surname></persName>
		</author>
		<title level="m">O nekotoryh konstrukciyah so znacheniem neopredelennyh mestoimenij v russkom yazyke: amal&apos;gamy i kvazirelyativy //Doklad k seminaru Teoreticheskaya semantika IPPI RAN [On some constructions with the meaning of indefinite pronouns in the Russian language: amalgams and quasi-relativities // Report to the Seminar</title>
				<imprint>
			<date type="published" when="2005">2005. 2005. 2005. 2005</date>
		</imprint>
	</monogr>
	<note>Тестелец Я., Былинина Е. О некоторых конструкциях со значением неопределенных местоимений в русском языке: амальгамы и квазирелятивы //Доклад к семинару Теоретическая семантика ИППИ РАН</note>
</biblStruct>

<biblStruct xml:id="b12">
	<monogr>
		<author>
			<persName><forename type="first">J</forename><surname>Merchant ; Merchant</surname></persName>
		</author>
		<title level="m">Ellipsis: A survey of analytical approaches // Ms</title>
				<meeting><address><addrLine>Chicago, IL</addrLine></address></meeting>
		<imprint>
			<date type="published" when="2016">2016. 2016. 2016</date>
		</imprint>
		<respStmt>
			<orgName>University of Chicago</orgName>
		</respStmt>
	</monogr>
</biblStruct>

<biblStruct xml:id="b13">
	<analytic>
		<title level="a" type="main">-Litres</title>
		<author>
			<persName><surname>Kibrik</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Rasskazy o snovideniyah: Korpusnoe issledovanie ustnogo russkogo diskursa [Stories about dreams: Case study of spoken Russian discourse</title>
				<imprint>
			<date type="published" when="2017">2017. 2017. 2017. 2017</date>
		</imprint>
	</monogr>
	<note>Russian) = Кибрик А., Подлесская В. Рассказы о сновидениях: Корпусное исследование устного русского дискурса. -Litres</note>
</biblStruct>

<biblStruct xml:id="b14">
	<monogr>
		<title level="m" type="main">Bare argument ellipsis and Information Structure</title>
		<author>
			<persName><forename type="first">M</forename><surname>Kolokonte ; Kolokonte</surname></persName>
		</author>
		<imprint>
			<date type="published" when="2008">2008. 2008. 2008</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b15">
	<analytic>
		<title level="a" type="main">Opisanie geppinga v sisteme avtomaticheskogo perevoda //Po materialam ezhegodnoj Mezhdunarodnoj konferencii</title>
		<author>
			<persName><forename type="first">A</forename><surname>Bogdanov ; Bogdanov</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Russian) = Богданов А. Описание гэппинга в системе автоматического перевода //По материалам ежегодной Международной конференции &quot;Диалог</title>
				<imprint>
			<date type="published" when="2012">2012. 2012. 2012. 2012</date>
			<biblScope unit="page" from="61" to="70" />
		</imprint>
	</monogr>
	<note>Gapping representation in the machine translation system // Proceedings of the annual International Conference &quot;Dialogue</note>
</biblStruct>

<biblStruct xml:id="b16">
	<monogr>
		<author>
			<persName><forename type="first">T</forename><surname>Frolova ; Frolova</surname></persName>
		</author>
		<title level="m">Russian) = Фролова Т. Описание синтаксического отсутствия в корпусах СинТа-гРус и ХАНКО</title>
				<imprint>
			<date type="published" when="2012">2012. 2012. 2012. 2012</date>
		</imprint>
	</monogr>
	<note>Opisanie sintaksicheskogo otsutstviya v korpusah SinTagRus i HANKO</note>
</biblStruct>

<biblStruct xml:id="b17">
	<analytic>
		<title level="a" type="main">//Programmnye produkty i sistemy</title>
		<author>
			<persName><surname>Mal'kovskij</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Миняйлов В. Восстановление эллипсиса как задача автоматической обработки текстов //Программные продукты и системы</title>
				<imprint>
			<date type="published" when="2014">2014. 2014. 2014. 2014</date>
			<biblScope unit="volume">3</biblScope>
			<biblScope unit="page" from="32" to="36" />
		</imprint>
	</monogr>
	<note>Ellipsis recovery as a task of automatic text processing // Software products and systems</note>
</biblStruct>

<biblStruct xml:id="b18">
	<analytic>
		<title level="a" type="main">Modifikaciya algoritma sintaksicheskogo analiza sistemy TREETON, orientirovannaya na analiz ellipticheskih predlozhenij //Sbornik nauchnyh trudov SWorld po materialam mezhdunarodnoj nauchno-prakticheskoj konferencii</title>
		<author>
			<persName><surname>Mal'kovskij</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Родимова П. Модификация алгоритма синтаксического анализа системы TREETON, ориентированная на анализ эллиптических предложений //Сборник научных трудов SWorld по материалам международной научно-практической конференции</title>
				<editor>
			<persName><forename type="first">Л</forename><surname>Кузина</surname></persName>
		</editor>
		<imprint>
			<date type="published" when="2012">2012. 2012. 2012</date>
			<biblScope unit="volume">4</biblScope>
			<biblScope unit="page" from="47" to="50" />
		</imprint>
	</monogr>
	<note>focused on the analysis of elliptic sentences //Proceedings of the SWorld international scientific and practical conference</note>
</biblStruct>

<biblStruct xml:id="b19">
	<analytic>
		<title level="a" type="main">Detection of elliptic sentences using classification algorithms</title>
		<author>
			<persName><forename type="first">V</forename><surname>Minyajlov ; Minyajlov</surname></persName>
		</author>
		<author>
			<persName><surname>Ser</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Обнаружение эллиптических предложений средствами алгоритмов классификации //Проблемы физики, математики и техники</title>
				<imprint>
			<publisher>Информатика</publisher>
			<date type="published" when="2016">2016. 2016. 2016. 2016</date>
			<biblScope unit="page" from="82" to="87" />
		</imprint>
		<respStmt>
			<orgName>Informatika</orgName>
		</respStmt>
	</monogr>
	<note>Obnaruzhenie ellipticheskih predlozhenij sredstvami algoritmov klassifikacii //Problemy fiziki</note>
</biblStruct>

<biblStruct xml:id="b20">
	<analytic>
		<title level="a" type="main">Using Ellipsis Detection and Word Similarity for Transformation of Spoken Language into Grammatically Valid Sentences</title>
		<author>
			<persName><surname>Giuliani</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the 15th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL)</title>
				<meeting>the 15th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL)</meeting>
		<imprint>
			<date type="published" when="2014">2014. 2014. 2014</date>
			<biblScope unit="page" from="243" to="250" />
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b21">
	<analytic>
		<title level="a" type="main">Verb Phrase Ellipsis detection using Automatically Parsed Text</title>
		<author>
			<persName><forename type="first">L</forename><forename type="middle">A</forename><surname>Nielsen ; Nielsen</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Proceedings of the 20th international conference on Computational Linguistics. -Association for Computational Linguistics</title>
				<meeting>the 20th international conference on Computational Linguistics. -Association for Computational Linguistics</meeting>
		<imprint>
			<date type="published" when="1093">2004. 2004. 2004. 1093</date>
		</imprint>
	</monogr>
</biblStruct>

<biblStruct xml:id="b22">
	<analytic>
		<title level="a" type="main">The magical number seven, plus or minus two: Some limits on our capacity for processing information // Psychological review</title>
		<author>
			<persName><forename type="first">G</forename><forename type="middle">A</forename><surname>Miller ; Miller</surname></persName>
		</author>
		<author>
			<persName><surname>Shitaoka</surname></persName>
		</author>
	</analytic>
	<monogr>
		<title level="m">Dependency structure analysis and sentence boundary detection in spontaneous Japanese // Proceedings of the 20th international conference on Computational Linguistics. -Association for Computational Linguistics</title>
				<imprint>
			<date type="published" when="1956">1956. 1956. 1956. 2004. 2004. 2004</date>
			<biblScope unit="volume">63</biblScope>
			<biblScope unit="page">1107</biblScope>
		</imprint>
	</monogr>
</biblStruct>

				</listBibl>
			</div>
		</back>
	</text>
</TEI>
