<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Метод Дельты Бёрроуза для определения авторства анонимных и псевдонимных литературных произведений на русском языке Burrows's Delta for Authorship Attribution of Russian Literary Texts</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Nikita Mamaev</string-name>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>nikita.mamaev</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>@gmail.com</string-name>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Xenia Piotrowska</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>@mail.ru</string-name>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Herzen State Pedagogical University of Russia</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>ITMO University Saint Petersburg</institution>
          ,
          <addr-line>Russian Federation</addr-line>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Saint Petersburg State University</institution>
        </aff>
        <aff id="aff3">
          <label>3</label>
          <institution>The Saint Petersburg Institute for Informatics and Automation of the Russian Academy of Sciences</institution>
        </aff>
      </contrib-group>
      <abstract>
        <p>The intertextual distance measure proposed by J. Burrows (Burrows's Delta and its variants) and its application to authorship attribution of some novels in Russian are under discussion. The research aim is to test classic (Burrows's) Delta and Eder's Delta, which</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>implemented in stylo package for computational text analysis developed for the R software
environment. The novels “Twelve Chairs” and “Golden Calf”, officially attributed to Soviet
writers I. Ilf and E. Petrov, are the research material.</p>
      <p>Keywords: authorship attribution, quantitative analysis, intertextual distance,
Burrows’s Delta, Eder’s Delta, Cosine Delta.</p>
      <p>Аннотация
В работе обсуждается эффективность применения меры межтекстового
расстояния, предложенной Дж. Бёрроузом, при уточнении авторства литературных
произведений на русском языке. Производится тестирование классической Дельты и
Дельты Эдера с помощью пакета для стилеметрического анализа stylo, разработанного
для программной среды R. В качестве материала исследования выступают романы
“Двенадцать стульев” и “Золотой телёнок”, официально приписываемые советским
писателям И. Ильфу и Е. Петрову.</p>
      <p>Ключевые слова: атрибуция, квантитативная анализ, исследование
авторства, межтекстовое расстояние, Дельта Бёрроуза, Дельта Эдера,
косинусДельта.
1</p>
      <p>Введение
Наравне с историко-филологическим анализом материала, установление авторства
анонимных и псевдонимных произведений традиционно опирается на постоянно
расширяемый аппарат квантитативного анализа, который предоставляется точными науками:
математической статистикой, информатикой, а также сравнительно новым направлением –
текст-майнингом. Для решения задач атрибуции используются традиционные
математические инструменты, широко применяемые различными областями знания: манхэттенское
и евклидово расстояния; мера Жаккара; критерии Стьюдента, Сёренсена-Чекановского,
-квадрат и др., а также некоторые средства, предложенные специально для
квантитативного анализа текстов на естественном языке: Дельта Бёрроуза и межтекстовое расстояние
Лаббе [Jannidis et al. 2015; Labbe et al. 2001]. Межтекстовое расстояние, предложенное
Дж. Ф. Бёрроузом [Burrows 2002] в 2001 г. и называемое Дельтой Бёрроуза (Burrows’s
Delta) или классической Дельтой (Classic Delta), получило в стилеметрии довольно
широкое распространение, и за последние 15 лет были получены следующие результаты:
было предложено несколько модификаций названной методики: Eder’s Delta,
Hoover’s Delta, Rotated Delta, Cosine Delta и др. [Hoover 2004; Argamon 2008; Rybicki
et al. 2011; Jannidis et al. 2015], эффективность которых была проверена в сравнении
с манхеттеновским и евклидовым расстояниями на текстах на различных языках
Западной Европы [Evert et al. 2017];
были разработаны открытые программные пакеты для стилеметрического
анализа и атрибуции (stylo для программной среды R и JGAAP, написанный на языке
Java) [Rybicki et al. 2011; Juola 2009];
2
О проблеме авторства романов “Двенадцать стульев”
и “Золотой телёнок”
Согласно официальным литературоведческим данным дилогия, включающая романы
“Двенадцать стульев” и “Золотой телёнок”, была написана советскими
писателямисоавторами Ильёй Ильфом и Евгением Петровым. Впервые романы были опубликованы
в 1928 и 1931 году соответственно.</p>
      <p>Авторы романов, осмеивая тёмные стороны реалий молодого советского государства,
предлагают новый сатирический стиль, отличный от стиля других произведений этого
периода: остроумный и содержательный, насыщенный оптимизмом и тонким юмором. В
этом же ключе работали такие мэтры русской литературы, как М. А. Булгаков и С. С.
Заяицкий, произведения которого пользовались популярностью в 20-х гг. М. А.
Булгаков – автор “трагических буффонад”: ср. “Роковые яйца” (1924). “Собачье сердце” (1925),
“Зойкина квартира” (1925), “Адам и Ева” (1931), “Иван Васильевич” (1936), “Мастер и
Маргарита” (1929-1940), а С. С. Заяицкий – автор ряда опубликованных сатирических
произведений: “Земля без солнца” (ср. альманах “Рол”, 1925, № 4), “Красавица с острова
Люлю” (1926, под псевдонимом: Пьер Дюмьель), “Баклажаны” (1927), “Жизнеописание
Степана Александровича Лососинова” (1928). Оба автора любили литературные
мистификации, закодированные послания читателям и иногда писали под псевдонимами (ср.
Г. П. Ухов - Булгакова или Пьер Дюмьель - Заяицкого).</p>
      <p>Первым изданием, высказавшим сомнения по поводу достоверности авторства
романов, была монография И. Амлински “12 стульев от Михаила Булгакова” [Amlinski 2013]. В
своей книге автор проанализировала данные, касающиеся истории возникновения
замысла, работы над произведениями и их публикации – как общепринятой, так и
альтернативных версий. Также Амлински рассмотрела подготовительные материалы, варианты и
редакции всех произведений М. Булгакова, включая черновики, все произведения Ильфа
и Петрова, а также воспоминания современников об этих писателях. Опираясь на
собранный материал, автор провела глубокий анализ лексического и образного строя
произведений. Выявив схожести в структуре описания сцен, основных образах и мелких деталях
повествования, Амлински заключила, что стиль романов очень близок к авторскому
стилю Булгакова, и является слишком личным, чтобы допустить, что над ними работало два
человека.</p>
      <p>Рассмотрев правдоподобность этой мистификации, литературный критик В.
Козаровецкий [Kozaroveckii 2013] подкрепил выводы Амлински биографическими сведениями:
на время написания романов Булгаков, Ильф и Петров работали в редакции московской
газеты “Гудок”, и вполне могли организовать добровольно-принудительный творческий
союз. Также Козаровецкий отметил, что против Булгакова к середине 20-х гг. была
настроена как советская литературная критика, так и спецслужбы, и по этой причине он не
мог надеяться на возможность публикации своих новых сочинений.
Наконец, альтернативную гипотезу предложил В. Тришин, ссылаясь на архивные
материалы, утверждающие, что писатель С. Заяицкий перед смертью закончил неизвестный
большой, не найденный впоследствии роман, который он мог успеть передать или продать
[Trishin 2017]. Проведенный Тришиным сравнительный историко-филологический анализ
также показал близость авторского стиля Заяицкого к стилю атрибутируемых
произведений.</p>
      <p>Наконец, высказанные критиками сомнения поддерживаются общеизвестной
историей публикации романа “Двенадцать стульев”. В 1926 г. В. Катаев предложил Е. Петрову
и И. Ильфу “поработать литературными неграми над романом про стулья, в которых
спрятаны деньги, и которые нужно найти” [Petrov 2001: 146-147]. И хотя известно, что
работа в соавторстве замедляет процесс создания произведения, в 1928 г. роман был уже
опубликован, стремительно пройдя все этапы публикации и цензуры.
3</p>
      <p>Метод исследования
Мера межтекстового расстояния Дельта, предложенная Дж. Бёрроузом в 2001 [Burrows
2002], была испытана многими западными исследователями на больших объёмах
разнородных текстовых данных:
английская проза начала XX в. [Hoover 2004],
современная английская поэзия [Hoover 2005], а также поэтические произведения на
латыни [Rybicki et al. 2011]
прозаические произведения крупных форм на различных западноевропейских
языках: английском, французском, итальянском, немецком, польском, венгерском
языках, а также на латыни и арабском [Rybicki et al. 2011; Evert et al. 2015; Jannidis et
al. 2015],
политические тексты на английском языке, в том числе атрибуция речей
американских президентов [Savoy 2015].</p>
      <p>Математическое обоснование межтекстового расстояния Дельта формулируется
следующим образом.</p>
      <p>
        Пусть есть множество из n слов, представляющих интерес для исследования,
относительно которых будет вычисляться мера Дельта. Назовём это множество слов fwig ,
определяя fi(D) как частоту слова wi в тексте D, а i – как среднюю частоту слова
по выборке, и i – как стандартное отклонение этой частоты. Тогда стандартизованная
оценка, или z-оценка частоты употребления слова wi в тексте D вычисляется по формуле
(D; D0) = 1 Xn jz(fi(D)) z(fi(D0))j:
n i=1
Таким образом, имеем следующее математическое выражение, соответствующее среднему
абсолютных значений разностей стандартизованных оценок частот слов из fwig между
текстами D и D0 , называемое мерой Дельта:
(1)
(
        <xref ref-type="bibr" rid="ref1">2</xref>
        )
Эту формулу можно преобразовать следующим образом:
(D; D0) = 1 Xn jz(fi(D)) z(fi(D0))j =
n i=1
1 Xn fi(D)
n i=1
i
i
fi(D0)
i
i =
=
n i=1
1 Xn fi(D) fi(D0)
      </p>
      <p>:
i
Это преобразование показывает, что Дельта на самом деле не зависит от средних частот
слов i по выборке, и её можно рассматривать как нормированную меру разницы между
частотами каждого из слов в текстах D и D0 . Также заметим, что поскольку взятие
среднего включает деление суммы на постоянную, равную числу рассматриваемых слов n ,
то при сравнении вычисленных результатов этим действием можно пренебречь. Поэтому
формула преобразуется до вида:
т.е. меру Дельта относительно пары текстов (D; D0) принимаем равной сумме по
множеству слов wi абсолютных значений разностей частот слов между текстами D и D0,
делённых на стандартное отклонение i.</p>
      <p>Используя Дельту в задаче атрибуции, мы делаем попытку сравнить кандидатов на
авторство текста D0 путём оценивания многомерного расстояния до текста D, при этом
каждое измерение (частота употребления слова) масштабируется множителем 1i (т. о.,
небольшие отклонения могут повлиять на результат, если принадлежат измерению с
малым разбросом частот) [Argamon 2008].</p>
      <p>
        Одной из модификаций Дельты является “Дельта Эдера” (Eder’s Delta),
предполагающая увеличенный вес частоупотребимых слов и предложенная учёным М. Эдером для
исследования текстов на языках синтетического типа [Eder et al 2016]:
(En)(D; D0) =
1 Xn
n i=1
jfi(D) fi(D0)j n i + 1
i n
:
Вкупе с Дельтой часто применяются алгоритмы кластеризации, позволяющие
получить результат в виде дендрограммы. В настоящем исследовании был применён алгоритм
кластеризации, формирующий кластеры согласно методу Варда. Была проведена
атрибуция эталонной выборки на произведениях И. Бунина и А. Куприна, которая показала,
что произведения одного автора не объединялись с произведениями другого до тех пор,
пока все его произведения не объединились друг с другом, что послужило основанием к
применению методики к основной атрибуционной проблеме данной работы.
(
        <xref ref-type="bibr" rid="ref2">3</xref>
        )
(4)
(5)
      </p>
      <p>Материалы исследования
Априорные корпусы настоящего исследования были составлены из следующих
произведений:
“1001 день, или Новая Шахерезада” (1927), “Светлая личность” (1928),
“Необыкновенные истории из жизни города Колоколамска” (1928), “Одноэтажная Америка”
(1937) И. Ильфа и Е. Петрова;
“Земля без солнца” (1925), “Красавица с острова Люлю” (1926), “Баклажаны” (1927),
“Человек без площади” (1927), “Женитьба Мечтателева” (1927), “Рука бога Му-га-ша”
(1928), “Внук золотого короля” (1928), “Жизнеописание Степана Александровича
Лососинова” (1928), “Шестьдесят братьев” (1929) С. Заяицкого;
“Собачье сердце” (1925), “Копыто инженера” (1929), “Тайному другу” (1929), “Мастер
и Маргарита” (1940) М. Булгакова,
главы атрибутируемых романов “Двенадцать стульев” и “Золотой теленок”,
записные книжки И. Ильфа (1925–1937).
Построенные атрибуционные гипотезы формулируются следующим образом.
1. Нулевая гипотеза H0 соответствует официальным данным и гласит, что оба романа
были написаны Ильфом и Петровым.</p>
      <p>Предобработка данных для процедуры анализа включила: деление атрибутируемых
произведений на главы и исключение из частотного словаря имён собственных. Было
проведено два набора испытаний: первый набор – без использования лемматизации, второй
– с использованием автоматического лемматизатора MyStem 3.1 (tech.yandex.ru/mystem).</p>
      <p>В обоих случаях анализ проводился с объёмами частотного словаря в 250, 500, 750 и
1000 слов с использованием мер межтекстового расстояния классическая Дельта, Дельта
Эдера и косинус-Дельта. Для вычислений и построения дендрограмм использовался пакет
для вычислительного анализа текста stylo, разработанный для программной среды R в
2013 г. международной группой учёных М. Эдером, Я. Рубицким и М. Кестемонтом [Eder
et al. 2016].</p>
      <p>Обсуждение результатов
Рис. 4: Результат анализа c мерой классическая Дельта, объём словаря – 250 слов.</p>
      <p>Кластер, содержащий произведения Ильфа и Петрова и главы атрибутируемых
романов, объединяется с кластером, содержащим произведения других писателей, только на
последнем шаге. Данный результат поддерживает нулевую гипотезу H0.
Во вторую группу вошло три дендрограммы, построенные при анализе с мерой
косинус-Дельта, объём словаря – 250, 500 и 750 слов (рис. 5).</p>
      <p>Рис. 5: Результат анализа с мерой косинус-Дельта, объём словаря – 250 слов.
Этот результат работы алгоритма свидетельствует, что повесть “Тайному другу”
стилистически демонстрирует близость к романам “Двенадцать стульев” и “Золотой
телёнок”, а также к произведениям Ильфа и Петрова. Заметим, что это сходство определяется
только с помощью меры косинус-Дельта. В целом, тем не менее, данный результат также
поддерживает нулевую гипотезу H0.
В третью группу вошло три дендрограммы, построенные при анализе с мерой
классическая Дельта, объём словаря – 750 и 1000 слов, а также мерой Дельта Эдера, объём
словаря – 1000 слов (рис. 6).</p>
      <p>Рис. 6: Результат анализа с мерой классическая Дельта, объём словаря – 750 слов.</p>
      <p>Данные результаты подчёркивают стилистическую однородность дилогии, однако не
позволяют сделать выбор в пользу одной из атрибуционных гипотез.</p>
      <p>Итак, в девяти из двенадцати попыток результат поддерживает нулевую гипотезу, в
трёх попытках из двенадцати сформировать вывод не получилось. По результатам
проверки гипотез H0 и H1 гипотеза H0 представляется наиболее вероятной, а гипотезы H1; H2
отвергаются.
6</p>
      <p>Выводы
Изучение Дельты Бёрроуза и её модификаций позволяет заключить, что это –
принципиально простой и в некоторых случаях эффективный набор инструментов, позволяющий
исследователю подкреплять или опровергать атрибуционные гипотезы, рождающиеся в
процессе стилистического и историко-филологического этапов исследования.</p>
      <p>По итогам исследования можно сделать некоторые выводы о предполагаемом
авторстве романов и обстоятельствах их написания. Полученные нами результаты
свидетельствуют, что с точки зрения частот употребления слов дилогия близка к произведениям И.
Ильфа и Е. Петрова, а также намечают связь между дилогией и произведениями М.
Булгакова скорее всего, можно говорить о возможном вкладе писателя в работу над
романами. Предстоит дальнейшее тестирование Дельты Бёрроуза и сравнение эффективности
предлагаемого инструментария с традиционными стилеметрическими квантитативными
методами.
Список литературы</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          2.
          <article-title>Альтернативная гипотеза H1 гласит, что романы были написаны М</article-title>
          . Булгаковым.
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          3.
          <article-title>Альтернативная гипотеза H2 гласит, что романы были написаны С</article-title>
          . Заяицким.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [Amlinski 2013]
          <string-name>
            <surname>Amlinski</surname>
            <given-names>I.</given-names>
          </string-name>
          (
          <year>2013</year>
          )
          <article-title>12 stul'ev ot Mihaila Bulgakova</article-title>
          .[“12 Chairs
          <string-name>
            <surname>” from M. Bulgakov] M.:</surname>
          </string-name>
          Izd-vo “Kirschner Verlag”. - 328 s. (In Russian) =
          <source>Амлински И</source>
          .
          <article-title>12 стульев от Михаила Булгакова</article-title>
          . М.: Изд-во “Kirschner Verlag”,
          <year>2013</year>
          . -
          <fpage>328</fpage>
          с.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [Argamon 2008]
          <article-title>Argamon S. Interpreting Burrows's Delta: Geometric and Probabilistic Foundations</article-title>
          . // Literary and Linguistic Computing Vol.
          <volume>23</volume>
          , No. 2. Рр.
          <volume>131</volume>
          -
          <fpage>147</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [Burrows 2002]
          <string-name>
            <surname>Burrows</surname>
            <given-names>J.</given-names>
          </string-name>
          (
          <year>2002</year>
          ) '
          <article-title>Delta': a Measure of Stylistic Difference and</article-title>
          a Guide to Likely Authorship //Literary and Linguistic Computing, Vol.
          <volume>17</volume>
          , No. 3. Рр.
          <volume>267</volume>
          -
          <fpage>287</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [Eder et al. 2016
          <string-name>
            <surname>] Eder</surname>
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Rybicki</surname>
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Kestemont</surname>
            <given-names>M.</given-names>
          </string-name>
          (
          <year>2016</year>
          )
          <article-title>Stylometry with R: A package for computational text analysis //</article-title>
          <source>The R Journal</source>
          , Vol.
          <volume>8</volume>
          , No. 1. Рр.
          <volume>107</volume>
          -
          <fpage>121</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [Evert et al. 2017]
          <string-name>
            <given-names>Evert</given-names>
            <surname>St</surname>
          </string-name>
          .,
          <string-name>
            <surname>Proisl</surname>
            <given-names>Th.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Jannidis</surname>
            <given-names>F.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Reger</surname>
            <given-names>Is.</given-names>
          </string-name>
          , Pielstr¨om St., Sch¨och Chr.,
          <string-name>
            <surname>Vitt</surname>
            <given-names>Th.</given-names>
          </string-name>
          (
          <year>2017</year>
          )
          <article-title>Understanding and explaining Delta measures for authorship attribution//Digital Scholarship in the Humanities</article-title>
          , Vol.
          <volume>32</volume>
          ,
          <string-name>
            <surname>Issue</surname>
            <given-names>2</given-names>
          </string-name>
          ,
          <year>2017</year>
          . Pp.
          <volume>114</volume>
          -
          <fpage>116</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [Grieve 2007] Grieve,
          <string-name>
            <surname>J.</surname>
          </string-name>
          (
          <year>2007</year>
          )
          <article-title>Quantitative Authorship Attribution:An Evaluation of Techniques//Literary and Linguistic Computing</article-title>
          , Vol.
          <volume>22</volume>
          , No. 3, Pp.
          <fpage>251</fpage>
          -
          <lpage>270</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [Jannidis et al. 2015
          <string-name>
            <surname>] Jannidis</surname>
            <given-names>F.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Pielstrom</surname>
            <given-names>St.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Schoch</surname>
            <given-names>C.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Vitt</surname>
            <given-names>Th.</given-names>
          </string-name>
          (
          <year>2015</year>
          )
          <article-title>Improving Burrows' Delta - An empirical evaluation of text distance measures</article-title>
          .//Digital Humanities Conference,
          <year>2015</year>
          , Sydney.
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>[Juola 2009] Juola</surname>
            <given-names>P.</given-names>
          </string-name>
          (
          <year>2009</year>
          )
          <article-title>JGAAP: A System for Comparative Evaluation of Authorship Attribution//JDHCS 2009</article-title>
          , Vol.
          <volume>1</volume>
          Nо. 1
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [Hoover 2005]
          <string-name>
            <surname>Hoover</surname>
            <given-names>D.</given-names>
          </string-name>
          (
          <year>2005</year>
          )
          <article-title>Delta</article-title>
          , Delta Prime, and
          <article-title>Modern American Poetry: Authorship Attribution Theory</article-title>
          and Method //Proceedings of the 2005 ALLC/ACH Conference
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [Hoover 2004]
          <string-name>
            <surname>Hoover</surname>
            <given-names>D. L.</given-names>
          </string-name>
          (
          <year>2004</year>
          )
          <article-title>Testing Burrows's Delta //Literary and Linguistic Computing</article-title>
          , Vol.
          <volume>19</volume>
          , No. 4. Рр.
          <volume>453</volume>
          -
          <fpage>475</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [Kozaroveckii 2013]
          <string-name>
            <surname>Kozaroveckii</surname>
            <given-names>V.</given-names>
          </string-name>
          (
          <year>2013</year>
          )
          <article-title>Moskovskie baranki i odesskie bubliki</article-title>
          . //Literaturnaya Rossiya, №
          <volume>41</volume>
          ,
          <year>2013</year>
          . (In Russian) =
          <article-title>Козаровецкий В</article-title>
          .
          <article-title>Московские баранки и одесские бублики</article-title>
          .[Moscow bagels and bagels from Odessa] //Литературная Россия, №
          <volume>41</volume>
          ,
          <year>2013</year>
          . - C.
          <fpage>48</fpage>
          -
          <lpage>50</lpage>
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          <string-name>
            <surname>[Petrov 2001] Petrov</surname>
            <given-names>E. P.</given-names>
          </string-name>
          (
          <year>2001</year>
          )
          <article-title>Moi drug Il'f / Sostavlenie i kommentarii A. I. Il'f</article-title>
          .[My friend Il'f ]
          <string-name>
            <given-names>M.</given-names>
            :
            <surname>Tekst</surname>
          </string-name>
          .
          <article-title>- 351 s. (In Russian) = Петров Е</article-title>
          . П.
          <article-title>Мой друг Ильф / Составление и комментарии А</article-title>
          .
          <source>И. Ильф. М.: Текст</source>
          ,
          <year>2001</year>
          . -
          <fpage>351</fpage>
          с.
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          [Rybicki et al. 2011
          <string-name>
            <surname>] Rybicki</surname>
            <given-names>J.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Eder</surname>
            <given-names>M.</given-names>
          </string-name>
          (
          <year>2011</year>
          )
          <article-title>Deeper Delta across genres and languages: do we really need the most frequent words? //Literary and Linguistic Computing</article-title>
          , Vol.
          <volume>26</volume>
          , No 3.
          <string-name>
            <surname>Pp</surname>
          </string-name>
          .
          <volume>315</volume>
          -
          <fpage>321</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          [Savoy 2010] Savoy,
          <string-name>
            <surname>J.</surname>
          </string-name>
          (
          <year>2010</year>
          )
          <article-title>Lexical analysis of US political speeches //</article-title>
          <source>Journal of Quantitative Linguistics</source>
          , Vol.
          <volume>17</volume>
          , No. 2. Pp.
          <volume>123</volume>
          -
          <fpage>141</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          [Savoy 2015]
          <article-title>Authorship Attribution: A Comparative Study of Three Text Corpora</article-title>
          and Three Languages //Quantitative Linguistics Vol.
          <volume>19</volume>
          , Issue 2. Рр.
          <volume>132</volume>
          -
          <fpage>161</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          [Trishin 2017]
          <string-name>
            <surname>Trishin</surname>
            <given-names>V. N.</given-names>
          </string-name>
          (
          <year>2017</year>
          )
          <article-title>Kto avtor “Dvenadcati stul'ev” i “Zolotogo telenka”? [Who is the author of “12 Chairs”</article-title>
          and “Golden golden Calf”]//Simvol nauki [Science Symbol], №
          <volume>10</volume>
          ,
          <year>2017</year>
          . S.
          <volume>48</volume>
          -
          <fpage>50</fpage>
          . (In Russian) =
          <article-title>Тришин В</article-title>
          . Н. Кто автор “Двенадцати стульев” и “Золотого телёнка”? //Символ науки, №
          <volume>10</volume>
          ,
          <year>2017</year>
          . C.
          <volume>48</volume>
          -
          <fpage>50</fpage>
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>