<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Estudio de un enfoque h´ıbrido para la Generaci´on del Lenguaje Natural</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Cristina Barros</string-name>
          <email>cbarros@dlsi.ua.es</email>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Departamento de Lenguajes y Sistemas Informa ́ticos Universidad de Alicante Carretera de San Vicente del Raspeig s/n - 03690 Alicante</institution>
          ,
          <addr-line>Espan ̃a</addr-line>
        </aff>
      </contrib-group>
      <abstract>
        <p>The main objective of this thesis is to propose a hybrid natural language generation approach which will improve the quality of the produced text, encouraging the independence of domain, text type and application. In order to achieve this objective, we present a flexible natural language generation approach focused on the surface realisation stage, which, based on statistical knowledge and lexicons, allows the generation of text for different domains and languages guided by the system input.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        Dada la necesidad existente para facilitar la
comunicacio´n y la interaccio´n
hombre-m´aquina
        <xref ref-type="bibr" rid="ref9">(Jacko, 2012)</xref>
        , las Tecnolog´ıas del
Lenguaje Humano, encargadas de procesar el
lenguaje humano de forma autom´atica, tienen un
papel clave. De entre todas las subdisciplinas
pertenecientes a las TLH, el ´area de la
Generacio´n del Lenguaje Natural (GLN) es capaz
de producir lenguaje a partir de entradas no
lingu¨´ısticas.
      </p>
      <p>
        Gracias a las caracter´ısticas que ofrece el
a´rea de la GLN, esta puede emplearse en
distintos ´ambitos, como en la meteorolog´ıa
        <xref ref-type="bibr" rid="ref13 ref8">(Goldberg, Driedger, and Kittredge, 1994;
Reiter et al., 2005)</xref>
        , donde a partir de
datos num´ericos procedentes de sensores y de
sistemas de simulaci´on, que representan
distintas magnitudes como la temperatura, la
velocidad del viento o el nivel de
precipitaciones de un determinado lugar, se puede
generar un informe explicativo. Asimismo, se
han empleado este tipo de t´enicas en
medicina
        <xref ref-type="bibr" rid="ref1 ref7">(Gatt et al., 2009; Acharya et al., 2016)</xref>
        ,
pudiendo generar texto, a partir de datos
obtenidos mediante sensores, que se adecuen a
distintos registros dependiendo del perfil del
usuario.
      </p>
      <p>
        Adema´s, tambi´en se han disen˜ado
sistemas de GLN como herramienta de ayuda
para la comunicacio´n de personas con algu´n
tipo de discapacidad o problemas de
comprensi´on lectora
        <xref ref-type="bibr" rid="ref14 ref5">(Reiter et al., 2009; Ferres et al.,
2006)</xref>
        , as´ı como tambi´en pueden incorporar
t´enicas para que personas cuasi analfabetas
puedan leer
        <xref ref-type="bibr" rid="ref16">(Williams and Reiter, 2008)</xref>
        .
2
      </p>
    </sec>
    <sec id="sec-2">
      <title>Antecedentes y trabajos relacionados</title>
      <p>
        La tarea de la GLN, a grandes rasgos,
consiste en producir de forma autom´atica
estructuras correctas del lenguaje natural a partir
de una representacio´n de la informacio´n
        <xref ref-type="bibr" rid="ref4">(Cole et al., 1997)</xref>
        , ya sea en texto o en forma
de algu´n tipo de dato, permitiendo as´ı que se
proporcione a los usuarios nueva informacio´n
inferida.
      </p>
      <p>
        Esta tarea se ha dividido comu´nmente en
varias etapas diferenciadas: la macro
planificaci´on, la micro planificaci´on y la realizaci´on
        <xref ref-type="bibr" rid="ref12">(Reiter and Dale, 2000)</xref>
        , siendo el objetivo de
estas determinar la informacio´n contenida en
el nuevo texto a generar (macro planificaci´on)
y c´omo queremos representar dicha
informacio´n en un nuevo texto (micro planificaci´on y
realizaci´on).
      </p>
      <p>Tradicionalmente una de las limitaciones
de los sistemas de GLN es que se han
disen˜ado para dominios muy concretos y para
un fin determinado, siendo el desarrollo de
enfoques de dominio abierto y flexibles un
reto para la comunidad investigadora.</p>
      <p>
        Actualmente, uno de los enfoques ma´s
recientes para abrodar la tarea de la GLN en
los u´ltimos an˜os es la generaci´on
empleando t´ecnicas estad´ısticas
        <xref ref-type="bibr" rid="ref10 ref15 ref3">(Bohnet, Mille, and
Wanner, 2011; Wan et al., 2009; Lemon,
Janarthanam, and Rieser, 2012)</xref>
        , cuya idea
subyaciente se basa en analizar y calcular la
probabilidad de que ciertas palabras aparezcan
juntas. A partir de este tipo de
probabilidades se puede realizar un estudio de la
formacio´n de una frase a partir de un conjunto de
palabras iniciales. Junto a este tipo de
enfoques estad´ısticos, existen otros enfoques
basados en el uso de conocimiento, los cuales
recurren a teor´ıas lingu¨´ısticas, como puede
ser la Teor´ıa de la Estructura Reto´rica del
discurso
        <xref ref-type="bibr" rid="ref11">(Mann and Thompson, 1988)</xref>
        o la
Teor´ıa sentido-texto de Mel’ˇcuk
        <xref ref-type="bibr" rid="ref17">(Zˇolkovskij
and Mel’ˇcuk, 1965)</xref>
        , para generar un texto
dado.
3
      </p>
    </sec>
    <sec id="sec-3">
      <title>Propuesta de investigaci´on</title>
      <p>La hipo´tesis de partida de esta
investigacio´n es que la aplicaci´on de una aproximaci´on
h´ıbrida para la GLN permitir´a incrementar
la calidad del lenguaje producido,
favoreciendo su independencia del dominio, del g´enero
textual y de la aplicaci´on final que lo
utilice, siendo la implementacio´n de un enfoque
de generaci´on h´ıbrido el objetivo final de la
tesis.
4</p>
    </sec>
    <sec id="sec-4">
      <title>Metodolog´ıa y experimentos</title>
      <p>Con el objetivo de lograr una aproximaci´on
h´ıbrida que favorezca la independencia del
dominio, g´enero textual y aplicaci´on, se ha
implementado un m´etodo flexible centrado
en la fase de realizaci´on de la GLN cuya
novedad, con respecto al estado de la
cuestio´n radica en que en la entrada al sistema
es una “caracter´ıstica semilla”. Esta
“caracter´ıstica semilla” puede ser vista como un
objeto abstracto (un fonema, una palabra, un
sentimiento, etc.) encargado de guiar el
proceso de generaci´on con respecto al contenido
del texto generado. Por tanto, guiar´a la
generaci´on en relacio´n con su vocabulario o el
tipo de palabras que deber´a contener el nuevo
texto generado, aportando as´ı la flexibilidad
necesaria al enfoque para poder adaptar con
facilidad la generaci´on de textos
independientemente del dominio e idioma. En la Figura
1 se puede ver un esquema general del
enfoque de generaci´on que se describir´a en las
pr´oximas l´ıneas.</p>
      <p>Figura 1: Diagrama del enfoque de generaci´on
propuesto en el que se generan frases flexionadas
guiadas por la “caracter´ıstica semilla” de
entrada.</p>
      <p>
        En este enfoque se ha estudiado la
aplicaci´on de t´ecnicas estad´ısticas para la
generacio´n, las cuales, en conjuncio´n con
informaci´on obtenida de diversas fuentes (e.g.
lexicones, herramientas, etc.) nos permite una
generaci´on flexible. En este caso, se ha
probado el m´etodo empleando modelos de
lenguaje factorizados (FLM: Factored
Language Models), que son una extensio´n de los
modelos de lenguaje introducidos en
        <xref ref-type="bibr" rid="ref2">(Bilmes
and Kirchhoff, 2003)</xref>
        , donde una palabra es
vista como un vector de k factores tal que
wt ≡ {ft1, ft2, . . . , ftK }. Estos factores pueden
ser cualquier cosa, incuyendo lemas, etiquetas
gramaticales, o cualquier otra caracter´ıstica
l´exica, sint´actica o sema´ntica. Una vez que se
selecciona un conjunto de factores, el
objetivo principal de los FLM es crear un modelo
estad´ıstico P (f |f1, . . . , fN ) donde la
predicci´on de una caracter´ıstica f est´e basada en
sus N padres {f1, . . . , fN }. Estos FLM se
emplean para generar las oraciones, priorizando
la seleccio´n de palabras que esten
relacionadas con la “caracter´ıstica semilla” deseada
para la generaci´on.
      </p>
      <p>Dependiendo de los factores empleados
para la generaci´on, el texto generado puede
no contener elementos flexionados, siendo la
flexi´on autom´atica de frases otro punto clave
para lograr el objetivo marcado. En este
caso, se ha implementado un mo´dulo de flexi´on
de palabras para diferentes idiomas, espan˜ol
e ingl´es. En el caso del ingl´es, la flexi´on se
realiza con reglas escritas a mano dado que
las flexiones en este idioma tienen muy
pocas variantes. Sin embargo, debibo a la
complejidad que entran˜a la flexi´on en lenguajes
morfolo´gicamente ricos como es en este caso
el espan˜ol, se ha realizado la flexi´on de las
frases empleando t´ecnicas de aprendizaje
automa´tico en el caso de los verbos, mientras
que, para el resto de palabras se han
empleado reglas escritas a mano. Espec´ıficamente,
para el aprendizaje de la flexi´on de verbos
espan˜oles, en una primera instancia, se elaboro´
un conjunto de datos que conten´ıa todas las
reglas necesarias para poder realizar la
flexio´n de todos los verbos independientemente
de su conjugaci´on y del tipo de verbo que sea
(regular e irregular). Este conjunto de datos
fue creado consultando la Real Academia
Espan˜ola1 y la Enciclopedia Libre Universal en
Espan˜ol2.</p>
      <p>El conjunto de datos est´a compuesto por
las siguientes caracter´ısticas: (1) ending, (2)
ending stem, (3) penSyl, (4) person, (5)
number, (6) tense, (7) mood, (8) suff1, (9) suff2,
(10) stemC1, (11) stemC2, (12) stemC3.</p>
      <p>
        Se ha considerado que un verbo espan˜ol se
puede dividir en tres partes: (1) ending (que
hace referencia a la conjugaci´on); (2) ending
stem (i.e. la consonante ma´s cercana a la
caracter´ıstica ending ); and (3) penSyl (i.e. la
penu´ltima s´ılaba del verbo que puede estar
formada por la s´ılaba entera o por su vocal
dominante), como se muestra en la Figura 2,
siendo estas partes las que pueden variar en
la flexi´on del verbo.
viduales para cada una de las
caracter´ısticas con un valor de flexi´on potencial. Se us´o
la implementacio´n de WEKA
        <xref ref-type="bibr" rid="ref6">(Frank, Hall,
and Witten, 2016)</xref>
        del algoritmo Random
Forest para entrenar los modelos de las
caracter´ısticas stemC3 y stemC2. Para entrenar
los modelos de las caracter´ısticas suff1, suff2
y stemC1 se emple´o la implementacio´n del
algoritmo Random Tree. Con estos modelos
entrenados se pueden predecir todas las
posibles felxiones de un verbo dado su
infinitivo. Para llevar a cabo esta tarea, primero
se analiza el infinitivo del verbo para poder
extraer las caracter´ısticas necesarias para la
flexi´on, y entonces se predice la flexi´on de
cada caracter´ıstica usando los modelos
entrenados. Finalmente, las flexiones predichas se
sustituyen en el infinitivo del verbo por las
caracter´ısticas previamente identificadas, lo
que conduce a una reconstrucci´on del
infinitivo en la flexi´on deseada, como se muestra
en la Figura 3.
      </p>
      <p>Figura 3: Reconstrucci´on del verbo “elegir” con
las caracter´ısticas predichas por los modelos.</p>
      <p>Este enfoque contribuye al estado de la
cuestio´n en lo siguiente: se presenta un
m´etodo flexible capaz de generar lenguaje que es
f´acilmente adaptable a diferentes dominios e
idiomas; se presenta un mo´dulo de flexi´on
eficiente, para diversos idiomas, que emplea
reglas escritas a la vez que es capaz de predecir
la flexi´on de palabras que no se adecuen a las
reglas, para el caso de los verbos espan˜oles.
4.1</p>
      <p>Progreso de la investigaci´on
Para validar el enfoque propuesto se han
reaFigura 2: Divisi´on del verbo empezar y su flexi´on lizado experimentos con respecto a la
aplicapara la primera persona del singular del presente ci´on de m´etodos estad´ısticos as´ı como
tamde subjuntivo. bi´en experimentos para validar el mo´dulo de
flexi´on.</p>
      <p>Se entreno´ un conjunto de modelos indi- Con respecto al empleo de los FLM, se
1http://www.rae.es/diccionario-panhispanico-de- han escogido varios factores con
informadudas/apendices/modelos-de-conjugacion-verbal ci´on sint´actica y sema´ntica (incluyendo
pala2http://enciclopedia.us.es/index.php/Categor´ıa:Verbos bras, lemas, etiquetas gramaticales (POS tag:
Coherencia Errores</p>
      <p>Gramaticales
Part-of-Speech tag ) y synsets3) para entrenar
varios modelos FLM y evaluar las frases
generadas atendiendo a diferentes criterios. Se
generaron un total de 20 frases por cada una
de las configuraciones de factores: i) Palabras
+ POS tag, ii) Lemas + POS tag y iii) Synset
+ POS tag.</p>
      <p>Para evaluar las frases generadas,
realizamos una evaluaci´on de usuario colaborativa
con un total de 12 participantes como
asesores. Para dicha evaluaci´on se emplearon
cuestionarios con varias preguntas empleando una
escala de Likert de 5 niveles. Estas preguntas
estaban relacionadas con la coherencia y los
errores gramaticales contenidos en las frases
generadas. El t´ermino coherencia se refiere al
nivel de significado de las frases, siendo 1 el
valor para frases con poco sentido y un 5 el
valor para frases con un significado
completo. Por otra parte, el t´ermino de errores
gramaticales se refiere a la cantidad de errores
gramaticales que tienen las frases generadas,
siendo 1 el valor usado cuando las frases
contienen un alto nu´mero de errores y 5 el valor
empleado para denotar la ausencia de errores
en ellas.</p>
      <p>Factores
Palabra+POS
Lema+POS
Synset+POS
Tabla 1: Resultados de las medias de la escala
de Likert de 5 niveles con respecto a la
coherencia y errores gramaticales de las frases generadas
estad´ısticamente empleando distintos factores en
los FLM.</p>
      <p>En la Tabla 1 se puede observar un
resumen de las medias obtenidas para los criterios
mencionados. Estos resultados muestran que
el empleo de factores ma´s abstractos y
generales (los lemas y synsets en conjuncio´n con
el POS tag ) a la hora de generar nos aporta
una mayor capacidad expresiva.</p>
      <p>Por otro lado, en el caso del mo´dulo de
flexi´on, debido a que la flexi´on de oraciones
en espan˜ol es ma´s compleja, se realizo´ un
experimento donde se generaron un total de 81
frases en espan˜ol empleando la configuraci´on
de Lema + POS tag para el FLM. Las
frases generadas se flexionaron, tal y como se
menciono´ en el apartado 4, de dos maneras
3Conjuntos de sino´nimos empleados en WordNet
distintas: i) dejando la flexi´on del verbo en
un tiempo verbal fijo para todas las frases y
ii) flexionando cada frase con un tiempo
verbal aleatorio entre todos los tiempos verbales
simples del espan˜ol.</p>
      <p>En este caso se volvi´o a realizar una
evaluaci´on de usuario colaborativa con un total
de 3 participantes como asesores. Para esta
evaluaci´on se emple´o el mismo tipo de
cuestionarios que en el experimento de los
modelos estad´ısticos, utilizando los mismos
criterios de evaluaci´on (coherencia y errores
gramaticales) con una escala Likert de 5
niveles. Se evaluaron tanto las frases sin flexionar
como las frases con los dos tipos de flexi´on
comentados.</p>
      <p>Tipo
Flexi´on</p>
      <p>de
Sin flexi´on
Fija
Aleatoria</p>
      <p>Coherencia Errores</p>
      <p>Gramaticales</p>
      <p>En la Tabla 2 se puede ver un resumen
de los resultados obtenidos, los cuales
indican una gran mejor´ıa en la calidad y
expresividad de las frases flexionadas con respecto
a su variante sin flexionar.
5</p>
    </sec>
    <sec id="sec-5">
      <title>Cuestiones de investigaci´on</title>
      <p>Siendo la GLN un ´area de inter´es en el
Procesameinto del Lenguaje Natural, y dado
que estos resultados son prometedores, las
siguientes cuestiones a investigar ser´ıan: i) la
investigaci´on de m´etodos de evaluaci´on
automa´tica para la GLN con el fin de discernir
la validez del texto generado, y ii) analizar
diversos m´etodos basados en conocimiento que
nos permitan mejorar el lenguaje generado.</p>
    </sec>
    <sec id="sec-6">
      <title>Agradecimientos</title>
      <p>Esta investigaci´on ha sido financiada por la
Generalitat Valenciana mediante el
proyecto “DIIM2.0: Desarrollo de t´ecnicas
Inteligentes e Interactivas de Miner´ıa y generaci´on
de informacio´n sobre la web 2.0”
(PROMETEOII/2014/001), y por el Gobierno de
Espan˜a (MINECO) a trav´es del proyecto
“RESCATA: Representacio´n can´onica y
transformaciones de los textos aplicado a las
tecnolog´ıas del lenguaje humano”
(TIN201565100-R).</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Acharya</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>B. Di</given-names>
            <surname>Eugenio</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A. D</given-names>
            <surname>Boyd</surname>
          </string-name>
          ,
          <string-name>
            <given-names>K.</given-names>
            <surname>Dunn Lopez</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Cameron</surname>
          </string-name>
          , and
          <string-name>
            <given-names>G. M</given-names>
            <surname>Keenan</surname>
          </string-name>
          .
          <year>2016</year>
          .
          <article-title>Generating summaries of hospitalizations: A new metric to assess the complexity of medical terms and their definitions</article-title>
          .
          <source>In Proceedings of the 9th International Natural Language Generation conference</source>
          , pages
          <fpage>26</fpage>
          -
          <lpage>30</lpage>
          . Association for Computational Linguistics.
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <string-name>
            <surname>Bilmes</surname>
            ,
            <given-names>J. A.</given-names>
          </string-name>
          and
          <string-name>
            <given-names>K.</given-names>
            <surname>Kirchhoff</surname>
          </string-name>
          .
          <year>2003</year>
          .
          <article-title>Factored language models and generalized parallel backoff</article-title>
          .
          <source>In Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: Companion Volume of the Proceedings of HLT-NAACL 2003-short Papers - Volume</source>
          <volume>2</volume>
          , pages
          <fpage>4</fpage>
          -
          <lpage>6</lpage>
          . Association for Computational Linguistics.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>Bohnet</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          , S. Mille, and
          <string-name>
            <given-names>L.</given-names>
            <surname>Wanner</surname>
          </string-name>
          .
          <year>2011</year>
          .
          <article-title>Statistical language generation from semantic structures</article-title>
          .
          <source>In Proceedings of the International Conference on Dependency Linguistics.</source>
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          <string-name>
            <surname>Cole</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Mariani</surname>
          </string-name>
          ,
          <string-name>
            <given-names>H.</given-names>
            <surname>Uszkoreit</surname>
          </string-name>
          ,
          <string-name>
            <given-names>G. Batista</given-names>
            <surname>Varile</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Zaenen</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Zampolli</surname>
          </string-name>
          , and
          <string-name>
            <given-names>V.</given-names>
            <surname>Zue</surname>
          </string-name>
          .
          <year>1997</year>
          .
          <article-title>Survey of the State of the Art in Human Language Technology</article-title>
          . Cambridge University Press and Giardini.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <string-name>
            <surname>Ferres</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Parush</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Roberts</surname>
          </string-name>
          , and
          <string-name>
            <given-names>G.</given-names>
            <surname>Lindgaard</surname>
          </string-name>
          .
          <year>2006</year>
          .
          <article-title>Helping people with visual impairments gain access to graphical information through natural language: The igraph system</article-title>
          .
          <source>In Proceedings of the 10th International Conference on Computers Helping People with Special Needs</source>
          , pages
          <fpage>1122</fpage>
          -
          <lpage>1130</lpage>
          . Springer.
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <surname>Frank</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>M. A.</given-names>
            <surname>Hall</surname>
          </string-name>
          ,
          <string-name>
            <given-names>and I. H.</given-names>
            <surname>Witten</surname>
          </string-name>
          .
          <year>2016</year>
          .
          <article-title>The WEKA Workbench</article-title>
          .
          <article-title>Online Appendix for ”Data Mining: Practical Machine Learning Tools and Techniques”</article-title>
          . Morgan Kaufmann,
          <volume>4</volume>
          <fpage>edition</fpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          <string-name>
            <surname>Gatt</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>F.</given-names>
            <surname>Portet</surname>
          </string-name>
          ,
          <string-name>
            <given-names>E.</given-names>
            <surname>Reiter</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Hunter</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Mahamood</surname>
          </string-name>
          ,
          <string-name>
            <given-names>W.</given-names>
            <surname>Moncur</surname>
          </string-name>
          , and
          <string-name>
            <given-names>S.</given-names>
            <surname>Sripada</surname>
          </string-name>
          .
          <year>2009</year>
          .
          <article-title>From data to text in the neonatal intensive care unit: Using nlg technology for decision support and information management</article-title>
          .
          <source>AI Commun</source>
          .,
          <volume>22</volume>
          (
          <issue>3</issue>
          ):
          <fpage>153</fpage>
          -
          <lpage>186</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <string-name>
            <surname>Goldberg</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>N.</given-names>
            <surname>Driedger</surname>
          </string-name>
          , and
          <string-name>
            <given-names>R. I.</given-names>
            <surname>Kittredge</surname>
          </string-name>
          .
          <year>1994</year>
          .
          <article-title>Using natural-language processing to produce weather forecasts</article-title>
          .
          <source>IEEE Expert</source>
          ,
          <volume>9</volume>
          (
          <issue>2</issue>
          ):
          <fpage>45</fpage>
          -
          <lpage>53</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          <string-name>
            <surname>Jacko</surname>
            ,
            <given-names>J. A.</given-names>
          </string-name>
          <year>2012</year>
          .
          <article-title>Human-Computer Interaction Handbook: Fundamentals, Evolving Technologies, and Emerging Applications, Third Edition</article-title>
          . CRC Press, Inc.,
          <source>3rd edition.</source>
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>Lemon</surname>
            ,
            <given-names>O.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Janarthanam</surname>
          </string-name>
          , and
          <string-name>
            <given-names>V.</given-names>
            <surname>Rieser</surname>
          </string-name>
          .
          <year>2012</year>
          .
          <article-title>Statistical approaches to adaptive natural language generation</article-title>
          .
          <source>In DataDriven Methods for Adaptive Spoken Dialogue Systems</source>
          . Springer New York, pages
          <fpage>103</fpage>
          -
          <lpage>130</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          <string-name>
            <surname>Mann</surname>
            , W. C. and
            <given-names>S. A.</given-names>
          </string-name>
          <string-name>
            <surname>Thompson</surname>
          </string-name>
          .
          <year>1988</year>
          .
          <article-title>Rhetorical structure theory: Toward a functional theory of text organization</article-title>
          .
          <source>Text - Interdisciplinary Journal for the Study of Discourse</source>
          ,
          <volume>8</volume>
          (
          <issue>3</issue>
          ):
          <fpage>243</fpage>
          -
          <lpage>281</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          <string-name>
            <surname>Reiter</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          and
          <string-name>
            <given-names>R.</given-names>
            <surname>Dale</surname>
          </string-name>
          .
          <year>2000</year>
          .
          <article-title>Building Natural Language Generation Systems</article-title>
          . Cambridge University Press.
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          <string-name>
            <surname>Reiter</surname>
            , E.,
            <given-names>S.</given-names>
          </string-name>
          <string-name>
            <surname>Sripada</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          <string-name>
            <surname>Hunter</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          <string-name>
            <surname>Yu</surname>
            ,
            <given-names>and I.</given-names>
          </string-name>
          <string-name>
            <surname>Davy</surname>
          </string-name>
          .
          <year>2005</year>
          .
          <article-title>Choosing words in computer-generated weather forecasts</article-title>
          .
          <source>Artificial Intelligence</source>
          ,
          <volume>167</volume>
          (
          <issue>1</issue>
          ):
          <fpage>137</fpage>
          -
          <lpage>169</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          <string-name>
            <surname>Reiter</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Turner</surname>
          </string-name>
          ,
          <string-name>
            <given-names>N.</given-names>
            <surname>Alm</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Black</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Dempster</surname>
          </string-name>
          ,
          <article-title>and</article-title>
          <string-name>
            <given-names>A.</given-names>
            <surname>Waller</surname>
          </string-name>
          .
          <year>2009</year>
          .
          <article-title>Using NLG to help language-impaired users tell stories and participate in social dialogues</article-title>
          .
          <source>In Proceedings of the 12th European Workshop on Natural Language Generation</source>
          , pages
          <fpage>1</fpage>
          -
          <lpage>8</lpage>
          . Association for Computational Linguistics.
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          <string-name>
            <surname>Wan</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Dras</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R.</given-names>
            <surname>Dale</surname>
          </string-name>
          , and C. Paris.
          <year>2009</year>
          .
          <article-title>Improving grammaticality in statistical sentence generation: Introducing a dependency spanning tree algorithm with an argument satisfaction model</article-title>
          .
          <source>In Proceedings of the 12th Conference of the European Chapter oof the ACL</source>
          , pages
          <fpage>852</fpage>
          -
          <lpage>860</lpage>
          . Association for Computational Linguistics.
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          <string-name>
            <surname>Williams</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          and
          <string-name>
            <given-names>E.</given-names>
            <surname>Reiter</surname>
          </string-name>
          .
          <year>2008</year>
          .
          <article-title>Generating basic skills reports for low-skilled readers</article-title>
          .
          <source>Natural Language Engineering</source>
          ,
          <volume>14</volume>
          (
          <issue>04</issue>
          ):
          <fpage>495</fpage>
          -
          <lpage>525</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          <string-name>
            <surname>Zˇolkovskij</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          and
          <string-name>
            <surname>I. A</surname>
          </string-name>
          . Mel'ˇcuk.
          <year>1965</year>
          .
          <article-title>O vozmoˇznom metode i instrumentax semantiˇceskogo sinteza</article-title>
          .
          <source>Nauˇcnotechniˇceskaja informacija</source>
          ,
          <volume>5</volume>
          :
          <fpage>23</fpage>
          -
          <lpage>28</lpage>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>