<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <journal-title-group>
        <journal-title>N.Pascual-Presa);</journal-title>
      </journal-title-group>
    </journal-meta>
    <article-meta>
      <title-group>
        <article-title>La Dificultad de la Etiquetación de Desinformación: Un Caso de Estudio para Búsquedas Relacionadas con el Gas Radón The Difficulty of Misinformation Labelling: A Case Study for Radon Gas-Related Searches</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Noel Pascual-Presa</string-name>
          <email>noel.pascual.presa@usc.es</email>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Marcos Fernández-Pichel</string-name>
          <email>marcosfernandez.pichel@usc.es</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>David Enrique Losada</string-name>
          <email>david.losada@usc.es</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Berta García-Orosa</string-name>
          <email>berta.garcia@usc.es</email>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Paula Martínez-Graña</string-name>
          <email>paula.martinez.grana@gmail.com</email>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <contrib contrib-type="author">
          <string-name>Lucía Ortigueira-Piñeiro</string-name>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS), Universidade de Santiago de Compostela</institution>
          ,
          <addr-line>15782, Santiago de Compostela</addr-line>
          ,
          <country>España</country>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Departamento de Ciencias da Comunicación, Universidad de Santiago de Compostela</institution>
          ,
          <addr-line>15782, Santiago de Compostela</addr-line>
          ,
          <country>España</country>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Palabras clave Búsqueda Web</institution>
          ,
          <addr-line>Desinformación, Gas Radón, Etiquetación</addr-line>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2020</year>
      </pub-date>
      <volume>000</volume>
      <fpage>0</fpage>
      <lpage>0002</lpage>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>1. Introducción</title>
      <p>
        Internet se ha convertido en un valioso recurso
que ha reconfigurado la manera en la que las
personas accedemos y comprendemos la
información [1]. Hoy en día los recursos en
línea son la fuente principal para la consulta de
información relacionada con la salud [
        <xref ref-type="bibr" rid="ref1">2</xref>
        ]. Esto
otorga a los buscadores web una gran
responsabilidad y peso en el acceso a
información sobre este tema [
        <xref ref-type="bibr" rid="ref2">3</xref>
        ]. Por ejemplo,
los resultados de una búsqueda relacionada con
la salud pueden motivar cambios en los
comportamientos de las personas frente a una
determinada amenaza sanitaria [
        <xref ref-type="bibr" rid="ref3">4</xref>
        ]. A su vez,
este acceso a grandes volúmenes de datos que
está al alcance de una gran parte de la población
mundial trae consigo una serie de riesgos [
        <xref ref-type="bibr" rid="ref4">5</xref>
        ].
La cantidad de información falsa y
desinformación aumenta constantemente [
        <xref ref-type="bibr" rid="ref5">6</xref>
        ] y
esto supone una grave amenaza y peligro para la
población, especialmente, cuando se trata de
información relacionada con la salud. La
información falsa en línea no solo afecta a la
confianza que deposita el usuario en las
evidencias científicas, sino que también puede
motivar decisiones de salud perjudiciales o
contraproducentes para los ciudadanos [
        <xref ref-type="bibr" rid="ref6">7</xref>
        ]. Es
por ello por lo que es necesario realizar nuevos
esfuerzos de investigación que busquen
construir entornos en línea de confianza y
seguros, disminuyendo la cantidad de
información falsa o desinformación [
        <xref ref-type="bibr" rid="ref7">8</xref>
        ].
      </p>
      <p>
        Uno de los principales problemas a los que
nos enfrentamos en este campo es la gran
cantidad de datos disponibles y la dificultad de
distinguir la información veraz de la
desinformación [
        <xref ref-type="bibr" rid="ref8">9</xref>
        ]. En este aspecto, los
algoritmos de recuperación y clasificación de
información son una herramienta muy útil para
tratar de contrarrestar este problema. Estos
algoritmos son capaces de recuperar y detectar
desinformación, pero, por lo general, ven
afectado su rendimiento y precisión por calidad
de los datos de entrenamiento y prueba
proporcionados [
        <xref ref-type="bibr" rid="ref9">10</xref>
        ]. Generar conjuntos de
datos valiosos y de calidad para entrenar estos
modelos, suele ser un proceso costoso y
complejo, que habitualmente requiere la
participación de asesores humanos y unos
criterios de clasificación minuciosos y detallados.
Esta investigación nace con el objetivo de generar
un recurso sólido, transparente y robusto con miles
de páginas webs que pueda ser utilizado para otros
estudios en diferentes ámbitos como las Ciencias de
la Computación o la Comunicación. Además, se
busca ofrecer nuevas pautas y criterios que permitan
establecer un juicio sólido para el análisis de la
calidad de la información relacionada con la salud.
      </p>
      <p>Para ello, este estudio ha sido llevado a cabo por
un equipo interdisciplinar, compuesto por
investigadores del campo de la ingeniería
informática, comunicación y periodismo, partiendo
de la necesidad de incorporar distintas técnicas de
investigación y así poder desarrollar un método que
permita analizar grandes volúmenes de información
relacionada con la salud en Internet. En esta
ocasión, se ha optado por basar la investigación en
un estudio de caso sobre la información relacionada
con los riesgos para la salud del gas radón que, por
las características de este riesgo, lo hace idóneo para
esta ocasión.</p>
      <p>La contribución de este estudio es, por tanto,
dual:
• Por una parte, se definen y evalúan una serie
de criterios para el etiquetado de desinformación
web relacionada con la salud, en concreto, sobre
el gas radón.
• Por otra parte, se crea un recurso etiquetado
que puede ser utilizado por otros grupos de
investigación. Se trata de un corpus de páginas
web anotadas en términos de su relevancia y
calidad que figuran como resultados de
búsqueda para consultas relacionadas con los
riesgos del gas radón. Por tanto, este valioso
recurso de etiquetado lo ponemos a disposición
de la comunidad científica previa solicitud a los
autores en caso de que el artículo sea aceptado.</p>
    </sec>
    <sec id="sec-2">
      <title>2. Trabajo relacionado</title>
      <p>
        La creación de recursos etiquetados es la base para
el desarrollo de algoritmos supervisados en el
ámbito del Procesamiento del Lenguaje Natural
(PLN). Normalmente, la creación de estos recursos
implica la intervención de asesores humanos, lo que
añade un componente de subjetividad que puede
llevar a desacuerdos y a una etiquetación
inadecuada [
        <xref ref-type="bibr" rid="ref10">11</xref>
        ]. Para paliar este efecto, la creación
de recursos etiquetados suele basarse en la
definición de una serie de guías o criterios que los
etiquetadores deben seguir. Esta es la principal
técnica de creación de conjuntos "golden truth"
utilizada en campos como el PLN o la
Recuperación de la Información (RI) e
implementada regularmente en prestigiosas
conferencias que liberan recursos textuales
como la Text Retrieval Conference (TREC) o la
propia conferencia de la Sociedad Española para
el Procesamiento del Lenguaje Natural
(SEPLN).
      </p>
      <p>
        Sin embargo, estudios previos han
demostrado que algunos procesos de anotación
carecen de la rigurosidad necesaria para realizar
una asignación objetiva de las etiquetas. Por
ejemplo, algunas investigaciones previas
centraron sus esfuerzos en definir una serie de
guías capaces de generar un etiquetado robusto
y objetivo [
        <xref ref-type="bibr" rid="ref11">12</xref>
        ]. En Fernández-Pichel et al [
        <xref ref-type="bibr" rid="ref9">10</xref>
        ],
los autores demostraron la inconsistencia de los
juicios de credibilidad generados siguiendo las
recomendaciones oficiales de la tarea "Health
Misinformation Track" dentro de TREC. Como
alternativa, propusieron una serie de guías que
mejoraban el acuerdo entre asesores y producían
un etiquetado robusto de la dimensión de la
credibilidad de la información. Otros autores
[
        <xref ref-type="bibr" rid="ref12">13</xref>
        ] también propusieron una serie de guías para
la generación de recursos etiquetados destinados
al entrenamiento de algoritmos para la detección
de desinformación médica. Por otra parte, en
otras investigaciones [
        <xref ref-type="bibr" rid="ref13">14</xref>
        ] se definieron una
serie de indicadores de la credibilidad de
artículos, que incluían indicadores complejos
como falacias lógicas o el tono del discurso.
      </p>
      <p>En este estudio, la contribución es dual: por
una parte, se continúa con la línea abierta por
investigaciones previas y se definen una serie de
guías para el etiquetado de relevancia y de
calidad de la información de un caso altamente
especializado como el gas radón; por otra parte,
se genera un recurso, a disposición de la
comunidad, que puede servir a grupos
investigadores de diferentes disciplinas.</p>
    </sec>
    <sec id="sec-3">
      <title>3. Creación de una colección de pasajes web relacionados con riesgos sobre el gas radón</title>
      <p>
        El radón es un gas noble radioactivo
subproducto de la descomposición natural del
2Radón en España: percepción de la opinión pública, agenda
mediática y comunicación del riesgo (RAPAC) del Consejo de
Seguridad Nuclear (SUBV-13/2021)».
uranio presente en suelo y rocas. La exposición a
este gas está considerada como la primera causa de
cáncer de pulmón en no fumadores y la segunda
causa en fumadores [
        <xref ref-type="bibr" rid="ref14">15</xref>
        ]. La relevancia de este
riesgo no solo radica en los graves efectos
demostrados en la salud de las personas, sino
también en su persistencia a lo largo del tiempo, que
lo convierte en un riesgo atemporal. Esto nos
permite un análisis ajeno a posibles crisis puntuales,
como puede pasar con otros riesgos para la salud.
      </p>
      <p>
        Una de las principales características de este gas
radica en que está presente por todo el planeta. A
pesar de ello, no todos los países se ven afectados
de la misma forma por el radón, ya que sus niveles
de presencia dependen mayoritariamente de la
composición geológica del suelo. Otro factor que
incrementa los riesgos del radón es su naturaleza
insípida, incolora, e inodora, lo que lo convierte en
indetectable para las personas a no ser que se
realicen pruebas específicas [
        <xref ref-type="bibr" rid="ref15">16</xref>
        ]. Tanto la
Organización Mundial de la Salud (OMS) como la
Unión Europea han enfatizado en numerosas
ocasiones la importancia de la verificación de la
información sobre el radón y sus riesgos para la
salud pública.
      </p>
      <p>En esta ocasión, para la creación de una
colección de pasajes web sobre el radón, en primer
lugar, se han seleccionado 51 consultas relacionadas
con los riesgos para la salud del radón. Estas
consultas textuales han de ser representativas del
tipo de consulta que un usuario convencional
realizaría a un motor de búsqueda web. Para otorgar
este realismo al recurso generado, se ha optado por
utilizar búsquedas de información reales sobre los
riesgos del radón. Para ello, todas las consultas
seleccionadas se han obtenido de dos fuentes: i) los
"query logs" de la TREC Million Query Track
(2007, 2008 y 2009) y ii) diferentes cuestionarios
realizados a la ciudadanía enmarcados en un
proyecto financiado por el Consejo de Seguridad
Nuclear de España sobre la percepción de la opinión
pública del radón en España2. Además, la selección
definitiva de las consultas a realizar fue llevada a
cabo por un equipo de especialistas del área de la
comunicación con experiencia previa en proyectos
vinculados al gas radón, con el propósito de elaborar
una muestra lo más representativa posible y que se
ajustara a necesidades reales de búsqueda. Dada la
limitada disponibilidad de consultas escritas en
español, se ha optado por trabajar con necesidades
de información escritas en inglés y todas aquellas
consultas fruto de los diferentes cuestionarios
realizados a la ciudadanía se han traducido a ese
idioma3. Algunos ejemplos de consultas son:
Radon causes cancer; How Radon Affects
Children; How to reduce radon levels.</p>
      <p>
        Para simular los resultados de búsqueda
obtenidos a partir de cada consulta seleccionada,
se ha indexado un corpus masivo de páginas
web, el denominado C4 [
        <xref ref-type="bibr" rid="ref16">17</xref>
        ] que está compuesto
por millones de webs (1.590.000) indexadas en
inglés y obtenidas de la web en abril de 20194.
Disponer de este corpus offline estático permite
la replicación de este estudio y posibilita la
comparación de algoritmos y variantes de
búsqueda contra un repositorio centralizado [
        <xref ref-type="bibr" rid="ref17 ref18">18,
19</xref>
        ]. Para ejecutar estas búsquedas, se indexó el
corpus en una estructura de índice invertido,
análoga a la que utilizan los motores de
búsqueda. Acto seguido, se buscaron páginas
relevantes para las consultas previamente
seleccionadas. Para ello, se emplearon técnicas
de búsqueda estándar basadas en
emparejamiento de palabras entre la consulta y
los documentos. Concretamente, se utilizó el
conocido algoritmo de búsqueda BM25 con su
configuración por defecto en Pyserini [
        <xref ref-type="bibr" rid="ref19">20</xref>
        ]. Este
modelo léxico ("sparse") puede no ser suficiente
para encontrar los documentos más relevantes
para una determinada búsqueda (debido a que,
por ejemplo, no contempla sinonimia o similitud
semántica o contextual). Por ello, se optó por
reordenar el top 100 de documentos recuperados
para cada consulta utilizando técnicas basadas
en redes de neuronas profundas que estiman la
similitud semántica entre la consulta y el
documento [21]. Asimismo, para las 100
páginas más relevantes de cada consulta,
realizamos extracción de pasajes relevantes
dentro de esas páginas. Esto fue implementado
con un algoritmo de IA de búsqueda de pasajes,
que estima qué parte de la página es más central
para responder a la consulta. Para esta parte, se
utilizó el modelo MonoT5 entrenado para la
detección de pasajes relevantes con la colección
de MS MARCO (Microsoft Machine Reading
Comprehension), una colección ampliamente
utilizada a nivel mundial con pasajes
etiquetados por relevancia [21].
      </p>
      <p>El resultado de este proceso fue un conjunto
de 5.100 pasajes relacionados con las consultas
realizadas.
3Estas traducciones del español al inglés han sido llevadas a cabo
por los autores de la investigación y revisadas por nativos.
4Para la indexación se utilizó la tecnología estándar de Pyserini:
https://github.com/castorini/pyserini
Una vez generado el corpus a analizar, se procedió
a la creación de unas guías de etiquetación que
verifiquen la relevancia de cada uno de los pasajes
recuperados. Esto se debe a que la búsqueda web en
Internet es imperfecta, y podría darse el caso de que,
por ejemplo, cierta información recuperada
mediante estos procedimientos estándar de
búsqueda y recuperación de la información no fuese
relevante para la consulta. Por ello, una parte
importante de esta investigación se centró en
generar un recurso consistente en pasajes webs
etiquetados en cuanto a su relevancia para cada
una de las consultas seleccionadas previamente.</p>
      <p>
        Para ello, se crearon previamente unos criterios
para poder concretar si un pasaje debía ser
considerado muy relevante, parcialmente relevante
o no relevante para una determinada consulta
relacionada con los riesgos del gas radón para la
salud. Esta definición de unos criterios sólidos y
robustos para la realización de juicios de relevancia
consulta-documento es un método estándar en
procesos de etiquetado de grandes volúmenes de
datos en el campo de Recuperación de Información
[
        <xref ref-type="bibr" rid="ref9">10</xref>
        ].
      </p>
      <p>Para asegurar la calidad de los juicios de
relevancia, se realizó un proceso de refinamiento en
múltiples etapas para definir y mejorar las pautas de
anotación. Inicialmente, se seleccionaron
aleatoriamente 3 consultas (dentro del conjunto de
51 necesidades de información) y se analizaron los
100 pasajes recuperados para cada una de las
consultas. Estos pasajes fueron procesados con una
versión inicial de los criterios de relevancia por
parte de tres evaluadores5, que categorizaron cada
pasaje en uno de los tres niveles de relevancia. Tras
esta primera ronda, se calcularon métricas estándar
para evaluar la concordancia entre los evaluadores.
En concreto, se utilizó el Kappa de Cohen
ponderado para evaluar la concordancia entre
evaluadores individuales y el alpha de Krippendorff
para evaluar la concordancia entre todos ellos. Los
valores de Kappa oscilaron entre 0,46 y 0,62 con
una mediana de 0,53. El alpha de Krippendorff
arrojó un valor de 0,63. Tras examinar los
comentarios de los evaluadores, identificamos
discrepancias en la interpretación de las directrices
entre los evaluadores. En concreto, los porcentajes
5Los tres evaluadores, son investigadores del campo de la comunicación
y la información vinculados a proyectos de I+D+I sobre el radón y la
comunicación digital.
iniciales de acuerdo eran notablemente bajos
debido a que no existía un criterio uniforme
entre los etiquetadores para distinguir un pasaje
como parcialmente relevante o como muy
relevante. Por ello, se tuvo que llevar a cabo una
reunión de grupo entre los asesores para unificar
criterios en torno a juzgar un pasaje en función
de su relevancia. Después de identificar estos
motivos, se actualizaron las pautas y se repitió
el proceso.</p>
      <p>En una segunda iteración de etiquetación se
logró un acuerdo más alto, siendo los valores de
Kappa entre 0,71 y 0,73, y el alpha de
Krippendorff de 0,83. Por tanto, se dio luz verde
a estos criterios finales para llevar el etiquetado
global de todos los pasajes de cada una de las
consultas. El resultado es una “Guía de
etiquetación de relevancia de información para
consultas relacionadas con riesgos del radón
para la salud”.</p>
      <p>• Irrelevante (0): el pasaje no responde a
la consulta o necesidad de información. Por
ejemplo, el pasaje habla de radón y/o de
cáncer, pero no de una relación causal entre
ambas.
• Parcialmente Relevante (1): el pasaje
responde de manera parcial a la consulta o
necesidad de información. Por ejemplo, el
pasaje habla de la relación entre el radón y el
cáncer y de la posibilidad de que el primero
produzca al segundo, pero no da una
información completa sobre el tema por el
que pregunta el usuario.
• Muy relevante (2): el asesor encontrará
la información del pasaje muy relevante si
responde de manera muy clara a la necesidad
de información. Por ejemplo, el pasaje
contendrá una respuesta directa (incorrecta o
no) de si el radón causa cáncer.</p>
      <p>Es necesario tener en cuenta que en esta fase
de la etiquetación no se evaluó ningún tipo de
correctitud o calidad de la información, solo
única y exclusivamente la relevancia de los
pasajes para cada consulta.</p>
      <p>El resultado final fue un recurso de 5.100
pasajes extraídos de la búsqueda web en Internet
etiquetados en base a su relevancia para
consultas relacionados con los riesgos del radón.
Los datos obtenidos de este proceso de
etiquetado muestran que el 56,68 % de los
pasajes anotados fueron considerados como
irrelevantes para las necesidades de
información de los usuarios. Este es un
resultado normal, teniendo en cuenta que se
analizaron las 100 primeras páginas webs
recuperadas y la presencia de información
"offtopic" es habitual en este tipo de búsquedas. Por otro
lado, el 30,89 % de los pasajes fueron percibidos
como parcialmente relevantes, sin satisfacer de
manera completa la necesidad de información, y el
14,33 % de los pasajes presentaron información
muy completa, es decir, se consideraron pasajes
muy relevantes. Este recurso etiquetado de
relevancia representa un hito significativo, con
potencial para ser utilizado en diversas áreas. En
concreto, esta colección resulta útil para una amplia
gama de proyectos, como aquellos relacionados con
el aprendizaje automático supervisado, y similar,
por ejemplo, a MS MARCO.</p>
    </sec>
    <sec id="sec-4">
      <title>5. Criterios de evaluación de calidad</title>
      <p>
        En una segunda etapa de etiquetado, nos enfocamos
a evaluar la calidad de los pasajes relevantes
recuperados (limitándonos a aquellos considerados
parcialmente relevantes o muy relevantes en la fase
anterior). Para necesidades de información críticas
como los riesgos del gas radón, es esencial
considerar variables que ayuden a estimar la calidad
de los pasajes extraídos. Por ejemplo, teniendo en
consideración aspectos como la referencia a fuentes
reputadas, la exactitud de la información
proporcionada o la ausencia de contenido
comercial. Tomando como referencia estudios
pasados [
        <xref ref-type="bibr" rid="ref9">10</xref>
        ], se establecieron unos criterios
iniciales basados en ciertos indicadores y, tras
etiquetar los pasajes parcialmente relevantes o muy
relevantes de tres consultas aleatorias, se calculó el
acuerdo entre los evaluadores humanos. Como
sucedió en la fase anterior de etiquetado, los valores
de acuerdo iniciales eran demasiado bajos como
para proceder con un etiquetado global. Tras una
reunión de grupo para abordar discrepancias y
reforzar las pautas, se repitió el proceso, logrando
un mayor acuerdo y aumentando los valores de
Kappa hasta 0,88-0,92 con una mediana de 0,9 y el
alpha de Krippendorff hasta 0,90. Los criterios
resultantes fueron consolidados para un etiquetado
global de calidad de los pasajes. A partir de las
anotaciones de los expertos, se definió un nivel de
preferencia considerando el riesgo potencial para las
personas. Por ejemplo, los contenidos más
perjudiciales citan fuentes confiables, pero
contienen información incorrecta y tienen
propósitos comerciales. Estos pueden confundir a
los usuarios y llevar a decisiones peligrosas. Por
otro lado, los mejores contenidos son precisos, citan
Intenci Inform
      </p>
      <p>ón ación
comer correc
cial ta
×
✓
×
✓
×
✓
×
✓
✓
✓
✓
✓
×
×
×
×</p>
      <p>Nivel
calida
d
3
2
2
1
-1
-2
-2
-3
fuentes confiables y carecen de intenciones
comerciales. La siguiente tabla recoge los
criterios de la “Guía de etiquetación de la
calidad de información para consultas
relacionadas con riesgos del radón para la
salud”. Esta guía ha sido desarrollada ad hoc por
los autores de esta investigación, inspirándose
en otras guías de preferencia documental
presentes en la literatura [22].</p>
      <p>Tabla 1
Niveles de calidad según los criterios “Guía de
etiquetación de la calidad de información para
consultas relacionadas con riesgos del radón
para la salud”</p>
      <p>Criteri
o
• Criterio 1. El pasaje cita información
proveniente de alguna de las siguientes
procedencias: expertos/as reputados/as,
artículos científicos, editoriales médicas,
páginas de organismos gubernamentales, u
otras fuentes similares que se estimen como
autoritarias en la materia. Además, el pasaje
no contiene información que contradice el
consejo médico y tampoco contiene
anuncios o intenciones de marketing.
Ejemplo: “Según la OMS, el radón es uno de
los principales causantes de cáncer de
pulmón”, “Según el NHS, una exposición
prolongada al gas radón puede producir
diversos problemas de salud”.
• Criterio 2. El pasaje cita información
proveniente de alguna de las siguientes
procedencias: expertos/as reputados/as,
artículos científicos, editoriales médicas,
páginas de organismos gubernamentales, u
otras fuentes similares que se estimen como
autoritarias en la materia. Sin embargo, el
pasaje contiene anuncios o intenciones de
marketing. En todo caso, el pasaje no
contiene información que contradice el
conocimiento médico establecido. Ejemplo: "La
OMS advierte que el radón es la segunda causa
principal de cáncer de pulmón, por tanto, si
quiere instalar un mecanismo de filtrado del aire,
contacte la empresa ...".
• Criterio 3. El pasaje no cita fuentes
expertas, pero no contiene desinformación ni
anuncios o información de marketing. Es decir,
la información que proporciona es correcta.
Ejemplo: “El radón produce cáncer de pulmón”.
• Criterio 4. El pasaje no cita fuentes expertas
y el pasaje contiene anuncios o intenciones de
marketing, pero sin contradecir el consenso
médico general sobre el radón y sin proporcionar
información incorrecta. Ejemplo: “El radón es
una de las principales causas de cáncer de
pulmón. Por eso es crucial disponer de
medidores como el nuestro”.
• Criterio 5. El pasaje no cita fuentes
expertas, y contiene información incorrecta o
que contradice el consejo médico, pero no
contiene ni anuncios ni información de
marketing. Ejemplo: “El radón no produce
cáncer de pulmón”.
• Criterio 6. El pasaje cita información
proveniente de alguna de las siguientes
procedencias: expertos/as reputados/as, artículos
científicos, editoriales médicas, páginas de
organismos gubernamentales, u otras fuentes
similares que se estimen como autoritarias en la
materia. Además, el pasaje contiene información
incorrecta o que contradice el consejo médico,
pero no contiene anuncios o intenciones de
marketing. Ejemplo: “Según la OMS, el radón
no es uno de los principales causantes de cáncer
de pulmón”, “Según el NHS, una exposición
prolongada al gas radón puede producir diversos
problemas de salud”.
• Criterio 7. El pasaje no cita fuentes expertas
y el pasaje contiene anuncios o intenciones de
marketing, además contradice el consenso
médico general sobre el radón y/o proporciona
información incorrecta. Ejemplo: “El radón no
es una de las principales causas de cáncer de
pulmón. Por eso es crucial disponer de
medidores como el nuestro”.
• Criterio 8. El pasaje cita información
proveniente de alguna de las siguientes
procedencias: expertos/as reputados/as, artículos
científicos, editoriales médicas, páginas de
organismos gubernamentales, u otras fuentes
similares que se estimen como autoritarias en la
materia. Sin embargo, el pasaje contiene
anuncios o intenciones de marketing.
Además, el pasaje contiene información
incorrecta o que contradice el conocimiento
médico. Ejemplo: "Recientes estudios de la
EPA aseguran que la exposición a niveles
altos de radón produce un impacto positivo
en la salud de las personas para aliviar dolor
articular entre otros, por tanto, visite nuestras
instalaciones para llevar a cabo un
tratamiento de radón."</p>
      <p>El resultado de este etiquetado es un recurso
de 2.056 pasajes extraídos de Internet y su
estimación de calidad para consultas
relacionadas con el radón. Los datos que
obtuvimos de este etiquetado muestran que la
mayoría de los pasajes, el 58,2 %, pertenecen al
nivel 2 de calidad. Por lo tanto, cumplirían el
Criterio 2 o Criterio 3, lo que quiere decir que
es información correcta que o bien cita fuentes
“autoritarias” y contiene intenciones de
marketing, o bien no cita este tipo de fuentes,
pero tampoco contiene intenciones de
marketing. Por otra parte, el 33,4 % de los
pasajes se categorizan como de Calidad 3, es
decir, la máxima calidad que cumple con el
Criterio 1. Esto es, el pasaje cita información
proveniente de alguna de las fuentes
“autoritarias”, además, el pasaje no contiene
información que contraviene el consejo médico
y tampoco contiene anuncios o intenciones de
marketing. El 8,1 % de los pasajes se
enmarcarían en el nivel de Calidad 1 y, por
tanto, a pesar de no proporcionar información
que contradice el consenso médico/científico,
tendrían intenciones de marketing además de no
citar fuentes expertas.</p>
      <p>La cantidad de pasajes que proporcionarían
información incorrecta (valores de calidad
negativos), contradiciendo el consenso médico
fue bajo, situándose en un 0,2 %. Estos pasajes
cumplen con alguno de los cuatro últimos
criterios. En concreto, el 0,1 % fue asociado a
Calidad -1, el 0,04 % a Calidad -2 y el 0,09 %
a Calidad -3. Esto resalta que en el caso que nos
atañe, los buscadores llevan a cabo un trabajo
efectivo eliminando este tipo de páginas
nocivas. Sin embargo, las páginas web
detectadas que contenían información de la más
baja calidad nos advierten de la amenaza que
podría suponer para la salud pública si una gran
cantidad de usuarios se topasen con ellas.</p>
      <p>En algunos de estos casos, en el discurso del
contenido de estas páginas se cuestiona y critica
el consenso médico y científico. Ejemplo:
“Most people are not aware of the fact that there
are actually no conclusive studies that have ever
demonstrated that exposure to indoor radon, as
commonly seen in the overwhelming vast majority
of houses, increases the risk of cancer by any
amount, and in fact, in the larger and better studies,
what we see is that the risk of cancer actually goes
down with increasing radon concentrations”. En
otras páginas webs se incita a los usuarios a llevar a
cabo prácticas perjudiciales para su salud a través de
un discurso basado en información falsa de forma
intencionada con el fin de lucrarse
económicamente. Ejemplo: “The therapies can be
both inhalation and immersion. The mechanisms for
the beneficial effect of the radon spas covers a wide
range of theories: from stimulation of the immune
system, influences on homoeostasis, reduction in
free radicals, and adaptive effects at the
subcellular level on the genes, and DNA”.</p>
      <p>Por tanto, estos resultados ponen de manifiesto
la necesidad de estar alerta para minimizar al
máximo posible la presencia de estos contenidos en
los rankings de resultados a través de la búsqueda
web.</p>
    </sec>
    <sec id="sec-5">
      <title>6. Discusión</title>
      <p>En cuanto a los criterios de calidad de los pasajes,
algunos anotadores percibieron la dimensión de
“intención de marketing” con cierta ambigüedad.
Una parte de los pasajes contenía información sobre
datos de contacto de empresas o laboratorios que
ofrecen servicios ajenos de medición o de
mitigación del radón, pero que buscaban ofrecer
medidas de apoyo a los usuarios. Sin embargo, a la
vez, también están presentes pasajes en los que se
ofrecen de forma explícita servicios propios de este
tipo a través de anuncios comerciales con fines
económicos. Ambos casos, se han considerado en la
anotación como que contienen “intenciones de
marketing” a pesar de que son casos distintos. Por
ende, en pro de mejorar la precisión de estos
criterios de etiquetación, y, por tanto, del recurso
generado, sería conveniente en el futuro crear
nuevas categorías dentro de las guías de
etiquetación que contemplen este tipo de casos y los
diferencien. Además, esto ha de hacerse de modo
cuidadoso pues la complicación en exceso de los
criterios de calidad puede afectar a la robustez del
proceso de etiquetado.</p>
      <p>Uno de los descubrimientos principales de este
estudio es que unos criterios bien definidos
conducen a etiquetas de mayor calidad y a un
acuerdo mucho más sólido entre los evaluadores.
Aunque aún hay espacio para mejorar las
directrices propuestas, hemos observado que, en
nuestro experimento, incluso un breve proceso
de instrucción a los asesores puede resultar en
etiquetas más coherentes. Pese al número
limitado de revisores y documentos anotados
(algo inevitable en nuestro planteamiento al
depender del factor humano como herramienta
de trabajo), observamos señales prometedoras.</p>
      <p>Una limitación de este estudio es que aún no
podemos afirmar rotundamente que las
directrices propuestas reflejan la calidad real de
los documentos del corpus analizado. A pesar de
que se ha demostrado que los criterios de
relevancia de un pasaje son sólidos y robustos,
el recurso final puede no ser tan preciso como
sus criterios al haber quizás posibles sesgos en
la anotación por parte de los etiquetadores. El
acuerdo entre anotadores ha sido alto, pero los
resultados finales podrían verse alterados si con
las mismas directrices, usuarios sin experiencia
previa o sin conocimientos de los riesgos del
radón en la salud, la llevasen a cabo. Hay
algunos aspectos específicos de la calidad
intrínsecos al propio contenido que, al tratarse
de información médica/científica, son difíciles
de evaluar por etiquetadores no expertos en el
campo. En el futuro, extenderemos esta
investigación para abordar anotaciones con
expertos del ámbito médico y compararemos los
resultados y acuerdo con los obtenidos en el
presente estudio.</p>
    </sec>
    <sec id="sec-6">
      <title>7. Conclusiones</title>
      <p>En esta investigación, hemos demostrado la
dificultad de evaluar páginas web en términos
de relevancia y calidad. Nuestra principal
contribución es la creación de dos recursos de
miles de páginas web etiquetadas en base a su
relevancia y calidad para consultas relacionadas
con los riesgos del radón para la salud. Estos
recursos, como se ha mencionado
anteriormente, pueden ser empleados en nuevos
estudios en una gran variedad de campos con
particular énfasis en el desarrollo de soluciones
orientadas a la detección de desinformación.
Además, otro de los resultados a destacar es la
creación de un conjunto de pautas para crear
anotaciones sólidas que pueden mejorarse aún
más mediante una breve capacitación a los
evaluadores. En trabajos futuros, tenemos la
intención de seguir puliendo estas pautas y
llevar a cabo un estudio con usuarios para
comprender en más detalle cómo la información de
baja y alta calidad es percibida por usuarios reales
de sistemas de búsqueda. Esperamos que tanto los
recursos de etiquetado generados como los criterios
y pautas de anotación creadas tengan un impacto
positivo y sean empleados en nuevas
investigaciones.</p>
    </sec>
    <sec id="sec-7">
      <title>8. Agradecimientos</title>
      <p>Esta publicación es parte/cuenta con la financiación
de los siguientes proyectos de I+D+i: Este artículo
se elaboró en el marco del proyecto Radón en
España: percepción de la opinión pública, agenda
mediática y comunicación del riesgo (RAPAC) del
Consejo de Seguridad Nuclear (SUBV-13/2021) &amp;
el proyecto Medios nativos digitales en España:
estrategias, competencias, implicación social y
(re)definición de prácticas de producción y difusión
periodísticas (PID2021-122534OB-C21),
financiado por MCIN/
AEI/10.13039/501100011033/ y “FEDER Una
manera de hacer Europa”. Este trabajo ha sido
financiado por el proyecto PLEC2021-007662
(MCIN/AEI/10.13039/501100011033, Ministerio
de Ciencia e Innovación, Agencia Estatal de
Investigación, Plan de Recuperación,
Transformación y Resiliencia, Unión Europea-Next
Generation EU). Los autores agradecen también el
apoyo financiero prestado por la Xunta de
GaliciaConsellería de Cultura, Educación, Formación
Profesional e Universidade (ED431G 2023/04,
ED431C 2022/19) y al Fondo Europeo de
Desarrollo Regional, que reconoce al
CiTIUSCentro de Investigación en Tecnologías Inteligentes
de la Universidad de Santiago de Compostela como
Centro de Investigación del Sistema Universitario
de Galicia. David E. Losada agradece el apoyo
financiero obtenido del proyecto SUBV23/00002
(Ministerio de Consumo, Subdirección General de
Regulación del Juego) y del proyecto
PID2022137061OB-C22 (Ministerio de Ciencia e
Innovación, Agencia Estatal de Investigación,
Proyectos de Generación de Conocimiento;
apoyado por el Fondo Europeo de Desarrollo
Regional).</p>
    </sec>
    <sec id="sec-8">
      <title>9. Referencias</title>
      <p>[1] K. Schwab, "La cuarta revolución industrial,"
Futuro Hoy, vol. 1, no. 1, pp. 6-10, 2020.
[Online]. Available:
https://bit.ly/Schwabrevistafuturo
Foundations and Trends® in Information
Retrieval, vol. 3, no. 4, pp. 333-389, 2009.
[21] R. Nogueira, Z. Jiang, y J. Lin, "Document
ranking with a pretrained
sequence-tosequence model," arXiv preprint
arXiv:2003.06713, 2020.
[22] C. L. Clarke, S. Rizvi, M. D. Smucker, M.</p>
      <p>Maistro, and G. Zuccon, "Overview of the
TREC 2020 Health Misinformation
Track," in TREC, Nov. 2020.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>L. J. F.</given-names>
            <surname>Rutten</surname>
          </string-name>
          ,
          <string-name>
            <given-names>K. D.</given-names>
            <surname>Blake</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A. J.</given-names>
            <surname>Greenberg-Worisek</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S. V.</given-names>
            <surname>Allen</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R. P.</given-names>
            <surname>Moser</surname>
          </string-name>
          , y
          <string-name>
            <given-names>B. W.</given-names>
            <surname>Hesse</surname>
          </string-name>
          ,
          <article-title>"Online health information seeking among US adults," Public Health Reports</article-title>
          , vol.
          <volume>134</volume>
          , no.
          <issue>6</issue>
          , pp.
          <fpage>617</fpage>
          -
          <lpage>625</lpage>
          ,
          <year>2019</year>
          , doi: 10.1177/0033354919874074.
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>S. S. Tan y N.</given-names>
            <surname>Goonawardene</surname>
          </string-name>
          ,
          <article-title>"Internet health information seeking and the patientphysician relationship: A systematic review,"</article-title>
          <source>Journal of Medical Internet Research</source>
          , vol.
          <volume>19</volume>
          , no.
          <issue>1</issue>
          ,
          <issue>e9</issue>
          ,
          <year>2017</year>
          , doi: 10.2196/jmir.5729.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [4]
          <string-name>
            <given-names>B.</given-names>
            <surname>Osei Asibey</surname>
          </string-name>
          , S. Agyemang, y A.
          <article-title>Boakye Dankwah, "The internet use for health information seeking among Ghanaian university students: A cross-sectional study,"</article-title>
          <source>International Journal of Telemedicine and Applications</source>
          ,
          <volume>1756473</volume>
          -
          <fpage>9</fpage>
          ,
          <year>2017</year>
          , doi: 10.1155/
          <year>2017</year>
          /1756473.
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [5]
          <string-name>
            <given-names>B.</given-names>
            <surname>Swire-Thompson</surname>
          </string-name>
          y
          <string-name>
            <given-names>D.</given-names>
            <surname>Lazer</surname>
          </string-name>
          ,
          <article-title>"Public health and online misinformation: Challenges and recommendations," Annual Review of Public Health</article-title>
          , vol.
          <volume>41</volume>
          , no.
          <issue>1</issue>
          , pp.
          <fpage>433</fpage>
          -
          <lpage>451</lpage>
          ,
          <year>2020</year>
          , doi: 10.1146/annurevpublhealth-040119-094127.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [6]
          <string-name>
            <given-names>G.</given-names>
            <surname>Eysenbach</surname>
          </string-name>
          ,
          <article-title>"Infodemiology: The epidemiology of (mis)information,"</article-title>
          <source>The American Journal of Medicine</source>
          , vol.
          <volume>113</volume>
          , no.
          <issue>9</issue>
          , pp.
          <fpage>763</fpage>
          -
          <lpage>765</lpage>
          ,
          <year>2002</year>
          , doi: 10.1016/s0002-
          <volume>9343</volume>
          (
          <issue>02</issue>
          )
          <fpage>01473</fpage>
          -
          <lpage>0</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [7]
          <string-name>
            <given-names>F. A.</given-names>
            <surname>Pogacar</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Ghenai</surname>
          </string-name>
          , M. D. Smucker, y
          <string-name>
            <given-names>C. L. A.</given-names>
            <surname>Clarke</surname>
          </string-name>
          ,
          <article-title>"The positive and negative influence of search results on people's decisions about the efficacy of medical treatments,"</article-title>
          <source>in Proceedings of the ACM SIGIR International Conference on Theory of Information Retrieval</source>
          , pp.
          <fpage>209</fpage>
          -
          <lpage>216</lpage>
          ,
          <year>2017</year>
          , doi: 10.1145/3121050.3121074.
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [8]
          <string-name>
            <given-names>S.</given-names>
            <surname>Jiang y P. L. Liu</surname>
          </string-name>
          ,
          <article-title>"Digital divide and internet health information seeking among cancer survivors: A trend analysis from 2011 to 2017,"</article-title>
          <source>Psycho-Oncology</source>
          , vol.
          <volume>29</volume>
          , no.
          <issue>1</issue>
          , pp.
          <fpage>61</fpage>
          -
          <lpage>67</lpage>
          ,
          <year>2020</year>
          , doi: 10.1002/pon.5247.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [9]
          <string-name>
            <given-names>A.</given-names>
            <surname>Montoro-Montarroso</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Cantón-Correa</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P.</given-names>
            <surname>Rosso</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Chulvi</surname>
          </string-name>
          , Á.
          <string-name>
            <surname>Panizo-Lledot</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          <string-name>
            <surname>Huertas-Tato</surname>
            ,
            <given-names>B.</given-names>
          </string-name>
          <string-name>
            <surname>Calvo-Figueras</surname>
            ,
            <given-names>M. J.</given-names>
          </string-name>
          <string-name>
            <surname>Rementeria</surname>
          </string-name>
          y J.
          <string-name>
            <surname>Gómez-Romero</surname>
          </string-name>
          ,
          <article-title>"Fighting disinformation with artificial intelligence: fundamentals, advances and challenges,"</article-title>
          <source>Profesional de la Información</source>
          , vol.
          <volume>32</volume>
          , no.
          <issue>3</issue>
          ,
          <issue>e320322</issue>
          ,
          <year>2023</year>
          , doi: 10.3145/epi.
          <year>2023</year>
          .may.
          <volume>22</volume>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [10]
          <string-name>
            <surname>A M. Fernández-Pichel</surname>
            , S. Meyer,
            <given-names>M.</given-names>
          </string-name>
          <string-name>
            <surname>Bink</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          <string-name>
            <surname>Frummet</surname>
            ,
            <given-names>D. E.</given-names>
          </string-name>
          <string-name>
            <surname>Losada</surname>
            , and
            <given-names>D.</given-names>
          </string-name>
          <string-name>
            <surname>Elsweiler</surname>
          </string-name>
          ,
          <article-title>"Improving the reliability of health information credibility assessments,"</article-title>
          <source>in Proc. ROMCIR</source>
          ,
          <year>2023</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [11]
          <string-name>
            <given-names>D.</given-names>
            <surname>Zhu</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S. L.</given-names>
            <surname>Nimmagadda</surname>
          </string-name>
          , K. W. Wong, y
          <string-name>
            <given-names>T.</given-names>
            <surname>Reiners</surname>
          </string-name>
          ,
          <article-title>"Relevance Judgment Convergence Degree-A Measure of Assessors Inconsistency for Information Retrieval Datasets,"</article-title>
          <source>en International Conference on Information Systems Development</source>
          , pp.
          <fpage>149</fpage>
          -
          <lpage>168</lpage>
          , Cham, Switzerland: Springer International Publishing,
          <year>2022</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [12]
          <string-name>
            <given-names>F. L.</given-names>
            <surname>Cruz</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J. A.</given-names>
            <surname>Troyano</surname>
          </string-name>
          ,
          <string-name>
            <given-names>F.</given-names>
            <surname>Enríquez</surname>
          </string-name>
          , and
          <string-name>
            <given-names>F. J.</given-names>
            <surname>Ortega</surname>
          </string-name>
          ,
          <article-title>"Detección y clasificación de falacias prototípicas y espontáneas en español,"</article-title>
          <source>Procesamiento del Lenguaje Natural</source>
          , vol.
          <volume>71</volume>
          , pp.
          <fpage>53</fpage>
          -
          <lpage>62</lpage>
          ,
          <year>2023</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [13]
          <string-name>
            <given-names>A.</given-names>
            <surname>Nabożny</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Balcerzak</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Wierzbicki</surname>
          </string-name>
          , M. Morzy, y M.
          <article-title>Chlabicz, "Active annotation in evaluating the credibility of Web-based medical information: Guidelines for creating training data sets for machine learning," JMIR Medical Informatics</article-title>
          , vol.
          <volume>9</volume>
          , no.
          <volume>11</volume>
          ,
          <issue>e26065</issue>
          ,
          <fpage>2021</fpage>
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [14]
          <string-name>
            <given-names>A. X.</given-names>
            <surname>Zhang</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Ranganathan</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S. E.</given-names>
            <surname>Metz</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Appling</surname>
          </string-name>
          ,
          <string-name>
            <given-names>C. M.</given-names>
            <surname>Sehat</surname>
          </string-name>
          , N. Gilmore, y
          <string-name>
            <given-names>A. X.</given-names>
            <surname>Mina</surname>
          </string-name>
          ,
          <article-title>"A structured response to misinformation: Defining and annotating credibility indicators in news articles,"</article-title>
          <source>in Companion Proceedings of The Web Conference</source>
          <year>2018</year>
          , pp.
          <fpage>603</fpage>
          -
          <lpage>612</lpage>
          ,
          <year>April 2018</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          [15]
          <string-name>
            <surname>OMS</surname>
          </string-name>
          ,
          <article-title>"El radón y sus efectos en la salud," [Online]</article-title>
          . Disponible en: https://www.who.int/es/news-room/factsheets/detail/radon-and
          <article-title>-</article-title>
          <string-name>
            <surname>health</surname>
          </string-name>
          ,
          <year>2021</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          [16]
          <string-name>
            <surname>J. M. Samet</surname>
          </string-name>
          ,
          <article-title>"Radon and lung cancer,"</article-title>
          <source>JNCI: Journal of the National Cancer Institute</source>
          , vol.
          <volume>81</volume>
          , no.
          <issue>10</issue>
          , pp.
          <fpage>745</fpage>
          -
          <lpage>758</lpage>
          ,
          <year>1989</year>
          , doi: 10.1093/jnci/81.10.745.
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          [17]
          <string-name>
            <given-names>C.</given-names>
            <surname>Raffel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>N.</given-names>
            <surname>Shazeer</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Roberts</surname>
          </string-name>
          ,
          <string-name>
            <given-names>K.</given-names>
            <surname>Lee</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Narang</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Matena</surname>
          </string-name>
          , P. J. Liu y otros,
          <article-title>"Exploring the limits of transfer learning with a unified text-to-text transformer,"</article-title>
          <source>The Journal of Machine Learning Research</source>
          , vol.
          <volume>21</volume>
          , no.
          <issue>1</issue>
          , pp.
          <fpage>5485</fpage>
          -
          <lpage>5551</lpage>
          ,
          <year>2020</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          [18]
          <string-name>
            <given-names>R.</given-names>
            <surname>Baeza-Yates</surname>
          </string-name>
          and
          <string-name>
            <given-names>B.</given-names>
            <surname>Ribeiro-Neto</surname>
          </string-name>
          ,
          <article-title>Modern information retrieval</article-title>
          , vol.
          <volume>463</volume>
          , New York, NY, USA: ACM Press,
          <year>1999</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          [19]
          <string-name>
            <given-names>W. B.</given-names>
            <surname>Croft</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D.</given-names>
            <surname>Metzler</surname>
          </string-name>
          , and T. Strohman, “Search Engines: Information Retrieval in Practice”, vol.
          <volume>520</volume>
          , Reading: Addison-Wesley,
          <year>2010</year>
          , pp.
          <fpage>131</fpage>
          -
          <lpage>141</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>
          [20]
          <string-name>
            <given-names>S.</given-names>
            <surname>Robertson y H. Zaragoza</surname>
          </string-name>
          ,
          <article-title>"The probabilistic relevance framework: BM25 and beyond,"</article-title>
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>