<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>La leggibilità dei testi di ambito medico rivolti al paziente: il caso dei bugiardini di farmaci senza obbligo di prescrizione medica</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Rossella Iovino</string-name>
          <email>rossella.iovino@uniroma3.it</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Dipartimento di Studi Umanistici Università di Roma Tre</institution>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>Felice Dell'Orletta Istituto di Linguistica Computazionale “Antonio Zampolli” (ILC-CNR) ItaliaNLP Lab -</institution>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Franca Orletti Dipartimento di Studi Umanistici Università di Roma Tre</institution>
        </aff>
      </contrib-group>
      <abstract>
        <p>English. In this paper we present the first results of an exploratory analysis of simplification of the package leaflets of medicines, considered representative texts of doctorpatient communication. It will be shown how natural language processing tools can be used to reconstruct the linguistic profile of these texts and to guide their simplification.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>
        Questo contributo intende affrontare la questione
della semplificazione linguistica dei testi di
ambito medico rivolti direttamente ai pazienti, come
è il caso dei bugiardini di farmaci senza obbligo
di prescrizione medica. Nonostante le iniziative
ufficiali prese dall’AIFA, come quella della
realizzazione della Banca Dati Farmaci per aiutare
gli utenti a usare correttamente i farmaci
comprendendone i benefici e gli eventuali effetti
indesiderati, è noto che la lingua utilizzata in questi
e altri testi di ambito medico (e non solo) è
complessa e spesso non adeguata alle competenze dei
cittadini. Si spiegano così anche le numerose
iniziative di semplificazione linguistica diffusesi
negli Stati Uniti e in Europa (compresa l’Italia)
volte alla semplificazione linguistica dei testi
istituzionali
        <xref ref-type="bibr" rid="ref11 ref12 ref4 ref8">(cfr., tra gli altri, De Mauro 1980,
Fioritto 1997, Cortelazzo 1999, De Mauro e
Vedovelli 1999, Piemontese 2003, Fortis 2003)</xref>
        .
      </p>
      <p>In questo lavoro, dopo aver illustrato
brevemente i principali aspetti di complessità della
lingua di ambito medico e aver presentato il
corpus di bugiardini, ci si soffermerà sul contributo
offerto alla semplificazione linguistica dagli
strumenti di Trattamento Automatico del
Linguaggio; in particolare, si farà riferimento al
software READ-IT (sezione 2). Il software è
stato impiegato per monitorare (misurandone il
livello di leggibilità) alcune caratteristiche
linguistiche del bugiardino di VIVIN C®, scelto
perché vendibile senza obbligo di prescrizione
medica (sezione 2.1). READ-IT può costituire un
valido aiuto per chi scrive testi di pubblica
utilità: la misurazione della complessità del testo
consente interventi di riscrittura nella direzione
della massima leggibilità (sezione 3.2). Saranno,
infine delineate delle conclusioni (sezione 4).
2</p>
    </sec>
    <sec id="sec-2">
      <title>La comunicazione paziente scritta medico</title>
      <p>
        Nella complessa relazione tra medico e paziente,
la lingua non è soltanto funzionale alla
comunicazione, ma è utile al medico per ribadire il suo
prestigio e la sua distanza sociale ed epistemica
rispetto al paziente
        <xref ref-type="bibr" rid="ref13 ref15 ref16">(Freidson 1970, Heritage e
Maynard 2006, Heritage 2012)</xref>
        .
      </p>
      <p>
        La lingua medica, e soprattutto la componente
tecnica che la caratterizza e che la qualifica come
una lingua settoriale
        <xref ref-type="bibr" rid="ref2">(Beccaria 1973)</xref>
        o lingua
specialistica
        <xref ref-type="bibr" rid="ref25 ref3">(Berruto 1993, Sobrero 1993)</xref>
        , è uno
strumento che aiuta il medico a esercitare la
propria “visione professionale”, proiettata sulla
realtà quando questa è osservata dalla prospettiva
dello specialista
        <xref ref-type="bibr" rid="ref14 ref19">(Goodwin 1994; Orletti 2000)</xref>
        .
Questo è evidente nelle difficoltà che i pazienti
incontrano nella comprensione della
comunicazione di argomento medico, che viene percepita
come difficile da molti punti di vista.
      </p>
      <p>
        Il maggiore aspetto di difficoltà della lingua
medica è connaturato proprio al suo essere una
varietà di lingua utilizzata in una specifica
situazione comunicativa collegata a un preciso ambito
tematico. Oltre a ciò sono stati messi in evidenza
in letteratura altri aspetti di complessità della
lingua medica. Sul piano lessicale si osserva una
notevole stratificazione che caratterizza questa
varietà settoriale
        <xref ref-type="bibr" rid="ref24">(Serianni 2005)</xref>
        : vi si trovano,
infatti, grecismi, latinismi, arabismi, anglismi
usati spesso come tecnicismi. Su quello
morfosintattico sono significativi i processi di
formazione delle parole che prevedono, ad esempio,
una specializzazione dei suffissi (es. -ite per i
processi infiammatori, -osi per le affezioni di
carattere degenerativo), la presenza di acronimi
(es. TAC = Tomografia Assiale Computerizzata)
e di eponomi per indicare patologie (es. morbo di
Parkinson) oppure parti del corpo (es. tube di
Falloppio), nonché di composti con elementi
neoclassici (es. pediatria)
        <xref ref-type="bibr" rid="ref17 ref26">(Iacobini 2004,
Thornton 2004)</xref>
        . Interessanti sono poi le osservazioni
di natura sintattica e testuale
        <xref ref-type="bibr" rid="ref23">(Serianni 2001)</xref>
        , che
riguardano la preferenza per aggettivi di
relazione (stato febbrile), l’anteposizione del soggetto
nelle frasi passive (cautela deve essere prestata),
il frequente ricorso a strutture frasali impersonali
(si deve prestare attenzione), la preferenza per
nomi astratti, nominalizzazioni (l’uso della dose
minima di farmaco per il trattamento più breve
possibile) e forme nominali del verbo
(antireumatico non steroideo appartenente alla classe
dei derivati dell’acido propionico). Tutto ciò
risponde alle esigenze di sintesi e compattezza
che accomunano lo stile dei testi di ambito
medico a quello dei testi specialistici in generale
        <xref ref-type="bibr" rid="ref6">(Dardano 1986)</xref>
        , contribuendo a renderli difficili,
in quanto brevità non sempre è sinonimo di
semplicità
        <xref ref-type="bibr" rid="ref20">(Orletti 2015)</xref>
        . Questi presentano, infatti,
una struttura codificata
        <xref ref-type="bibr" rid="ref5">(Cortelazzo 2010)</xref>
        molto
vincolata (Sabatini 1990).
      </p>
      <p>
        Data la complessità della lingua medica, che si
realizza a livelli linguistici diversi, per l’analisi
dei bugiardini è stato utilizzato il software
READ-IT, sviluppato dall’Italian Natural
Language Processing Laboratory (ItaliaNLP Lab)
dell’Istituto di Linguistica Computazionale
“Antonio Zampolli” (ILC) del CNR di Pisa
        <xref ref-type="bibr" rid="ref10">(Dell’Orletta, Montemagni, Venturi, 2011)</xref>
        .
Questo software è in grado di computare parametri
linguistici molto più articolati rispetto a software
tradizionali che restituiscono indici di leggibilità
basati per lo più sulla lunghezza di frasi e parole.
READ-IT implementa, infatti, un indice di
leggibilità “avanzato” basato su una analisi linguistica
multi-livello del testo. In aggiunta all’analisi a
livello semantico-lessicale, READ-IT è in grado
di fornire una descrizione linguistica anche a
livello morfologico e sintattico. Oltre a ciò, ai fini
della riscrittura semplificata del testo, READ-IT
offre la possibilità di avere un indice della
leggibilità del testo non solo a livello dell’intero
documento, ma anche della singola frase, favorendo
così interventi analitici.
2.1
      </p>
    </sec>
    <sec id="sec-3">
      <title>Il corpus: alcuni dati quantitativi</title>
      <p>Il corpus è costituito da 7335 bugiardini estratti
dal portale di informazione sanitaria e
farmaceutica www.torrinomedica.it. Dal corpus sono stati
selezionati circa 100 bugiardini relativi ad alcuni
tra i farmaci vendibili senza obbligo di
prescrizione medica tra più diffusi in commercio, per un
totale di 189315 token e 16937 frasi.</p>
      <p>La scelta è ricaduta sui farmaci vendibili
senza prescrizione medica perché, essendo
accessibili direttamente ai cittadini, dovrebbero
presentare bugiardini quanto più possibile
comprensibili per garantire un corretto uso autonomo del
farmaco.</p>
      <p>
        Per dare un’idea della difficoltà dei testi presi
in esame, i 100 bugiardini sono stati analizzati
automaticamente e arricchiti con annotazione
morfo-sintattica e sintattica. A tal fine è stata
utilizzata una piattaforma di strumenti per il
trattamento automatico dell’italiano: per
l’annotazione morfo-sintattica, lo strumento
utilizzato è descritto in
        <xref ref-type="bibr" rid="ref9">Dell’Orletta (2009</xref>
        ), mentre
per l’analisi sintattica a dipendenze, abbiamo
utilizzato DeSR
        <xref ref-type="bibr" rid="ref1">(Attardi et al. 2009)</xref>
        . Il testo
linguisticamente annotato costituisce il punto di
partenza per le analisi successive volte a definire
il profilo linguistico sottostante al testo a partire
dal quale, e attraverso il confronto con il profilo
linguistico di altri corpora di riferimento, è
possibile ricostruirne un quadro della complessità. I
corpora utilizzati nel confronto appartengono a
due generi testuali diversi: quello giornalistico
        <xref ref-type="bibr" rid="ref18 ref21">(Piemontese 1996 e Marinelli et al. 2003)</xref>
        e
quello contenente materiali didattici
        <xref ref-type="bibr" rid="ref10">(Dell’Orletta et
al. 2011)</xref>
        . Per ognuno dei due generi si
individuano due classi: testi semplici e difficili. Per i
testi giornalistici, quelli facili sono i testi estratti
dal mensile 2Parole (2P) di “facile lettura”, che
si presta alla comprensione anche da parte di
per
      </p>
      <sec id="sec-3-1">
        <title>Tokens frase</title>
      </sec>
    </sec>
    <sec id="sec-4">
      <title>Altezza alberi</title>
    </sec>
    <sec id="sec-5">
      <title>Lunghezza link</title>
    </sec>
    <sec id="sec-6">
      <title>Tokens clausola</title>
      <sec id="sec-6-1">
        <title>Tokens frase</title>
      </sec>
    </sec>
    <sec id="sec-7">
      <title>Altezza alberi</title>
    </sec>
    <sec id="sec-8">
      <title>Lunghezza link</title>
    </sec>
    <sec id="sec-9">
      <title>Tokens clausola</title>
      <p>sone con deficit cognitivi, e quelli difficili sono
quelli estratti da Repubblica (R); mentre nei testi
didattici sono inclusi quelli per le scuole
elementari (MDE) e superiori (MDS).</p>
      <p>I risultati quantitativi del confronto tra i
corpora sono riassunti nelle Tabelle 1 e 2, in cui
sono forniti risultati dei confronti quantitativi tra
il corpus di riferimento e, rispettivamente, i
corpora ritenuti facili e difficili:
alto se viene confrontato con i valori estratti dai
corpora di riferimento considerati difficili: 10.12
per R e 9.2 per MDS.</p>
      <p>Interessante è poi la distribuzione del lessico,
riassunta nella Tabella 3:</p>
      <p>Diz.
fondamentale
66.48%</p>
      <p>Diz.
fondamentale
75.5%</p>
    </sec>
    <sec id="sec-10">
      <title>Parole del corpus presenti in VdB</title>
      <p>41.12%</p>
      <p>Diz.
alto uso
25.84%</p>
    </sec>
    <sec id="sec-11">
      <title>Parole del corpus R in VdB</title>
      <p>67.09%</p>
      <p>Diz.
alto uso
18.95%</p>
      <p>Diz.
alta dispon.
7.67%</p>
      <p>Diz.
alta dispon.
5.8%</p>
      <sec id="sec-11-1">
        <title>Tabella 3 Distribuzione del lessico</title>
        <p>la media di parole trovate nel Vocabolario di
Base (VdB, De Mauro 1980) è soltanto del
41.12%, di cui il 66.48% appartiene al
Dizionario Fondamentale, il 25.84% al Dizionario di
Alto Uso e il 7.67% al Dizionario di Alta
Disponibilità. Il corpus R, pur ritenuto difficile, ha un
valore più alto di parole appartenenti al VdB
(67.09%), di cui il 75.5% appartiene al
Dizionario fondamentale, il 18.95% al Dizionario di Alto
Uso e il 5.28% al Dizionario di Alta
Disponibilità. Questo qualifica il lessico dei bugiardini
analizzati come molto difficile. Ciò è dovuto al fatto
che molte delle parole non contenute nel VdB
coincidono con termini tecnici, termini astratti,
termini appartenenti al lessico specialistico,
compresi i prestiti da altre lingue moderne e i
latinismi, alcuni dei quali sono utilizzati come
tecnicismi e altri come espressioni utili per
innalzare il registro linguistico (Orletti e Iovino in
stampa).
3</p>
      </sec>
    </sec>
    <sec id="sec-12">
      <title>Il software READ-IT per la semplificazione dei testi: esempi di riscrittura</title>
      <p>L’applicazione di READ-IT a supporto della
semplificazione dei testi dei bugiardini è stata
sperimentata sul bugiardino di VIVIN C®.</p>
      <p>READ-IT è in grado di valutare la leggibilità
su due livelli: il documento e la singola frase. Per
quanto riguarda il documento, il software misura
la difficoltà del testo, espressa in percentuale,
rispetto a quattro configurazioni diverse: base
(che tiene in considerazione la lunghezza delle
frasi e delle parole), lessicale (composizione del
vocabolario), sintattico (misura delle categorie
Tabella 1: Confronto quantitativo con corpora
facili
Tabella 2 Confronto quantitativo con corpora
difficili</p>
      <p>Le frasi del corpus di bugiardini analizzati
risultano essere piuttosto brevi con un numero di
token per frase pari a 11.18, valore ancora più
basso di quelli riscontrati nei due corpora di
controllo ritenuti facili (12.14 per 2P 18.36 per
MDE). La brevità delle frasi, insieme al fatto che
molte di esse sono prive di verbo, condiziona di
conseguenza almeno altri due parametri
quantitativi: la media dell’altezza degli alberi sintattici
che nel corpus di riferimento è pari a 3.21, valore
molto basso rispetto a corpora facili come 2P
(5.29) e MDE (5.54); e la lunghezza media dei
link sintattici più lunghi (calcolata in termini di
token che intercorrono tra la testa ed il
dipendente) di ogni frase che è di 4.4 nel corpus di
riferimento rispetto a 7.91 per 2P, 10.28 per R, 8.89
per MDE e 12.5 per MDS. La situazione si
capovolge completamente quando si valuta il numero
medio di token per clausola verbale. Notiamo
subito come in presenza di strutture verbali il
testo diventi estremamente complesso mostrando
un numero medio di 17.36 token, che è molto
morfo-sintattiche e struttura sintattica) e globale
(misura riassuntiva della leggibilità sulla base
della combinazione di tutti i tratti).</p>
      <p>L’analisi effettuata con READ-IT restituisce
una situazione di forte complessità per il testo del
bugiardino di VIVIN C®, come si evince dai dati
nella Tabella 4:</p>
      <sec id="sec-12-1">
        <title>Livello globale</title>
        <p>Livello base
Livello lessicale
Livello sintattico
la leggibilità del testo mostra, infatti, una
difficoltà globale del 100%. Più in dettaglio, è
interessante notare come prendendo in
considerazione solo le caratteristiche di base il livello di
complessità del testo è solo del 43.8%, mentre è
molto più alto a livello lessicale (99.7%) e
sintattico (97%).</p>
        <p>Allo scopo di semplificare il testo preso in
esame, la capacità di READ-IT di analizzare la
leggibilità rispetto alle singole frasi riveste un
ruolo centrale. Attraverso l’identificazione dei
luoghi di complessità che necessitano di
revisione e semplificazione, accompagnata da una
classificazione del tipo di difficoltà riscontrata (di
naturale lessicale vs grammaticale), READ-IT
può essere utilizzato come guida alla
semplificazione del testo. Ad esempio la prima frase del
testo del bugiardino preso in esame è la seguente:</p>
        <p>Mal di testa e di denti, nevralgie, dolori
mestruali, dolori reumatici e muscolari.</p>
        <p>L’indice di difficoltà globale della frase della
frase è pari a 89.4%. A livello base, lessicale e
sintattico la complessità è confermata con
percentuali, rispettivamente, del 71.8%, 64.8%,
71.2%. Per quanto riguarda più in dettaglio il
livello lessicale, delle 10 parole di cui è
composta, se non si contano le ripetizioni, soltanto 5 si
trovano nel VdB (di, testa, e, mal(e), dente,
dolore) di cui due sono parole funzionali (la
congiunzione e e la preposizione di).</p>
        <p>È possibile fare una serie di osservazioni sulle
caratteristiche della frase selezionata.
Innanzitutto, come si è già accennato, si nota l’assenza del
verbo. Se da un lato questo si spiega con il titolo
del paragrafo in cui la frase è inserita
(Indicazioni terapeutiche), dall’altro lato sarebbe
auspicabile evitare frasi nominali soprattutto in presenza
di un titolo a sua volta poco chiaro contenente un
aggettivo relazionale che si qualifica come un
tecnicismo. La presenza di aggettivi relazionali,
tipici di molti linguaggi scientifici, è notevole
nella frase in esame, dal momento che se ne
trovano ben 3: mestruali, reumatici, muscolari. Se il
concetto di dolori mestruali e di dolori muscolari
può risultare comprensibile perché utilizzato
anche nella lingua d’uso, lo stesso non vale per
dolori reumatici, laddove non è così noto che i
reumatismi o malattie reumatiche causino
scompensi a livello dell’apparato locomotore e dei
tessuti di sostegno del corpo. Interessante è
anche l’alternanza tra espressioni della lingua d’uso
come mal di testa (in luogo del tecnicismo
emicrania), e mal di denti (piuttosto che odontalgia)
e tecnicismi come nevralgie. Alla luce di quanto
osservato, una possibile proposta di riscrittura
semplificata della frase comprensiva del titolo
può essere la seguente:
2. A cosa serve questa medicina.</p>
        <p>Potete prendere la medicina in caso di
mal di testa e mal di denti,
infiammazioni dei nervi, dolori da ciclo mestruale,
dolori alle articolazioni e dolore ai
muscoli.</p>
        <p>
          Nella proposta di riscrittura si è fatto ricorso a
diverse strategie di semplificazione linguistica
sebbene non tutte siano esenti da problemi. Ad
esempio, si è adottata una varietà meno formale
della lingua, evitando oltre ai tecnicismi specifici
(es. nevralgie), anche quelli collaterali
          <xref ref-type="bibr" rid="ref24">(Serianni,
2005)</xref>
          (es. assumere vs. prendere). Problematica
risulta essere talvolta la sostituzione dei
tecnicismi specifici, spesso acclimatati nella lingua
corrente, con termini di più largo uso la cui
verbosità (infiammazione ai nervi vs nevralgie) può
costituire un ulteriore aspetto di difficoltà.
        </p>
        <p>Inoltre, sono state evitate le frasi nominali, le
frasi impersonali e quelle passive, rendendo
esplicito l’agente. Infine, una maggiore
informalità è stata raggiunta attraverso una allocuzione
diretta al destinatario del medicinale mediante
l’uso dell’allocutivo voi (potete prendere). Va da
sé che la proposta di riscrittura prevede
l’impiego di un maggior numero di parole, in
quanto gli aggettivi relazionali sono sostituiti da
sintagmi e le ellissi sintattiche sono evitate. La
semplificazione del testo in seguito alla
riscrittura risulta comunque evidente dal riscontro di
READ-IT che stima la difficoltà del testo a
livello globale a solo il 10% rispetto al 89.4% del
testo originale.</p>
        <p>La seconda e ultima frase della sezione
“Indicazioni terapeutiche” è la seguente:
3. Terapia sintomatica degli stati febbrili e
delle sindromi influenzali e da
raffreddamento.</p>
        <p>
          Anche in questo caso, delle 11 parole
contenute nella frase, soltanto 3 (degli, e, stato ammesso
che l’accezione del termine stato nel VdB non
coincida con il participio passato del verbo
essere né con Stato) appartengono al VdB e questo è
un fattore significativo per la stima della
difficoltà del testo pari al 96.3%. Come si è visto
nell’esempio precedente anche in questo caso si
segnala il ricorso ad aggettivi relazionali: se ne
trovano 3 (sintomatica, febbrili, influenzali), che
esprimono significati diversi
          <xref ref-type="bibr" rid="ref22">(Pustejovsky 1995)</xref>
          ,
contribuendo ad accentuare la difficoltà di
comprensione. Se da una parte la terapia sintomatica
è finalizzata a guarire i sintomi, dall’altra, gli
stati febbrili sono causati dalla febbre così come
le sindromi influenzali dall’influenza. In questo
caso, il valore causale dell’aggettivo relazionale
è segnalato dalla congiunzione con il sintagma
ellittico di testa (sindromi) da raffreddamento.
Alla luce di ciò, si può proporre la riscrittura
seguente, che vede l’uso esclusivo di parole del
VdB:
4. Terapia per curare i sintomi della
febbre, dell’influenza e del raffreddore.
        </p>
        <p>La difficoltà del testo riscritto ammonta al
76.3% rispetto al 96.3% del testo originale.</p>
        <p>Dopo aver preso in considerazione due frasi
risultate difficili in seguito al monitoraggio
linguistico, ne viene descritta ora una ritenuta
facile. La sezione successiva del bugiardino è
dedicata a “Posologia e modo di somministrazione”.
Il termine posologia è un calco dal greco posos
“quanto” + logia e sta ad indicare le dosi e le
modalità di assunzione del farmaco. La frase,
riportata in 5, in cui sono fornite le istruzioni per
assumere il farmaco viene valutata da READ-IT
con un basso indice di difficoltà (17.7%):
5. Sciogliere in mezzo bicchiere d'acqua
non gassata una o due compresse di
VIVIN C. L’assunzione del prodotto deve
avvenire a stomaco pieno.</p>
        <p>In effetti, l’unico intervento di riscrittura di
questo testo potrebbe riguardare la sostituzione
del nome deverbale assunzione con l’infinito del
verbo corrispondente o meglio del verbo
prendere oppure con la seconda persona plurale
(assumete/prendete) come già proposto in (2), anche
se l’infinito si giustificherebbe con la presenza
dell’analogo sciogliere nella frase precedente. In
luogo di L’assunzione del prodotto deve avvenire
a stomaco pieno si può optare, quindi, per
prendere/prendete il prodotto o il farmaco a stomaco
pieno, con una riduzione del numero delle parole
(da 9 a 6).
4</p>
      </sec>
    </sec>
    <sec id="sec-13">
      <title>Conclusione</title>
      <p>Questo articolo presenta un lavoro esplorativo di
analisi di un corpus di foglietti illustrativi dei
medicinali senza obbligo di prescrizione medica.</p>
      <p>L’obiettivo era valutare l’uso di strumenti di
TAL per il monitoraggio di questi testi a supporto
della loro semplificazione manuale che prevede
interventi linguistici volti alla semplificazione
della lingua a livello lessicale, con l’eliminazione di
tecnicismi, nomi astratti e deverbali, e
morfosintattico, con la preferenza per l’allocutivo voi e
l’eliminazione di frasi nominali, impersonali e
passive a vantaggio di strutture transitive in cui
tanto il recupero dell’agente quanto
l’esplicitazione delle relazioni sintattiche tra gli
elementi costitutivi della frase risultino facili e
accessibili a tutte le categorie di utenti.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          <string-name>
            <surname>Attardi</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Dell'Orletta</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Simi</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          and
          <string-name>
            <surname>Turian</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          <year>2009</year>
          .
          <article-title>Accurate Dependency Parsing with a Stacked Multilayer Perceptron</article-title>
          .
          <source>In Proceedings of EVALITA'09</source>
          ,
          <fpage>1</fpage>
          -
          <lpage>8</lpage>
          ,
          <string-name>
            <given-names>Reggio</given-names>
            <surname>Emilia</surname>
          </string-name>
          (Italia)
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          <string-name>
            <surname>Beccaria</surname>
            ,
            <given-names>S.L.</given-names>
          </string-name>
          (
          <year>1973</year>
          ).
          <article-title>I linguaggi settoriali in Italia</article-title>
          , Milano, Bompiani.
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          <string-name>
            <surname>Berruto</surname>
            ,
            <given-names>G.</given-names>
          </string-name>
          (
          <year>1993</year>
          ). “Varietà diamesiche, diastratiche, diafasiche”, in Sobrero A. (ed.),
          <article-title>Introduzione all'italiano contemporaneo</article-title>
          .
          <source>La variazione e gli usi</source>
          ,
          <volume>2</volume>
          <fpage>voll</fpage>
          , Roma-Bari, Laterza,
          <fpage>37</fpage>
          -
          <lpage>92</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          <string-name>
            <surname>Cortelazzo</surname>
            <given-names>M.,</given-names>
          </string-name>
          <article-title>con la collaborazione di Federica Pellegrino e Matteo Viale (a cura di</article-title>
          ),
          <year>1999</year>
          ,
          <article-title>Semplificazione del linguaggio amministrativo. Esempi di scrittura per le comunicazioni ai cittadini</article-title>
          , Padova, Comune di Padova.
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          <string-name>
            <surname>Cortelazzo</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          (
          <year>2010</year>
          ), “Linguaggio giuridicoamministrativo”,
          <source>Enciclopedia dell'italiano Treccani.</source>
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          <string-name>
            <surname>Dardano</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          (
          <year>1986</year>
          ),
          <article-title>Il linguaggio dei giornali italiani</article-title>
          , Roma-Bari, Laterza.
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          <string-name>
            <surname>De Mauro</surname>
            ,
            <given-names>T.</given-names>
          </string-name>
          (
          <year>1987</year>
          ),
          <article-title>Guida all'uso delle parole</article-title>
          , Roma-Bari, Laterza.
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          <string-name>
            <surname>De Mauro T.</surname>
          </string-name>
          ,
          <string-name>
            <surname>Vedovelli</surname>
            <given-names>M</given-names>
          </string-name>
          .
          <article-title>(a cura di</article-title>
          ),
          <year>1999</year>
          , Dante, il gendarme e la bolletta.
          <article-title>La comunicazione pubblica in Italia e la nuova bolletta Enel, BariRoma</article-title>
          , Laterza.
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          <string-name>
            <surname>Dell'Orletta</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          <year>2009</year>
          .
          <article-title>Ensemble system for Part-ofSpeech tagging</article-title>
          .
          <source>In Proceedings of EVALITA'09</source>
          , pp.
          <fpage>1</fpage>
          -
          <lpage>8</lpage>
          ,
          <string-name>
            <given-names>Reggio</given-names>
            <surname>Emilia</surname>
          </string-name>
          (Italia).
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          <string-name>
            <surname>Dell'Orletta</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          <string-name>
            <surname>Montemagni</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Vecchi</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>M.</surname>
          </string-name>
          ,
          <string-name>
            <given-names>and Giulia</given-names>
            <surname>Venturi</surname>
          </string-name>
          .
          <year>2011</year>
          .
          <article-title>Tecnologie linguisticocomputazionali per il monitoraggio della competenza linguistica italiana degli alunni stranieri nella scuola primaria e secondaria</article-title>
          . In G. C.
          <string-name>
            <surname>Bruno</surname>
            , I. Caruso,
            <given-names>M.</given-names>
          </string-name>
          <string-name>
            <surname>Sanna</surname>
          </string-name>
          , I. Vellecco (eds.), Percorsi migranti: uomini, diritto, lavoro, linguaggi,
          <source>McGraw-Hill</source>
          ,
          <fpage>319</fpage>
          -
          <lpage>336</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          <string-name>
            <surname>Fioritto</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          <year>1997</year>
          ,
          <article-title>Manuale di stile. Strumenti per semplificare il linguaggio delle amministrazioni pubbliche</article-title>
          , Bologna, il Mulino.
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          <string-name>
            <surname>Fortis</surname>
            ,
            <given-names>D.</given-names>
          </string-name>
          <year>2003</year>
          ,
          <article-title>Il plain language, quando le istituzioni si fanno capire, I quaderni del MdS; Raso</article-title>
          ,
          <string-name>
            <surname>T.</surname>
          </string-name>
          <year>2003</year>
          .
          <article-title>La scrittura burocratica</article-title>
          .
          <source>Carocci</source>
          . Roma;
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          <string-name>
            <surname>Freidson</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          (
          <year>1970</year>
          )
          <article-title>Professional Dominance: The Social Structure of Medical Care</article-title>
          , New York, Atherton Press.
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          <string-name>
            <surname>Goodwin</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          (
          <year>1994</year>
          ), “Professional vision”, American Anthropologist,
          <volume>96</volume>
          (
          <issue>3</issue>
          )
          <fpage>606</fpage>
          -
          <lpage>33</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          <string-name>
            <surname>Heritage</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          (
          <year>2012</year>
          ), “
          <article-title>Epistemics in action: Action formation and territories of knowledge”</article-title>
          ,
          <source>Research on Language and Social Interaction</source>
          ,
          <volume>45</volume>
          ,
          <fpage>1</fpage>
          -
          <lpage>25</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          <string-name>
            <surname>Heritage</surname>
          </string-name>
          , J. e D. Maynard (eds) (
          <year>2006</year>
          ),
          <article-title>Communication in medical care: interaction between primary care physicians and patients</article-title>
          , Cambridge, CUP.
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          <string-name>
            <surname>Iacobini</surname>
            ,
            <given-names>C.</given-names>
          </string-name>
          (
          <year>2004</year>
          ), “
          <article-title>Composizione con elementi neoclassici”</article-title>
          , in M. Grossmann e
          <string-name>
            <surname>F</surname>
          </string-name>
          . Rainer (eds),
          <article-title>La formazione delle parole in italiano</article-title>
          , Tübingen, Niemeyer, pp.
          <fpage>69</fpage>
          -
          <lpage>95</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref18">
        <mixed-citation>
          <string-name>
            <surname>Marinelli</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Biagini</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Bindi</surname>
            ,
            <given-names>R.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Goggi</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Monachini</surname>
            ,
            <given-names>M.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Orsolini</surname>
            ,
            <given-names>P.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Picchi</surname>
            ,
            <given-names>E.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Rossi</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Calzolari</surname>
            ,
            <given-names>N.</given-names>
          </string-name>
          ,
          <string-name>
            <surname>Zampolli</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          (
          <year>2003</year>
          ).
          <article-title>The Italian PAROLE corpus: an overview</article-title>
          .
          <source>In Zampolli A. et al. (eds.)</source>
          , Computational Linguistics in Pisa, Special Issue,
          <article-title>XVI-XVII, Pisa-Roma, IEPI</article-title>
          .
          <string-name>
            <surname>Tomo</surname>
            <given-names>I</given-names>
          </string-name>
          ,
          <fpage>401</fpage>
          -
          <lpage>421</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref19">
        <mixed-citation>
          <string-name>
            <surname>Orletti</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          (
          <year>2000</year>
          ),
          <article-title>La conversazione diseguale</article-title>
          . Potere e interazione, Roma, Carocci.
        </mixed-citation>
      </ref>
      <ref id="ref20">
        <mixed-citation>
          <string-name>
            <surname>Orletti</surname>
            ,
            <given-names>F.</given-names>
          </string-name>
          (
          <year>2015</year>
          ), “
          <article-title>Quando breve non è semplice: sul rapporto tra scritture brevi e semplicità”, Convegno interannuale PRIN SCRIBE Scritture brevi, forme, modelli e applicazioni per l'analisi e per il dizionario</article-title>
          ,
          <source>Macerata</source>
          <volume>28</volume>
          -30 maggio
          <year>2015</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref21">
        <mixed-citation>
          <string-name>
            <surname>Piemontese</surname>
            ,
            <given-names>M.E.</given-names>
          </string-name>
          (
          <year>1996</year>
          ),
          <article-title>Capire e farsi capire. Teorie e tecniche della scrittura controllata</article-title>
          ,
          <source>Tecnodid</source>
          ,
          <year>1996</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref22">
        <mixed-citation>
          <string-name>
            <surname>Pustejovsky</surname>
            ,
            <given-names>J.</given-names>
          </string-name>
          (
          <year>1995</year>
          )
          <article-title>The Generative Lexicon</article-title>
          , CamSabatini,
          <string-name>
            <surname>F.</surname>
          </string-name>
          <year>1990</year>
          .
          <article-title>Analisi del linguaggio giuridico. Il testo normativo in una tipologia generale dei testi , in M. D'Antonio (cur</article-title>
          .),
          <article-title>Corso di studi superiori legislativi (</article-title>
          <year>1988</year>
          -1989) , Padova, Cedam, pp.
          <fpage>675</fpage>
          -
          <lpage>724</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref23">
        <mixed-citation>
          <string-name>
            <surname>Serianni</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          (
          <year>2001</year>
          ),
          <article-title>Italiani scritti</article-title>
          , Bologna, il Mulino.
        </mixed-citation>
      </ref>
      <ref id="ref24">
        <mixed-citation>
          <string-name>
            <surname>Serianni</surname>
            ,
            <given-names>L.</given-names>
          </string-name>
          (
          <year>2005</year>
          ),
          <article-title>Un treno di sintomi. I medici e le parole: percorsi linguistici nel passato e nel presente</article-title>
          . Milano, Garzanti.
        </mixed-citation>
      </ref>
      <ref id="ref25">
        <mixed-citation>
          <string-name>
            <surname>Sobrero</surname>
            ,
            <given-names>A.A.</given-names>
          </string-name>
          (
          <year>1993</year>
          ), “Lingue speciali”, in Sobrero A. (ed.),
          <article-title>Introduzione all'italiano contemporaneo</article-title>
          .
          <source>La variazione e gli usi</source>
          ,
          <volume>2</volume>
          <fpage>voll</fpage>
          , Roma-Bari, Laterza,
          <fpage>237</fpage>
          -
          <lpage>278</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref26">
        <mixed-citation>
          <string-name>
            <surname>Thornton</surname>
            ,
            <given-names>A.</given-names>
          </string-name>
          (
          <year>2004</year>
          ), “Conversione”, in M. Grossmann e
          <string-name>
            <surname>F</surname>
          </string-name>
          . Rainer (eds),
          <article-title>La formazione delle parole in italiano</article-title>
          , Tübingen, Niemeyer, pp.
          <fpage>499</fpage>
          -
          <lpage>533</lpage>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>