<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta>
      <journal-title-group>
        <journal-title>Dec</journal-title>
      </journal-title-group>
    </journal-meta>
    <article-meta>
      <title-group>
        <article-title>When the Lab of CompLing was started at the University of Venice - Preface to the proceedings of the first workshop held in 1982</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Rodolfo Delmonte</string-name>
          <xref ref-type="aff" rid="aff0">0</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Ca Foscari University of Venice</institution>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2023</year>
      </pub-date>
      <volume>02</volume>
      <issue>2023</issue>
      <fpage>0000</fpage>
      <lpage>0003</lpage>
      <abstract>
        <p>The chapters contained in the book - now out of print - and in its second edition published in 1988 with the title "Studi di Linguistica Computazionale"/Studies of Computational Linguistics, are some of the presentations held at the "Seminario Introduttivo alla Linguistica Computazionale"/Introductory Workshop in Computational Linguistics, on May 13/14/1982, at the University of Venice.</p>
      </abstract>
      <kwd-group>
        <kwd>eol&gt;what CL really is</kwd>
        <kwd>Pisa contribution</kwd>
        <kwd>Zampolli opinion</kwd>
        <kwd>Venice contribution</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>-</title>
      <p>I contributi raccolti in questo volume sono alcuni degli interventi tenuti al Seminario Introduttivo
alla Linguistica Computazionale, il 13-14 maggio 1982, all’Università di Venezia. Lo scopo
dell’incontro era principalmente quello di presentare una panoramica dettagliata degli sviluppi
di una disciplina, la linguistica computazionale, che in Italia ha per ora poco seguito. I motivi di
questo stato di cose sono svariati, di tipo economico storico e sociale: tradizionalmente le Facoltà
umanistiche infatti, non si servono di tecnologia per svolgere le propria ricerche, a diferenza di
quelle scientifiche. Il letterato, il filologo, il glottologo e il linguista in Italia solo sporadicamente
si è rivolta all’elaboratore per avere un ausilio nei propri studi. All’estero è prassi comune
che gli studiosi in campo umanistico, se non dispongono direttamente di un centro ricerche di
linguistica computazionale, si siano rivolti all’elaboratore per verificare o convalidare ipotesi
teoriche. Non vi è alcun dubbio però che gli elaboratori costano, e il livello di investimento nella
ricerca in Italia è ben noto a tutti quelli che vi operano come basso. Ugualmente nota poi in Italia
è la separazione che tuttora esiste tra ricerca umanistica attuta con carta, penna e intuito dallo
scolaro, e ricerca scientifica che deve giocoforza afidarsi alla tecnologia. In più, storicamente, si
aggiunge l’anatema crociano contro tutti quelli che per essere creativi non si afidino all’intuito
e intelligenza individuale, ma magari vogliano fare lavoro d’equipe o "sacrilegio", utilizzare
macchine. I risultati sono ovviamente quelli che dicevamo: benché l’interesse per la LC sia
cresciuto negli ultimi sei o sette anni, ciò è dovuto quasi unicamente all’opera di organizzazione
e ramificazione compiuta dall’attuale Istituto di Linguistica Computazionale di Pisa, diretto dal
prof. Antonio Zampolli.</p>
      <p>
        Come ha anche lucidamente chiarito Zampolli in un suo intervento[
        <xref ref-type="bibr" rid="ref1">1</xref>
        ] e nella relazione
presentata a Venezia, è bene distinguere perlomeno tra linguistica quantitativa e linguistica
computazionale: nel primo caso infatti l’elaboratore viene utilizzato principalmente allo scopo
di condurre analisi di testi di tipo statistico, probabilistico e quantitativo in genere. L’elaboratore
funge in questo caso da ausilio al linguista, il quale è primariamente interessato agli aspetti
stilistici, filologici, glottologici e letterari del testo/i in esame: l’elaboratore fornirà allora spogli
elettronici dalla cui consultazione ragionata il linguista potrà rilevare gli elementi di suo interesse.
Ovviamente, una volta trasferito uno o più testi su un supporto appropriato per la macchina,
schede perforate o nastro magnetico, l’analisi potrà essere ripetuta variando eventualmente
di volta in volta gli elementi che si vuole che l’elaboratore estragga per il linguista. Analisi di
questo genere, anche se compiute su corpora estesi, ad esempio di 100mila occorrenze, non
richiedono all’elaboratore più di 50 secondi di tempo macchina e un tempo variabile tra i 15 e i
30 minuti per stampare i risultati.
      </p>
      <p>La LC invece ha come scopo l’analisi del linguaggio e non solamente della lingua, e
l’elaboratore non è più semplicemente un ausilio, ma lo strumento di simulazione dei
processi linguistici sottostanti a un qualche modello della produzione/comprensione della lingua,
implementati dal linguista, che vorrà verificarne la bontà di funzionamento. Il programma
utilizzato in questo caso non servirà a produrre spogli di corpora o testi, ma rappresenterà una
grammatica, tradotta in un linguaggio di programmazione. Il linguista sarà allora interessato
a studiare gli efetti prodotti da modificazione, introduzioni o cancellazione di regole della
grammatica sulla interpretazione e descrizione del campione di lingua utilizzato.</p>
      <p>Più in generale, il linguista computazionale sarà interessato non soltanto al raggiungimento
di obbiettivi esplicativi e cioè di descrizione del linguaggio mediante regole e rappresentazioni
strutturali, ma vorrà anche sviluppare strumenti adeguati alla generazione o produzione e
alla comprensione e percezione del linguaggio. Se quindi le ricerche quantitative operano in
ambito matematico e statistico, utilizzando un approccio tassonomico e descrittivo ai fenomeni
linguistici studiati, quelle computazionali sono interessate alla elaborazione di modelli della
competenza e della realizzazione linguistica, in altre parole alla grammatica e al meccanismo
che la realizza o processore.</p>
      <p>
        Come spiega Zampolli[
        <xref ref-type="bibr" rid="ref1">1</xref>
        ], il sogno di giungere velocemente alla comprensione dei meccanismi
della lingua attraverso la traduzione meccanica svanì lentamente negli anni ’60. L’attenzione
degli operatori in quel tempo si distolse dai problemi di implementazione su elaboratore di
algoritmi intesi a risolvere questioni linguistiche, per rivolgersi più direttamente al
funzionamento del linguaggio: da problemi legati a tecniche di programmazione e linguaggi, tecniche di
immagazzinamento dati e altri aspetti del software e hardware intesi ad influire direttamente
sulla lingua in esame, per dirigersi allora al problema costituito dalla struttura del linguaggio e
dalle sue regole sottostanti.
      </p>
      <p>
        Benché l’alto livello di formalizzazione e di esplicitazione nella descrizione strutturale e delle
regole proposta da Chomsky possa indurre il linguista a considerare la grammatica generativa
trasformazionale(GGT) come un esempio di algoritmo linguistico per elaboratore: ma in realtà
non è così, e lo ha ribadito lo stesso Chomsky[
        <xref ref-type="bibr" rid="ref2">2</xref>
        ]. La GGT è sì esplicita nei suoi formalismi,
ma i suoi obbiettivi descrittivo/esplicativi non si adeguano se non in parte a quelli che ci si
pone in ambito LC. Nella GGT manca infatti una qualsiasi preoccupazione per esplorare e
studiare i meccanismi relativi alle operazione di produzione e comprensione del linguaggio
che Chomsky relega alla cosiddetta esecuzione o realizzazione linguistica, che in quanto tale
non può costituire un campo di ricerca scientificamente valido per un linguista. E se il modello
di competenza proposto da Chomsky costituisce fondamentalmente un modello psicologico,
esso è però anche intenzionalmente il più astratto e il più distante possibile dalla realtà della
realizzazione linguistica. Le regole contenute nella grammatica infatti secondo i principi della
GGT, non potranno mai essere desunte o indotte da corpora linguistici attraverso procedimenti
di scoperta per quanto ampi essi possano essere, saranno pur sempre deficitari rispetto alla
quantità di materiale linguistico che produrrà/comprenderà nella sua vita un parlante qualsiasi
della lingua.
      </p>
      <p>
        Applicazioni computazionali della GGT come quella della Joyce Friedman[? ] o altre, discusse
in particolare dalla Prodanof, in realtà sono ispirate solo in parte alle posizioni teoriche della
GGT. Infatti, la teoria e il processore non necessariamente coincidono, ed è soltanto il secondo
che servirà da verifica della prima, che essenzialmente è e resterebbe solamente una ipotesi di
funzionamento del linguaggio. In particolare poi, le ultime teorie generative hanno sostituito
alla centralità della sintassi con il suo componente trasformazionale, il lessico e le categorie
funzionali come primitive. I lavori di Bresnan[? ], Kaplan e Bresnan[
        <xref ref-type="bibr" rid="ref3">3</xref>
        ] e Gazdar[
        <xref ref-type="bibr" rid="ref4">4</xref>
        ] hanno
relegato il ruolo della sintassi alla sottocategorizzazione e al funzionamento di una grammatica
a struttura sintagmatica che proietta strutture sintattiche direttamente dall’analisi superficiale.
In termini di analizzatore sintattico o "parser", non sarà quindi più necessario procedere a
ritroso con le trasformazioni alla rovescia per recuperare una struttura profonda dificilmente
individuabile. Un parser ATN, o quello deterministico del Parsifal saranno allora suficienti con
sole regole di tipo context-free a descrivere la struttura sintattica sottostante - ma di questo
tratterà estesamente il saggio della Prodanof.
      </p>
      <p>
        Tradurre e comprendere discorsi e testi sono invece attività che richiedono ad un processore
abilità alquanto diverse da quelle necessarie per la verifica di una teoria e del modello che essa
rappresenta. Infatti il linguista computazionale dovrà simulare il comportamento linguistico di
un parlante/ascoltatore in situazioni reali. In questo caso non sarà suficiente l’informazione
lessicale, morfologica, sintattica e semantica ma si dovrà utilizzare anche quella pragmatica;
e le regole non potranno essere solo quelle contestuali, o context-sensitive, ma saranno del
testo o del discorso, cotestuali o transfrastiche, in modo da catturare i processi di inferenza che
dall’enunciato risalgono alla conoscenza o enciclopedia del parlante/ascoltatore. Solo così la
codifica-decodifica del messaggio o produzione-comprensione dell’enunciato potrà realizzarsi
eficacemente. Le ricerche in questo campo vanno da quelle di Petoefi[
        <xref ref-type="bibr" rid="ref5">5</xref>
        ] e Van Dijk[
        <xref ref-type="bibr" rid="ref6">6</xref>
        ] a quelle
documentate in Conte[
        <xref ref-type="bibr" rid="ref7">7</xref>
        ], Parisi[
        <xref ref-type="bibr" rid="ref8">8</xref>
        ] e Castelfranchi e Parisi[
        <xref ref-type="bibr" rid="ref9">9</xref>
        ], nonché all’ambito di ricerca
definito con il termine Intelligenza Artificiale, a cui accenna la relazione di Ferrari, all’interno
di lavori orientati a compiere analisi automatiche del contenuto semantico del linguaggio.
      </p>
      <p>
        Ed è proprio di questo campo più vicino alla realizzazione linguistica che si interessa l’ultimo
saggio, che non vuole né può essere una panoramica dei lavori svolti in questa area di ricerca,
in quanto le soluzioni adottate per l’inglese mal si adattano all’italiano. Il saggio propone un
modello e la sua simulazione in un processore basato su teorie fonetico-fonologiche e prosodiche,
o di quella parte più standardizzata di variabili implicate nella fase di realizzazione linguistica
rappresentata dalla produzione del parlato. In pratica, il processore simula le operazioni di
codifica e decodifica compiute da un parlante nel leggere un testo ad alta voce. In questo
senso esso è uno strumento adeguato alla produzione di voce sintetica attraverso macchine
comandate da elaboratori. I primi lavori in questo ambito sono di provenienza inglese e cioè
di Holmes e Mattingly[
        <xref ref-type="bibr" rid="ref10">10</xref>
        ], e Mattingly[
        <xref ref-type="bibr" rid="ref11">11</xref>
        ] che propongono un approccio segmentale di tipo
fonematico; i lavori del gruppo di Padova, composto da Francini, Debiasi e Spinabelli [
        <xref ref-type="bibr" rid="ref12">12</xref>
        ],
propongono una soluzione al problema delle unità minime con i difoni, che sono di numero
superiore ai fonemi ma risolvono interamente il problema delle transizioni tra due suoni contigui.
Sempre nell’ambito della sintesi della voce, si registrano poi i lavori americani, in particolare
quelli di Allen[
        <xref ref-type="bibr" rid="ref13">13</xref>
        ] e di Umeda[14], nonché il sistema di Klatt[15], basato di nuovo su difoni.
Tutti questi sistemi di sintesi contengono un processore della lingua basato su teorie
foneticofonologiche: ad esempio Allen utilizza le teorie chomskiane per il suo modello, e per prevedere
la posizione dell’accento ha costruito un dizionario di 12mila morfi che assieme ad un algoritmo
morfologico gli permettono di recuperare la struttura sillabica della parola in esame, quindi il
suo riconoscimento e l’assegnazione dell’accento di parola per regole. Anche il nostro modello,
come vedremo, prevede la localizzazione dell’accento di parola, utilizzando un lessico esiguo
ma solo per le eccezioni alle regole.
      </p>
      <p>RINGRAZIAMENTI
Le persone da ringraziare in questi casi sono ovviamente tantissime: innanzitutto chi ha
permesso materialmente che avesse luogo l’incontro e cioè il prof. Volpato, direttore del CEDOSTA, il
prof. Castellani, direttore del Centro di Calcolo e il prof. Csillaghy, direttore del Centro
Linguistico dell’Università di Venezia. Quindi chi mi ha spronato ad organizzare l’incontro e cioè il
prof. Zampolli, direttore dell’Istituto di LC di Pisa, e tutti gli amici, Riccardo Zipoli, Alberto
Tomasin, Irina Prodanof, Giacomo Ferrari, Luciano Canepari, e gli altri che hanno seguito gli
interventi. Per ultimo chi più di ogni altro ha contribuito di persona, Giorgio Vercellin. Il libro
non sarebbe potuto uscire in questa forma senza il contributo del Centro Linguistico e l’aiuto
dell’amico Marco Vio.
Machine Communication by Voice", volume 64, 1976, pp. 433—-442. doi:10.1109/PROC.
1976.10152.
[14] N. Umeda, Consonant duration in american english, JASA 61 (1977) 846–858.
[15] D. H. Klatt, Structure of a phonological component for a synthesis-by-rule program, ASSPT
- IEEE Transactions Acoustic Speech Signal Process 24 (1976) 391–398.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <given-names>A.</given-names>
            <surname>Zampolli</surname>
          </string-name>
          ,
          <article-title>Trattamento automatico di dati linguistici e linguistica quantitativa, in: Linguaggi e Formalizzazione - SLI"</article-title>
          , Bulzoni, Roma,
          <year>1979</year>
          , pp.
          <fpage>349</fpage>
          --
          <lpage>370</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>N.</given-names>
            <surname>Chomsky</surname>
          </string-name>
          , Current Issues in Linguistic Theory, Prentice-Hall,
          <string-name>
            <surname>Englewood Clifs N.J.</surname>
          </string-name>
          ,
          <year>1964</year>
          , pp.
          <fpage>50</fpage>
          -
          <lpage>118</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>R. K. . J.</given-names>
            <surname>Bresnan</surname>
          </string-name>
          ,
          <article-title>Lexical Functional Grammar: a Formal Syntax for Grammatical Representation</article-title>
          , ????
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [4]
          <string-name>
            <given-names>G.</given-names>
            <surname>Gazdar</surname>
          </string-name>
          , Phrase Structure Grammar, ????
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [5]
          <string-name>
            <given-names>J. S.</given-names>
            <surname>Petoefi</surname>
          </string-name>
          ,
          <article-title>Text representation and lexicon as semantic network, in: Linguaggi e Formalizzazione - SLI"</article-title>
          , Bulzoni, Roma,
          <year>1979</year>
          , pp.
          <fpage>573</fpage>
          --
          <lpage>589</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [6]
          <string-name>
            <given-names>T. A. V.</given-names>
            <surname>Dijk</surname>
          </string-name>
          , Text and Context, Longman, London,
          <year>1977</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [7]
          <string-name>
            <given-names>M. E.</given-names>
            <surname>Conte</surname>
          </string-name>
          , La linguistica testuale, Feltrinelli, Milano,
          <year>1977</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [8]
          <string-name>
            <given-names>D.</given-names>
            <surname>Parisi</surname>
          </string-name>
          ,
          <source>Studi per un modello del linguaggio</source>
          , volume
          <volume>89</volume>
          ,
          <string-name>
            <surname>Quaderni della Ricerca</surname>
          </string-name>
          Scientifica - CNR, Roma,
          <year>1975</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [9]
          <string-name>
            <given-names>C. C. . D.</given-names>
            <surname>Parisi</surname>
          </string-name>
          , Linguaggio conoscenza e scopi, Il Mulino, Bologna,
          <year>1980</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [10]
          <string-name>
            <given-names>J. N. H. . I. G. M. . J. N.</given-names>
            <surname>Shearme</surname>
          </string-name>
          ,
          <article-title>Speech synthesis by rule</article-title>
          ,
          <source>Language and Speech</source>
          <volume>7</volume>
          (
          <year>1964</year>
          )
          <fpage>127</fpage>
          -
          <lpage>143</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [11]
          <string-name>
            <given-names>I. G.</given-names>
            <surname>Mattingly</surname>
          </string-name>
          ,
          <article-title>Synthesis by rule of prosodic features</article-title>
          ,
          <source>Language and Speech</source>
          <volume>9</volume>
          (
          <year>1966</year>
          )
          <fpage>1</fpage>
          -
          <lpage>23</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [12]
          <string-name>
            <given-names>G. I. F. . G. B. D. . R. D.</given-names>
            <surname>Spinabelli</surname>
          </string-name>
          ,
          <article-title>Study of a system of minimal speech-reproducing units for italian speech</article-title>
          ,
          <source>JASA</source>
          <volume>43</volume>
          (
          <year>1968</year>
          )
          <fpage>1282</fpage>
          -
          <lpage>1286</lpage>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [13]
          <string-name>
            <given-names>J.</given-names>
            <surname>Allen</surname>
          </string-name>
          ,
          <article-title>Synthesis of speech from unrestricted text</article-title>
          ,
          <source>in: Proceedings of the IEEE - "Man</source>
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>