=Paper= {{Paper |id=Vol-3427/short8 |storemode=property |title=Do Corpus Lingüístico À Extração Terminológica: Insumos Para a Criação De Uma Plataforma Web Baseada Na Normalização Terminológica Do Domínio Da Conservação-restauração De Bens Patrimoniais (Short Paper) |pdfUrl=https://ceur-ws.org/Vol-3427/short8.pdf |volume=Vol-3427 |authors=Luciana Pissolato,Carles Tebé |dblpUrl=https://dblp.org/rec/conf/mdtt/PissolatoT23 }} ==Do Corpus Lingüístico À Extração Terminológica: Insumos Para a Criação De Uma Plataforma Web Baseada Na Normalização Terminológica Do Domínio Da Conservação-restauração De Bens Patrimoniais (Short Paper)== https://ceur-ws.org/Vol-3427/short8.pdf
Do Corpus Lingüístico À Extração Terminológica: Insumos Para a
Criação De Uma Plataforma Web Baseada Na Normalização
Terminológica Do Domínio Da Conservação-restauração De Bens
Patrimoniais (Short Paper)
Luciana Pissolato 1 Carles Tebé 2
1
    Pontificia Universidad Católica de Chile, Av Vicuña Mackenna, 4680, Santiago, Chile
2
    Pontificia Universidad Católica de Chile, Av Vicuña Mackenna, 4680, Santiago, Chile

                                  Resumo
                                  Neste artigo, abordaremos a constituição e exploração de um corpus linguístico monolingue
                                  em espanhol -variante chilena- no campo da conservação-restauração de bens patrimoniais, a
                                  fim de correlacionar os diferentes gêneros textuais que compõem o corpus com a extração de
                                  sua terminologia. Discutiremos, mais especificamente, os problemas relacionados com a
                                  variação terminológica na área e proporemos uma forma de abordá-los por meio do desenho
                                  de recursos tecnológicos que colaborem com sua fixação e difusão entre os principais
                                  produtores/consumidores desse conhecimento. As discussões e os resultados preliminares
                                  apresentados neste trabalho fazem parte do projeto de pesquisa “Plataforma para la
                                  identificación de las alteraciones a los bienes patrimoniales chilenos” (ID22I10052),
                                  concedido em setembro de 2022, e cuja conclusão está prevista para o início de 2024. Esta
                                  iniciativa é financiada pela Agencia Nacional de Investigación y Desarrollo de Chile -ANID-,
                                  no âmbito do concurso Fondef IDeA I+D 2022, cujo objetivo é apoiar o cofinanciamento de
                                  projetos de P&D aplicados com forte componente científico para o desenvolvimento de
                                  tecnologias que possam se tornar novos produtos, processos ou serviços, com probabilidade de
                                  gerar impactos produtivos, econômicos e sociais.

                                  Palavras-chave1
                                  Normalização terminológica, conservação-restauração de bens patrimoniais, corpus
                                  linguístico, extração terminológica, variação terminológica


1. Introdução
   No Chile, um problema crítico enfrentado pelas organizações públicas que produzem e transmitem
conhecimento especializado é a falta de terminologia normalizada. O problema particular que
abordamos neste artigo está focalizado no campo temático da conservação e restauração de bens
patrimoniais e em uma área geolinguística específica –o espanhol do Chile–.
   Os problemas relacionados com a falta de uma terminologia normalizada no Centro Nacional de
Conservación y Restauración (em adiante, CNCR), dependente do Ministério de las Culturas, las Artes
y el Patrimonio, são graves e situam-se em dois níveis: problemas de fixação ou representação do
conhecimento e problemas de comunicação ou transferência desse conhecimento.
   No campo da fixação do conhecimento, o principal problema é a falta de consenso em torno aos
limites de muitos dos conceitos que utilizam, e nas denominações (termos especializados) que os
designam. Em trabalhos exploratórios preliminares, observam-se fenômenos de sinonímia, polissemia,
variação denominativa e variação conceitual, que precisam ser abordados de forma sistemática. No
campo da comunicação, os problemas manifestam-se a) na redação dos documentos necessários à


2nd International Conference on “Multilingual Digital Terminology Today. Design, Representation Formats and Management Systems”,
(MDTT) 2023, June 28-29, 2023, Lisbon, Portugal
EMAIL: lupissolato@uc.cl (L. Pissolato); ctebe@uc.cl (C. Tebé)
ORCID: 0000-0002-8188-499X (L. Pissolato); 0000-0002-2300-7243 (C. Tebé)
                               © 2023 Copyright for this paper by its authors.
                               Use permitted under Creative Commons License Attribution 4.0 International (CC BY 4.0).
                               CEUR Workshop Proceedings (CEUR-WS.org)
    CEUR
                ht
                 tp:
                   //
                    ceur
                       -ws
                         .or
                           g
    Works
        hop     I
                SSN1613-
                       0073
    Pr
     oceedi
          ngs
realização de seus trabalhos de conservação e restauração –diagnósticos, fichas clínicas, relatórios de
intervenção –; b) nas ações de formação realizadas por conservadores e restauradores no próprio Centro
e em todo o Chile (cursos, seminários, workshops) e c) também se manifestam em intercâmbios com
outros especialistas externos ao CNCR (simpósios, congressos, jornadas científicas). A falta de uma
terminologia normalizada na área dos bens patrimoniais acarreta uma dificuldade de se fazer um
diagnóstico e, assim, pactar as ações necessárias para solucionar o problema que esse bem apresenta; e,
consequentemente, na impossibilidade de comunicar eficazmente à contraparte interessada o estado de
conservação daquele bem.
    A nível de país, sendo o CNCR uma instituição de âmbito nacional vinculada ao Ministério de las
Culturas, las Artes y el Patrimonio, a falta de uma terminologia normalizada impacta em uma
dificuldade de elaborar um diagnóstico preciso a nível nacional do patrimonio cultural, elemento base
para a execução de planos e programas futuros para sua conservação.
    No campo da conservação-restauração de bens patrimoniais, existem muitos recursos externos em
formato de dicionários, alguns internacionais e multilíngues, outros monolíngues em espanhol. No
entanto, nenhum desses recursos terminológicos está normalizado, de modo que entre as diferentes
fontes disponíveis para consulta:
    1. existem discrepâncias em todos os níveis: seleção de termos, indicação de sinônimos ou termos
      preferentes, relações entre conceitos, definições, etc.
    2. a maioria dessas obras é iberocêntrica; em outros casos, são traduções de obras originais escritas
      em outros idiomas e, sobretudo,
    3. não incluem os usos do espanhol chileno, que possui terminologia própria devido a sua rica
      tradição na área,
    4. estão em formatos diferentes, e
    5. não são facilmente acessíveis ou interativos.

    Este estado de coisas dificulta a comunicação inequívoca de certos conceitos fundamentais para o
desempenho do trabalho profissional dos restauradores e conservadores no país. Se consideramos o
papel central desempenhado pelo CNCR como centro de referência nacional – além de seu prestígio
internacional – no domínio da conservação-restauração do patrimônio, abordar conjuntamente a
normalização da sua terminologia com uma metodologia rigorosa de trabalho, é uma tarefa de grande
relevância para este campo especializado, e que pode servir de modelo para a normalização
terminológica de outras áreas das ciências humanas e sociais que apresentem as mesmas necessidades
no país.
    Dado que não é possível quantificar com precisão o número total de termos utilizados em uma
disciplina que não possui uma nomenclatura unificada e validada internacionalmente, como ocorre com
outras disciplinas científicas e técnicas, em trabalho exploratório anterior optou-se por delimitar uma
subárea concreta para realizar o projeto de normalização da terminologia das alterações de bens
patrimoniais, com o objetivo de abordar o trabalho em um número limitado de conceitos, que permita
a validação da metodologia e a implementação dos resultados na comunidade de restauradores e
conservadores do Chile.
    Dentro do processo metodológico de intervenção de um bem patrimonial, a etapa de diagnóstico é
uma das mais críticas, já que as decisões de intervenção que serão tomadas dependerão precisamente
de um diagnóstico. Um dos seus pilares é a identificação e descrição das alterações apresentadas pelos
bens que lhes são entregues para estudo e eventual intervenção posterior. Na documentação que é gerada
para cada trabalho patrimonial, antes da sua eventual intervenção, existem dois tipos de documentos
essenciais, que são as fichas clínicas e os relatórios de intervenção: a) as fichas clínicas são instrumentos
de trabalho utilizados para identificar, descrever e registar o estado de conservação a proposta de
intervenção de conservação e/ou restauração, juntamente com os tratamentos realizados. b) Os
relatórios de intervenção são instrumentos metodológicos que reúnem toda a informação resultante do
processo realizado, além da análise de cada caso de intervenção de conservação e/ou restauração.
Através dos relatórios, são revelados os principais antecedentes do valor histórico, social e cultural do
objeto de estudo, bem como os resultados das análises científicas necessárias ao seu conhecimento
tecnológico.
    Como se pode observar, ambos tipos de documentos constituem um corpus de trabalho de extrema
relevância para este projeto, pois correspondem a textos reais produzidos por especialistas na área
temática e são, portanto, uma fonte de evidência sobre o uso que se dá à terminologia referente às
alterações dos bens patrimoniais nos diferentes laboratórios do CNCR.
2. Objetivos
    Nesse contexto, este artigo abordará a constituição e exploração de um corpus linguístico
monolíngue em espanhol -variante chilena-, a fim de correlacionar os diferentes gêneros textuais que
compõem o corpus com a extração de sua terminologia.
    A primeira fase do projeto visa estabelecer um primeiro vocabulário terminológico de cerca de 300
conceitos-chave no campo das alterações ou danos aos bens patrimoniais. Este é um campo transversal
e essencial para o exercício da profissão de conservador-restaurador que abrange as cinco áreas
temáticas que compõem o corpus linguístico: escultura e monumentos, papel e livros, pintura,
arqueologia e têxtil. Em cada uma dessas áreas temáticas, os textos que compõem o corpus pertencem
a diferentes gêneros textuais: fichas clínicas que descrevem o estado do bem patrimonial; relatórios de
assessoria, que orientam o proprietário do bem sobre qual tipo de intervenção é necessária; relatórios
de intervenção, que descrevem e justificam as ações de conservação e restauração realizadas, e artigos
científicos, que relatam, numa perspetiva académica, os avanços das técnicas e métodos de trabalho na
área .
    O objetivo dessa primeira etapa é coletar toda a variação terminológica existente no corpus, fazer
uma primeira descrição dos tipos e causas dessa variação e criar um banco de dados terminológico que
sirva de base para a etapa posterior de normalização desse vocabulário. O produto final deste projeto é
disponibilizar um recurso tecnológico -em formato de plataforma web-, que colabore com o
estabelecimento e disseminação de tal conhecimento.
    Neste artigo, nos concentraremos nos primeiros resultados da extração terminológica do corpus,
que nos permitem observar fenômenos interessantes de variação terminológica na disciplina. Em alguns
casos, diferentes variantes podem ser correlacionadas de acordo com o gênero textual em que estão
documentadas.
3. Conclusões
    Nesta exposição, apresentamos os problemas relacionados com a normalização da terminologia de
conservação-restauração de bens patrimoniais no Chile e o desenvolvimento deste projeto de pesquisa
interdisciplinar. Os resultados e produtos derivados deste estudo estarão disponíveis para consulta
pública no início de 2024, e serão divulgados, oportunamente, pela equipe de pesquisadores.
4. Referências
    1. Bojanoski, S., Michelon, F., Bevilacqua, C. (2017). Os termos preservação, restauração,
    conservação e conservação preventiva de bens culturais: uma abordagem terminológica. Revista
    Calidoscópio, v. 15, n.3, pp.43-454.
    2. Bowker, L., Pearson, J. (2002). Working with Specialized Language: A Practical Guide to
    Using Corpora. London: Routledge.
    3. Bowker, L. & Hawkins, S. (2006). Variation in the organisation of medical terms: Exploring
    some motivations for term choice. Terminology, 12(1), 79-110.
    4. Brezina, V. (2018). Statistics in Corpus Linguistics: A Practical Guide. Cambridge: Cambridge
    University Press.
    5. Cabré T., Estopà R. & Vivaldi J. (2001). Automatic term detection. A review of current
    systems. En Bourigault D., Jaquemin C., y L’Homme M.-C. (eds.), Recent Advances in
    Computational Terminology, Amsterdam/Philadelphia: John Benjamins, p. 53-87.
    6. Calvo, A. (2016) “La normalización terminológica aplicada a la conservación y restauración
    de patrimonio cultural”, en AA.VV. El lenguaje sobre el patrimonio. Estándares documentales
    para la descripción y gestión de colecciones. Madrid: Ministerio de Educación, Cultura y Deporte,
    2016, pp. 131-139.
    7. Ciapuscio, G. (2003). Textos especializados y Terminologías. Barcelona: Publicaciones del
    IULA, Universidad Pompeu Fabra.
8. Costa, R. (2006). Texte, terme et contexte. Actes des VIIes Journées scientifiques du Réseau
Lexicologie, Terminologie et Traduction. “Mots, Termes et contextes”. Daniel Blampain / Philippe
Thoiron / Marc Van Campenhoudt [ed.] Paris: Editions des archives contemporaines, pp. 79 – 88.
9. Crawfor, W. & Csomay, E. (2016). Doing Corpus Linguistics. London: Routledge.
10. Desagulier, G. (2017). Corpus Linguistics and Statistics with R. Introduction to Quantintative
Methods in Linguistics. Switzerland: Springer.
11. Freixa, J. (2006). Causes of Denominative Variation in Terminology: A Typology Proposal.
Terminology, 12(1), 51-77.
12. Garside, R., Leech, G. & McEnery, T. (2013). Corpus Annotation. Linguistic Information from
Computer Text Corpora. London, Routledge.
13. Gómez, P. C. (2013). Statistical Methods in Language and Linguistics Research. Sheffield:
Equinox.
14. ICOM-CC (2008). Terminology to characterize the conservation of tangible cultural heritage.
Resolution adopted by the ICOM-CC membership at the 15th Triennial Conference, New Delhi,
22-26 September 2008.
15. Kilgarriff, A., Baisa, V., Busta, J., Jakubıcek, M., Kovar, V., Michelfeit, J., Rychly, P., &
Suchomel, V. (2014). The sketch engine: Ten years on. Lexicography, 1(1):7–36.
16. Peñas, A., Verdejo, F., & Gonzalo, J. (2001). Corpus-based terminology extraction applied to
information access.
17. Rogers, M. & Ahmad, K. (2001). Corpus Linguistics and Terminology Extraction. In
Handbook of Terminology Management. Vol. 2., pp.725-760; John Benjamins.
18. Sandu, A., Spiridon, P., Sandu, I. (2016). Current studies and approaches in the field of cultural
heritage conservation science. Harmonising the terminology in an interdisciplinary context. IJCS.