LL

Latling: 12th International Colloquium on Latin Linguistics
Alma Mater Studiorum, Università di Bologna
Bologna, Italy
June 9–14, 2003


Home

Announcements and Call for Papers

Participants

Abstracts

Program

Lodging

Publication
& Guidelines

What's new?

University of Bologna




  program:  Tuesday, June 10 | Wednesday, June 11 |  Thursday, June 12
     Friday, June 13 | Saturday, June 14

  back to alphabetical survey:
   


Marco Passarotti, Istituto di Linguistica Computazionale, CNR Pisa

LEMLAT: uno strumento computazionale per la lemmatizzazione del latino. Sviluppo e prospettive.

Le applicazioni computazionali per l'analisi linguistica hanno una storia ormai decennale. Esse hanno prodotto strumenti, cui l'odierna ricerca obbligatoriamente ricorre.
La creazione di siffatti strumenti impone un lavoro approfondito sui dati linguistici: esso deve partire dalla gestione della parola singola per analizzarla, in un secondo momento, nel contesto sintattico.
Il primo passo da fare è, quindi, una gestione computazionale della morfologia della parola, per arrivare all'analisi assistita dal computer del suo ruolo sintattico.
A livello di morfologia, il primo ostacolo da affrontare è quello della lemmatizzazione.
Il sistema di lemmatizzazione automatica del latino LEMLAT (i) è uno strumento che, negli anni, si è dimostrato efficiente ausilio a questa operazione, fondamentale per la gestione di qualsiasi patrimonio lessicale. Forte di un ampio numero di lemmi registrati (circa 55.000), LEMLAT, ricevendo in input una forma di parola, la segmenta nei suoi elementi formativi e produce in output il lemma corrispondente (o i lemmi corrispondenti) e un codice indicante il paradigma flessivo cui quest'ultimo appartiene.
Tuttavia, nella sua prima implementazione, LEMLAT mirava a una lemmatizzazione sintetica che non forniva, in output, tutte le informazioni veicolate dalla forma in input (genere, numero, caso, tempo, modo, persona...).
La massiccia diffusione di Internet e delle nuove tecnologie apre un nuovo ruolo per gli strumenti di analisi linguistica assistita dal computer: nel caso specifico di LEMLAT, esso potrà essere utilizzato per vari scopi via web e non (ricerca linguistica e letteraria, filologia computazionale, e-learning, information retrieval...). L'ampia utenza che accederà ai dati elaborati da LEMLAT necessita di un'analisi morfologica dell'input più approfondita di quella attuale: il poster presenterà le metodologie e i problemi di implementazione delle nuove funzioni di LEMLAT nell'ambito del progetto C.H.L.T. (Cultural Heritage Language Technologies).
(i)LEMLAT è il risultato della ricerca Repertorio Lessicale Automatico Latino ed è brevetto CNR depositato in Italia col n. 564244 in data 18/3/1992. Suoi autori sono A. Bozzi, N. Marinone (aspetto linguistico) e G. Cappelli (aspetto informatico).
Su LEMLAT si vedano:
  • N. Marinone, "A Project for Latin Lexicography: 1. Automatic Lemmatization and Word-List", Computer and the Humanities, 24, 1990, pp. 417-420.
  • A. Bozzi, G. Cappelli, "A Project for Latin Lexicography: 2. A Latin Morphological Analyser", Computer and the Humanities, 24, 1990, pp. 421-426.



  • Most recent modifications: February 18, 2003 – latling@classics.unibo.it
    Source: Dipartimento di Filologia Classica e Medioevale
    No rights can be derived from the information on this Internet-page.