LL | Latling: 12th International Colloquium on Latin Linguistics |
Home
Announcements and Call for Papers
Participants
Abstracts
ProgramLodging
Publication | program: Tuesday, June 10 | Wednesday, June 11 | Thursday, June 12La creazione di siffatti strumenti impone un lavoro approfondito sui dati linguistici: esso deve partire dalla gestione della parola singola per analizzarla, in un secondo momento, nel contesto sintattico. Il primo passo da fare è, quindi, una gestione computazionale della morfologia della parola, per arrivare all'analisi assistita dal computer del suo ruolo sintattico. A livello di morfologia, il primo ostacolo da affrontare è quello della lemmatizzazione. Il sistema di lemmatizzazione automatica del latino LEMLAT (i) è uno strumento che, negli anni, si è dimostrato efficiente ausilio a questa operazione, fondamentale per la gestione di qualsiasi patrimonio lessicale. Forte di un ampio numero di lemmi registrati (circa 55.000), LEMLAT, ricevendo in input una forma di parola, la segmenta nei suoi elementi formativi e produce in output il lemma corrispondente (o i lemmi corrispondenti) e un codice indicante il paradigma flessivo cui quest'ultimo appartiene. Tuttavia, nella sua prima implementazione, LEMLAT mirava a una lemmatizzazione sintetica che non forniva, in output, tutte le informazioni veicolate dalla forma in input (genere, numero, caso, tempo, modo, persona...). La massiccia diffusione di Internet e delle nuove tecnologie apre un nuovo ruolo per gli strumenti di analisi linguistica assistita dal computer: nel caso specifico di LEMLAT, esso potrà essere utilizzato per vari scopi via web e non (ricerca linguistica e letteraria, filologia computazionale, e-learning, information retrieval...). L'ampia utenza che accederà ai dati elaborati da LEMLAT necessita di un'analisi morfologica dell'input più approfondita di quella attuale: il poster presenterà le metodologie e i problemi di implementazione delle nuove funzioni di LEMLAT nell'ambito del progetto C.H.L.T. (Cultural Heritage Language Technologies). (i)LEMLAT è il risultato della ricerca Repertorio Lessicale Automatico Latino ed è brevetto CNR depositato in Italia col n. 564244 in data 18/3/1992. Suoi autori sono A. Bozzi, N. Marinone (aspetto linguistico) e G. Cappelli (aspetto informatico). Su LEMLAT si vedano: |