SI-TAL

Infrastruttura nazionale per le risorse linguistiche nel settore del trattamento automatico della lingua naturale parlata e scritta

Il progetto si propone di fornire una serie di strumenti da utilizzare per lo sviluppo di sistemi industriali che prevedono l'elaborazione del "linguaggio naturale", in particolare italiano. Prevede infatti di mettere a disposizione degli utenti finali:

  • risorse linguistiche come accumuli strutturati di dati tipo risorse linguistiche, grammaticali, una Treebank sintattico-semantica per la lingua italiana, dialoghi annotati per l'analisi del parlato;
  • risorse software strumentali per la creazione rapida di prototipi, la costruzione e la sperimentazione di applicazioni nell'ambito del linguaggio naturale.

Gli utilizzatori finali di SI-TAL saranno sia la comunità di ricerca - accademica e/o industriale - sia gli applicatori e sviluppatori industriali. Per questo motivo, il progetto dedicherà particolare attenzione alle questioni relative alla facilità d'uso delle risorse linguistiche e software prodotte, alla loro conformità a standard industriali qualora esistano e alla rispondenza ai bisogni dell'utente finale. L'obiettivo del progetto è quello di sviluppare i seguenti componenti:

  • ItalWordNet
  • Risorse Grammaticali e Sistema integrato di supporto allo sviluppo di applicazioni
  • Treebank Sintattico-Semantica
  • Dialoghi annotati per applicazioni di interfacce vocali avanzate
  • Strumenti e ambienti di sviluppo software per interfacce vocali avanzate

In SI-TAL, SyNTHEMA è impegnata nella valutazione della componente “Treebank Sintattico Semantica”. L'uso di questa risorsa all’interno del processo di traduzione automatica, in particolare nella fase di disambiguazione lessicale e strutturale nell’analisi di frasi italiane, rende certamente più precisa la traduzione. L’obiettivo è quello di quantificare l’entità del miglioramento dei risultati di traduzione dall’italiano all’inglese di testi economico-finanziari e di fornire indicazioni per una successiva ingegnerizzazione della risorsa Treebank.

(Progetto MURST)

Questo indirizzo e-mail è protetto dallo spam bot. Abilita Javascript per vederlo.