VOCÊ ESTÁ AQUI VOLTAR
 

Pesquisa

 

Núcleo Interinstitucional de Linguística Computacional

 

Laboratório de Pesquisa e Desenvolvimento em Linguística Computacional
Departamento de Ciências de Computação
www.nilc.icmc.usp.br

 


Apresentação

 


O NILC é um grupo de pesquisa e desenvolvimento de recursos, ferramentas e sistemas computacionais de processamento de línguas naturais, especialmente o português. O NILC conta hoje com uma equipe multidisciplinar, de linguistas e cientistas da computação, que talvez seja a maior já formada para o processamento de linguagem natural (PLN) para o português. Destaca-se, neste contexto, a formação de recursos humanos com habilidades interdisciplinares em linguística e informática, de especial relevância para a presente era da informação. Os projetos desenvolvidos no NILC incluem desde estudos fundamentais sobre o tratamento computacional de línguas naturais e construção de recursos, ferramentas e aplicações, até parcerias com o setor produtivo para a transferência de tecnologia. Por exemplo, no projeto pioneiro do NILC, o projeto ReGra, foi desenvolvido um revisor gramatical para o português brasileiro, incorporado ao editor de texto Word da Microsoft, que lhe garante distribuição mundial. O ReGra obteve dois prêmios de Inovação Tecnológica, o Peão da Tecnologia de 1998, outorgado pela Fundação Parque de Alta Tecnologia de São Carlos, e o Prêmio Nacional de Inovação Tecnológica da Alcatel, em 1999. Os trabalhos desenvolvidos no NILC para o processamento computacional do português e em ferramentas de auxílio à escrita e à leitura garantiram sua consolidação, principalmente no cenário nacional. O NILC é um dos poucos grupos, senão o único, que trabalha com sumarização de textos para o português, desenvolvendo métodos e sistemas do estado da arte. O NILC tem atuação internacional marcante, com a participação em um consórcio de pesquisadores de vários países no projeto de tradução automática Universal Networking Language (UNL), concebido pela Universidade das Nações Unidas. O grupo tem parceiros de pesquisa em Portugal, Inglaterra, Espanha e França. Com Portugal, em particular, tem uma colaboração de longa data. As áreas de atuação do NILC incluem: tradução automática, sumarização automática, simplificação de textos, ferramentas de auxílio à leitura e escrita, construção de dicionários e corpora eletrônicos, ferramentas de processamento da língua de níveis linguísticos variados, linguística de corpus, terminologia computacional, e aplicações de técnicas de aprendizado de máquina para PLN, dentre várias outras.

 


Linhas de pesquisa

 


• Construção de recursos linguísticos e computacionais, como corpora e léxicos, para língua geral e especializados.


• Desenvolvimento de ferramentas para processamento da língua, como etiquetadores morfossintáticos, analisadores sintáticos, anotadores de papéis semânticos, analisadores discursivos, sistemas de resolução anafórica, extratores de informação e alinhadores textuais.


• Desenvolvimento de aplicações, como sistemas de auxílio à escrita e à leitura, tradução automática, sumarização de textos, simplificação textual.


• Investigações em avaliação automatizada, linguística de corpus, terminologia computacional, aplicações de redes complexas, aprendizado de máquina para pln e mineração de textos.

 

 

Principais projetos

 


• Construção de recursos e ferramentas para o processamento da língua portuguesa: Construção de recursos linguístico-computacionais e ferramentas de análise textual para a língua portuguesa, como córpus anotados em níveis variados de conhecimento, léxicos e dicionários, analisadores morfológicos e sintáticos, analisadores semânticos e discursivos, dentre vários outros.


• Sumarização automática: Investigação de estratégias de sumarização multidocumento, que corresponde à produção de sumários/resumos a partir de coleções de textos (provenientes da web, principalmente). Objetiva-se desenvolver e modelar o processo automático de sumarização, explorar tarefas correlatas e caracterizar o processo humano de produção de sumários.


• Ferramentas de auxílio à escrita e à leitura: Investigação e desenvolvimento de softwares e tecnologias de auxílio à estruturação e escrita de textos acadêmicos e de simplificação e elaboração textual, para auxiliar na produção de bons textos e para facilitar a inclusão digital e o acesso à informação dos analfabetos funcionais e, potencialmente, de pessoas com outras deficiências cognitivas, como afasia e dislexia.

 

 
Professor Doutor II



UNIVERSIDADE DE SÃO PAULO
INSTITUTO DE CIÊNCIAS MATEMÁTICAS E DE COMPUTAÇÃO - USP

Avenida Trabalhador São-carlense, 400 - Centro
CEP: 13566-590 - São Carlos - SP

Latitude: -22.0055948
Longitude: -47.8933842

VER NO MAPA ACESSE O PORTAL

TELEFONE

55 (16) 3373-9700

FAX

55 (16) 3373-8888

POLÍTICA DE PRIVACIDADE

MAPA DO SITE
  • LOGOFF
    Usuário:


    Nível:
  • ÁREA RESTRITA
Loading