SlideShare une entreprise Scribd logo
1  sur  19
Linguística Computacional e
Recuperação da Informação
Alexandre Ribeiro Afonso
Transferência de Conhecimento
• A transferência de conhecimento entre
humanos ocorre de duas maneiras principais:
– Diretamente
• Pessoa a pessoa, por socialização (conversas não
registradas, emissão e percepção de mensagens
corporais)
– Indiretamente
• Por registros, que guardam um fato, uma ideia, um
evento (Imagens, Livros, Revistas, Áudio, Vídeo)
2
A Transferência do Conhecimento
Ocorre por Meio da Linguagem
• Linguagem
– Matemática
– Programação de Computadores
– Corporal
– Cinematográfica
– A Linguagem Natural (Língua)
• Na transferência de conhecimento sem registro
• Na transferência de conhecimento com registro
(documento)
3
A Informação Imagética Substitui a
Linguística ?
“Se uma imagem vale mais do que mil palavras,
então diga isto com uma imagem.”
Millôr Fernandes
• A língua está presente:
• Nas páginas WEB, redes sociais, artigos
• Vídeos
• Imagens
• Informação Multimodal
4
A Ciência Linguística
“Estudo científico da língua. Investigação por
meio de observações controladas e verificáveis
empiricamente e com referência a uma teoria
geral de sua estrutura.”
Lyons (1979)
5
Níveis Linguísticos
• Fonética e Fonologia
– Descrição e uso dos sons das línguas
• Morfologia
– Como as palavras se formam
• Lexicologia e Lexicografia
– Estudo e construção de dicionários e vocabulários
• Sintaxe
– Observação e descrição da gramática
• Semântica
– Estudo do significado das sentenças
• Pragmática e Discurso
– Estudo da língua em uso, o texto e o discurso
6
Linguística Computacional
Pode ser entendida como “a área de conhecimento que
explora as relações entre linguística e informática,
tornando possível a construção de sistemas com
capacidade de reconhecer e produzir informação
apresentada em linguagem natural.”
Vieira e Lima (2001)
7
Linguística Computacional para
Organização e Recuperação da Inf.
• Sumarização Automática de Textos
• Criação automática de resumos para textos on-line
• Indexação
• Extração de termos-chave para representar um documento
• Mineração de Textos
• Agrupamento e classificação de textos por tema
• Sugestão Automática de Conteúdos
• Sugestão de documentos (vídeos, imagens, texto) de acordo
com o índice de outros elementos acessados pelo usuário
• Interação Humano-Computador
• Interação por texto, fala, por imagem e textos
• Mineração de opiniões em redes sociais
• Busca de opiniões em texto sobre um produto comercializado
8
Estudos em Linguística Computacional
para o Português Brasileiro
• Peculiaridades Linguísticas
– Nomes indígenas e de origem africana no
português do Brasil
– As áreas técnicas e científicas possuem
terminologia própria
– O português brasileiro é mais aberto a
estrangeirismos que o português europeu
– A forma de escrita científica pode diferir, na forma
ou na retórica em cada país, para uma mesma
área do conhecimento
9
NILC – Núcleo Interinstitucional de
Linguística Computacional (1993)
10
http://www.nilc.icmc.usp.br
Português Brasileiro – NILC
(Nível Morfológico)
11
os_ART cursos_N de_PREP preparação_N profissional_ADJ em_PREP educação_N
Física_ADJ
Etiquetagem
Radicalização
aluno, alunos, alunas  alun
básico, basicamente  basic
comprou, comprava  compr
Os cursos de preparação profissional em Educação Física
Português Brasileiro – NILC
(Nível Léxico)
12
Busca de padrões em textos, por
autômatos finitos ou expressões
regulares:
(S): Selecionar todos os substantivos
(S|A): Selecionar todos os substantivos ou
adjetivos
(S prep S): Selecionar o padrão “substantivo
seguido de uma preposição e um substantivo”
(SA): Selecionar o padrão “substantivo seguido
de adjetivo”
Português Brasileiro
(Nível Sintático)
13
Português Brasileiro – NILC
(Nível Semântico)
14
Relações semânticas em rede para Substantivos,
Adjetivos, Verbos, Advérbios
Mercado de Trabalho
• Arquiteto da Informação
– Trabalha com texto, imagem e som nas interfaces
computacionais
• Mineração de Textos
– Utilizando softwares específicos extraem
conhecimento de grandes bases textuais
• Indexador
– Selecionar metadados e termos-chave para
representar documentos textuais, vídeos e
imagens
15
Pesquisa Acadêmica
• Desenvolvimento de software
– Sistemas de reconhecimento da fala
– Sistemas de recuperação da informação
– Sistemas de sumarização automática
– Sistemas para análise de redes sociais
• Estudo da linguagem e registro da informação
– Características da comunicação científica brasileira
e terminologia nas áreas de conhecimento
– Métodos de indexação de documentos jurídicos,
empresarias, científicos, jornalísticos, etc.
16
Sistema B2
17
Bibliografia
• LYONS, J. Introdução à lingüística teórica. São
Paulo: Nacional. 1979.
• VIEIRA, Renata; LIMA, Vera LS. Lingüística
computacional: princípios e aplicações.
In: Anais do XXI Congresso da SBC. I Jornada
de Atualização em Inteligência Artificial.
2001. p. 47-86.
18
Obrigado
rafonso.alex@gmail.com
19

Contenu connexe

En vedette

Melhoria de Processos de Software
Melhoria de Processos de SoftwareMelhoria de Processos de Software
Melhoria de Processos de SoftwareAlessandro Almeida
 
[slides] Gestão da TI (2015: 2º semestre)
[slides] Gestão da TI (2015: 2º semestre)[slides] Gestão da TI (2015: 2º semestre)
[slides] Gestão da TI (2015: 2º semestre)Alessandro Almeida
 
[slides] Empreendedorismo (2015: 2º semestre)
[slides] Empreendedorismo (2015: 2º semestre)[slides] Empreendedorismo (2015: 2º semestre)
[slides] Empreendedorismo (2015: 2º semestre)Alessandro Almeida
 
Gestão matricial do orçamento
Gestão matricial do orçamentoGestão matricial do orçamento
Gestão matricial do orçamentoPriscila Nogueira
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneAndré Luis Schwerz
 
Text Mining
Text MiningText Mining
Text Miningdp6
 
12 pmbok5 cap12 aquisicoes
12   pmbok5 cap12 aquisicoes12   pmbok5 cap12 aquisicoes
12 pmbok5 cap12 aquisicoesRoberto Pallesi
 
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)Gestão da Mudança Organizacional (1ª edição - 16/01/2014)
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)Alessandro Almeida
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauLeandro Guerra
 
[slides] Gestão de Projetos (2015: 2º semestre)
[slides] Gestão de Projetos (2015: 2º semestre)[slides] Gestão de Projetos (2015: 2º semestre)
[slides] Gestão de Projetos (2015: 2º semestre)Alessandro Almeida
 
[slides] Gestão de Riscos (2013: 1º semestre)
[slides] Gestão de Riscos (2013: 1º semestre)[slides] Gestão de Riscos (2013: 1º semestre)
[slides] Gestão de Riscos (2013: 1º semestre)Alessandro Almeida
 
[ebook] Gestão da TI - versão 0.1
[ebook] Gestão da TI - versão 0.1[ebook] Gestão da TI - versão 0.1
[ebook] Gestão da TI - versão 0.1Alessandro Almeida
 
[palestra] Definindo a estratégia com Design Thinking e Canvas
[palestra] Definindo a estratégia com Design Thinking e Canvas[palestra] Definindo a estratégia com Design Thinking e Canvas
[palestra] Definindo a estratégia com Design Thinking e CanvasAlessandro Almeida
 
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"Alessandro Almeida
 
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)[slides] Introdução à Gestão de Projetos (2015: 2º semestre)
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)Alessandro Almeida
 

En vedette (20)

E marketing chocolate
E marketing chocolateE marketing chocolate
E marketing chocolate
 
Melhoria de Processos de Software
Melhoria de Processos de SoftwareMelhoria de Processos de Software
Melhoria de Processos de Software
 
Arqemail
ArqemailArqemail
Arqemail
 
Histórias com sabor a canela
Histórias com sabor a canelaHistórias com sabor a canela
Histórias com sabor a canela
 
[slides] Gestão da TI (2015: 2º semestre)
[slides] Gestão da TI (2015: 2º semestre)[slides] Gestão da TI (2015: 2º semestre)
[slides] Gestão da TI (2015: 2º semestre)
 
[slides] Empreendedorismo (2015: 2º semestre)
[slides] Empreendedorismo (2015: 2º semestre)[slides] Empreendedorismo (2015: 2º semestre)
[slides] Empreendedorismo (2015: 2º semestre)
 
Gestão matricial do orçamento
Gestão matricial do orçamentoGestão matricial do orçamento
Gestão matricial do orçamento
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
 
Text Mining
Text MiningText Mining
Text Mining
 
12 pmbok5 cap12 aquisicoes
12   pmbok5 cap12 aquisicoes12   pmbok5 cap12 aquisicoes
12 pmbok5 cap12 aquisicoes
 
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)Gestão da Mudança Organizacional (1ª edição - 16/01/2014)
Gestão da Mudança Organizacional (1ª edição - 16/01/2014)
 
4º SGTI UNA - Workshop de gerenciamento de projetos utilizando metodologias á...
4º SGTI UNA - Workshop de gerenciamento de projetos utilizando metodologias á...4º SGTI UNA - Workshop de gerenciamento de projetos utilizando metodologias á...
4º SGTI UNA - Workshop de gerenciamento de projetos utilizando metodologias á...
 
Text Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no TableauText Mining para BI e Finalização do Dashboard no Tableau
Text Mining para BI e Finalização do Dashboard no Tableau
 
[slides] Gestão de Projetos (2015: 2º semestre)
[slides] Gestão de Projetos (2015: 2º semestre)[slides] Gestão de Projetos (2015: 2º semestre)
[slides] Gestão de Projetos (2015: 2º semestre)
 
[slides] Gestão de Riscos (2013: 1º semestre)
[slides] Gestão de Riscos (2013: 1º semestre)[slides] Gestão de Riscos (2013: 1º semestre)
[slides] Gestão de Riscos (2013: 1º semestre)
 
[ebook] Gestão da TI - versão 0.1
[ebook] Gestão da TI - versão 0.1[ebook] Gestão da TI - versão 0.1
[ebook] Gestão da TI - versão 0.1
 
[palestra] Definindo a estratégia com Design Thinking e Canvas
[palestra] Definindo a estratégia com Design Thinking e Canvas[palestra] Definindo a estratégia com Design Thinking e Canvas
[palestra] Definindo a estratégia com Design Thinking e Canvas
 
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"
[Gestão da TI] Governança de TI: Modelos, certificações e "melhores práticas"
 
O Livro dos Espíritos
O Livro dos EspíritosO Livro dos Espíritos
O Livro dos Espíritos
 
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)[slides] Introdução à Gestão de Projetos (2015: 2º semestre)
[slides] Introdução à Gestão de Projetos (2015: 2º semestre)
 

Similaire à Apresentação sobre Linguística computacional e recuperação da informação no ENEBD 2014 - Prof. Alexandre Ribeiro Afonso

Aula 1 tecnicas de retorica e oratoria
Aula 1   tecnicas de retorica e oratoriaAula 1   tecnicas de retorica e oratoria
Aula 1 tecnicas de retorica e oratoriaLuiz
 
Práticas de Linguagem e Design: algumas questões de usabilidade no contexto ...
Práticas de Linguagem e Design: algumas questões de usabilidade no  contexto ...Práticas de Linguagem e Design: algumas questões de usabilidade no  contexto ...
Práticas de Linguagem e Design: algumas questões de usabilidade no contexto ...André Constantino da Silva
 
Avaliação de recursos educativos digitais
Avaliação de recursos educativos digitaisAvaliação de recursos educativos digitais
Avaliação de recursos educativos digitaisCarlos Pinheiro
 
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXIDa sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXIJoel S. Coleti
 
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...Claudio Franco
 
If baiano catu ihc - avaliação surpresa (respondida)
If baiano catu   ihc - avaliação surpresa (respondida)If baiano catu   ihc - avaliação surpresa (respondida)
If baiano catu ihc - avaliação surpresa (respondida)IFBaiano
 
Design Science Research: método de pesquisa científica com desenvolvimento de...
Design Science Research: método de pesquisa científica com desenvolvimento de...Design Science Research: método de pesquisa científica com desenvolvimento de...
Design Science Research: método de pesquisa científica com desenvolvimento de...Mariano Pimentel
 
Sistemas de Processamento de Linguagem Natural na Prática
Sistemas de Processamento de Linguagem Natural na PráticaSistemas de Processamento de Linguagem Natural na Prática
Sistemas de Processamento de Linguagem Natural na PráticaWilliam Colen
 
REA - Recursos Educacionais Abertos
REA - Recursos Educacionais AbertosREA - Recursos Educacionais Abertos
REA - Recursos Educacionais AbertosIsmar Silveira
 
Participação do Bibliotecário na criação de softwares Xii Seab 2007
Participação do Bibliotecário na criação de softwares Xii Seab 2007Participação do Bibliotecário na criação de softwares Xii Seab 2007
Participação do Bibliotecário na criação de softwares Xii Seab 2007Gisele Dziekaniak
 
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...Joel S. Coleti
 
Digital Storytelling como ferramenta pedagógica
Digital Storytelling como ferramenta pedagógicaDigital Storytelling como ferramenta pedagógica
Digital Storytelling como ferramenta pedagógicaCarlos Pinheiro
 
Palestra - Arquitetura de Informação e Usabilidade
Palestra - Arquitetura de Informação e UsabilidadePalestra - Arquitetura de Informação e Usabilidade
Palestra - Arquitetura de Informação e UsabilidadeLuiz Agner
 
Apresentação Dicionário 22
Apresentação  Dicionário 22Apresentação  Dicionário 22
Apresentação Dicionário 22esteribeiroc
 
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...Wanderley Wang
 

Similaire à Apresentação sobre Linguística computacional e recuperação da informação no ENEBD 2014 - Prof. Alexandre Ribeiro Afonso (20)

Aula 1 tecnicas de retorica e oratoria
Aula 1   tecnicas de retorica e oratoriaAula 1   tecnicas de retorica e oratoria
Aula 1 tecnicas de retorica e oratoria
 
Grelha analise red_ (2)
Grelha analise red_ (2)Grelha analise red_ (2)
Grelha analise red_ (2)
 
Práticas de Linguagem e Design: algumas questões de usabilidade no contexto ...
Práticas de Linguagem e Design: algumas questões de usabilidade no  contexto ...Práticas de Linguagem e Design: algumas questões de usabilidade no  contexto ...
Práticas de Linguagem e Design: algumas questões de usabilidade no contexto ...
 
Avaliação de recursos educativos digitais
Avaliação de recursos educativos digitaisAvaliação de recursos educativos digitais
Avaliação de recursos educativos digitais
 
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXIDa sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXI
 
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...
Novas Tecnologias no ensino de lingua estrangeira para fins especificos (Part...
 
If baiano catu ihc - avaliação surpresa (respondida)
If baiano catu   ihc - avaliação surpresa (respondida)If baiano catu   ihc - avaliação surpresa (respondida)
If baiano catu ihc - avaliação surpresa (respondida)
 
IPC - Semantic Web
IPC - Semantic WebIPC - Semantic Web
IPC - Semantic Web
 
Design Science Research: método de pesquisa científica com desenvolvimento de...
Design Science Research: método de pesquisa científica com desenvolvimento de...Design Science Research: método de pesquisa científica com desenvolvimento de...
Design Science Research: método de pesquisa científica com desenvolvimento de...
 
Sistemas de Processamento de Linguagem Natural na Prática
Sistemas de Processamento de Linguagem Natural na PráticaSistemas de Processamento de Linguagem Natural na Prática
Sistemas de Processamento de Linguagem Natural na Prática
 
REA - Recursos Educacionais Abertos
REA - Recursos Educacionais AbertosREA - Recursos Educacionais Abertos
REA - Recursos Educacionais Abertos
 
Participação do Bibliotecário na criação de softwares Xii Seab 2007
Participação do Bibliotecário na criação de softwares Xii Seab 2007Participação do Bibliotecário na criação de softwares Xii Seab 2007
Participação do Bibliotecário na criação de softwares Xii Seab 2007
 
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
 
Internet e Educa
Internet e EducaInternet e Educa
Internet e Educa
 
Digital Storytelling como ferramenta pedagógica
Digital Storytelling como ferramenta pedagógicaDigital Storytelling como ferramenta pedagógica
Digital Storytelling como ferramenta pedagógica
 
Palestra - Arquitetura de Informação e Usabilidade
Palestra - Arquitetura de Informação e UsabilidadePalestra - Arquitetura de Informação e Usabilidade
Palestra - Arquitetura de Informação e Usabilidade
 
Setecseminario gravata
Setecseminario gravataSetecseminario gravata
Setecseminario gravata
 
DicionáRio
DicionáRioDicionáRio
DicionáRio
 
Apresentação Dicionário 22
Apresentação  Dicionário 22Apresentação  Dicionário 22
Apresentação Dicionário 22
 
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...
Uso de uma Base de Conhecimento de Senso Comum em Projetos de Arquitetura da ...
 

Apresentação sobre Linguística computacional e recuperação da informação no ENEBD 2014 - Prof. Alexandre Ribeiro Afonso

  • 1. Linguística Computacional e Recuperação da Informação Alexandre Ribeiro Afonso
  • 2. Transferência de Conhecimento • A transferência de conhecimento entre humanos ocorre de duas maneiras principais: – Diretamente • Pessoa a pessoa, por socialização (conversas não registradas, emissão e percepção de mensagens corporais) – Indiretamente • Por registros, que guardam um fato, uma ideia, um evento (Imagens, Livros, Revistas, Áudio, Vídeo) 2
  • 3. A Transferência do Conhecimento Ocorre por Meio da Linguagem • Linguagem – Matemática – Programação de Computadores – Corporal – Cinematográfica – A Linguagem Natural (Língua) • Na transferência de conhecimento sem registro • Na transferência de conhecimento com registro (documento) 3
  • 4. A Informação Imagética Substitui a Linguística ? “Se uma imagem vale mais do que mil palavras, então diga isto com uma imagem.” Millôr Fernandes • A língua está presente: • Nas páginas WEB, redes sociais, artigos • Vídeos • Imagens • Informação Multimodal 4
  • 5. A Ciência Linguística “Estudo científico da língua. Investigação por meio de observações controladas e verificáveis empiricamente e com referência a uma teoria geral de sua estrutura.” Lyons (1979) 5
  • 6. Níveis Linguísticos • Fonética e Fonologia – Descrição e uso dos sons das línguas • Morfologia – Como as palavras se formam • Lexicologia e Lexicografia – Estudo e construção de dicionários e vocabulários • Sintaxe – Observação e descrição da gramática • Semântica – Estudo do significado das sentenças • Pragmática e Discurso – Estudo da língua em uso, o texto e o discurso 6
  • 7. Linguística Computacional Pode ser entendida como “a área de conhecimento que explora as relações entre linguística e informática, tornando possível a construção de sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural.” Vieira e Lima (2001) 7
  • 8. Linguística Computacional para Organização e Recuperação da Inf. • Sumarização Automática de Textos • Criação automática de resumos para textos on-line • Indexação • Extração de termos-chave para representar um documento • Mineração de Textos • Agrupamento e classificação de textos por tema • Sugestão Automática de Conteúdos • Sugestão de documentos (vídeos, imagens, texto) de acordo com o índice de outros elementos acessados pelo usuário • Interação Humano-Computador • Interação por texto, fala, por imagem e textos • Mineração de opiniões em redes sociais • Busca de opiniões em texto sobre um produto comercializado 8
  • 9. Estudos em Linguística Computacional para o Português Brasileiro • Peculiaridades Linguísticas – Nomes indígenas e de origem africana no português do Brasil – As áreas técnicas e científicas possuem terminologia própria – O português brasileiro é mais aberto a estrangeirismos que o português europeu – A forma de escrita científica pode diferir, na forma ou na retórica em cada país, para uma mesma área do conhecimento 9
  • 10. NILC – Núcleo Interinstitucional de Linguística Computacional (1993) 10 http://www.nilc.icmc.usp.br
  • 11. Português Brasileiro – NILC (Nível Morfológico) 11 os_ART cursos_N de_PREP preparação_N profissional_ADJ em_PREP educação_N Física_ADJ Etiquetagem Radicalização aluno, alunos, alunas  alun básico, basicamente  basic comprou, comprava  compr Os cursos de preparação profissional em Educação Física
  • 12. Português Brasileiro – NILC (Nível Léxico) 12 Busca de padrões em textos, por autômatos finitos ou expressões regulares: (S): Selecionar todos os substantivos (S|A): Selecionar todos os substantivos ou adjetivos (S prep S): Selecionar o padrão “substantivo seguido de uma preposição e um substantivo” (SA): Selecionar o padrão “substantivo seguido de adjetivo”
  • 14. Português Brasileiro – NILC (Nível Semântico) 14 Relações semânticas em rede para Substantivos, Adjetivos, Verbos, Advérbios
  • 15. Mercado de Trabalho • Arquiteto da Informação – Trabalha com texto, imagem e som nas interfaces computacionais • Mineração de Textos – Utilizando softwares específicos extraem conhecimento de grandes bases textuais • Indexador – Selecionar metadados e termos-chave para representar documentos textuais, vídeos e imagens 15
  • 16. Pesquisa Acadêmica • Desenvolvimento de software – Sistemas de reconhecimento da fala – Sistemas de recuperação da informação – Sistemas de sumarização automática – Sistemas para análise de redes sociais • Estudo da linguagem e registro da informação – Características da comunicação científica brasileira e terminologia nas áreas de conhecimento – Métodos de indexação de documentos jurídicos, empresarias, científicos, jornalísticos, etc. 16
  • 18. Bibliografia • LYONS, J. Introdução à lingüística teórica. São Paulo: Nacional. 1979. • VIEIRA, Renata; LIMA, Vera LS. Lingüística computacional: princípios e aplicações. In: Anais do XXI Congresso da SBC. I Jornada de Atualização em Inteligência Artificial. 2001. p. 47-86. 18