SlideShare une entreprise Scribd logo
1  sur  39
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnologia: Problemas e Soluções
Projeto Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto” (apoio CNPq, processo 400506/2006-8)
Equipe Coordenadora: Gladis Maria de Barcellos Almeida (UFSCar) Pesquisadores: Daniela Ferreira de Mattos (UFSCar – IC) Joel Sossai Coleti (UFSCar – IC) Colaboradores: Ariane Di Felippo (UNESP – PG) Luiz Carlos Genoves Jr (Google) Arnaldo Candido Júnior (USP – PG) Leandro Henrique Mendonça de Oliveira (EMBRAPA)  Sandra Maria Aluisio (USP) Osvaldo Novais de Oliveira (USP)
Nanociência e Nanotecnologia Nano-, prefixo grego, remete a nánnos ' de excessiva pequenez '  Um nanômetro corresponde a  10 -9  metros
Nanociência e Nanotecnologia ... o diâmetro de um fio de cabelo humano mede cerca de  30.000 nanômetros
Nanociência e Nanotecnologia O termo  Nanotecnologia  foi criado em 1974 por Norio Taniguchi, da Universidade de Tóquio, para diferenciar os trabalhos de engenharia no domínio da microescala dos trabalhos em submicroescala, os quais ele denominou nanotecnologia.
Nanociência e Nanotecnologia Fazem parte dos estudos em N&N as capacidades de  medir, manusear e organizar  a matéria em nanoescala, já que nessa escala a matéria apresenta  propriedades, fenômenos e processos únicos .
Motivação Nanociência e Nanotecnologia (N&N):  crescente expansão  no mundo todo.  Os investimentos aplicados nessa área  aumentam  a cada ano.
Motivação No Brasil, o cenário para pesquisas em N&N, embora  promissor,  apresenta grandes  defasagens . Segundo a Agência Brasil, pelos cálculos do MCT, nos últimos cinco anos, foram investidos R$ 140 milhões. Já nos Estados Unidos, apenas em 2006, foram investidos cerca de US$ 1 bilhão.* *  http://www.agenciabrasil.gov.br/noticias/2006/11/14/materia.2006-11-14.1809655804/view
Proposta Para acompanhar esse  desenvolvimento científico e tecnológico , além de investimentos financeiros expressivos e formação de recursos humanos especializados, é preponderante a  sistematização de repertórios vocabulares  em língua portuguesa.
Objetivos ,[object Object],[object Object],[object Object],[object Object],Etapas Metodológicas: 1- Seleção 2- Compilação e Manipulação 3- Nomeação de arquivos, geração de cabeçalho e Anotação
Metodologia (1) – Seleção ,[object Object],[object Object],[object Object]
Metodologia (1) – Seleção ,[object Object],[object Object],[object Object],Palavras-chaves pré-definidas pela repetição de procedimentos metodológicos adotados no projeto “Desenvolvimento de uma ontologia (estrutura conceitual) para área de N&N” (NILC/ICMC/USP – Campus de São Carlos, SP-Brasil)
Metodologia (1) – Seleção ,[object Object],[object Object]
Metodologia (1) – Seleção Seleção: Problemas e Soluções ,[object Object],[object Object]
Metodologia (2) – Compilação e Manipulação Compilação: Problemas e Soluções ,[object Object],[object Object]
Metodologia (2) – Compilação e Manipulação Compilação: Problemas e Soluções 1. DURAN, N; MATTOSO, L.H.C; MORAIS, P.C.  Nanotecnologia: introdução, preparação e caracterização de nanomateriais e exemplos de aplicação.  São Paulo: Artliber, 2006. 2. ALVES, E. G.; CHAVES, A. S.; VALADARES, E. C.  Aplicações da física quântica do transistor à nanotecnologia . São Paulo: Editora Livraria da Física. 2005. 3. TOMA H. E.  O Mundo Nanométrico: A Dimensão do Novo Século.  São Paulo: Oficina de Textos. 2004. 4. CNI/SENAI.  Nanotecnologias. Série ocupações emergentes.  nº 1. Brasília, 2004.
Metodologia (2) – Compilação e Manipulação
Metodologia (2) – Compilação e Manipulação
Metodologia (2) – Compilação e Manipulação
Metodologia (2) – Compilação e Manipulação Manipulação: Problemas e Soluções ,[object Object],[object Object],[object Object],[object Object],[object Object]
Metodologia (2) – Compilação e Manipulação ,[object Object],[object Object],[object Object],[object Object],[object Object]
Metodologia (2) – Compilação e Manipulação ,[object Object]
Anotação Estrutural A anotação estrutural compreende a marcação de dados externos e internos dos textos. Como dados externos entendemos a documentação do corpus (...) isto é, dados bibliográficos comuns, dados de catalogação como tamanho do arquivo, tipo da autoria, a tipologia textual e informação sobre a distribuição do corpus. Como dados internos temos a anotação de segmentação do texto cru, que envolve: a) marcação da estrutura geral – capítulos, parágrafos, títulos e subtítulos, notas de rodapé e elementos gráficos como tabelas e figuras, e b) marcação da estrutura de subparágrafos – elementos que são de interesse lingüístico, tais como sentenças, citações, palavras, abreviações, nomes, referências, datas e ênfases tipográficas do tipo negrito, itálico, sublinhado, etc. (Aluísio & Almeida, 2006)
Metodologia (3) – Anotação e Nomeação Editor de Cabeçalhos Editor de Cabeçalhos do Projeto Lacio- Web  adaptado por Luiz Carlos Genoves Jr. (NILC – USP)
Anotação Estrutural Externa - Cabeçalho Metodologia (3) – Anotação e Nomeação
Texto:  Rumo a Nanotecnologia Global Nome do arquivo:  IN-IF-AF-not-07nov06 Numero de Palavras:  206 Amostra:  Íntegra Língua:  Português do Brasil (PB) Fonte:  Agência Fapesp Local de Publicação:  São Paulo Data:  07 de novembro de 2006 Status:  Original Comentários:  Caderno “Notícias” Data de Acesso:  16 de novembro de 2006 Endereço Eletrônico:  http://www.agencia.fapesp.br/boletim_dentro.php?id=6307 Tipo de Autoria:  Individual Nome do Autor do Texto:  Thiago Romero Sexo do autor:  Masculino Gênero:  Informativo Subgênero:  Jornalístico Tipo Textual:  Reportagem Domínio Geral:  Generalidades Domínio Específico:  Ciência & Tecnologia Definição:  Anotador Distribuição:  Internet (IN) Metodologia (3) – Anotação e Nomeação
Anotação Estrutural Interna - Etiquetas Metodologia (3) – Anotação e Nomeação
Metodologia (3) – Anotação e Nomeação
Nomeação ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Metodologia (3) – Anotação e Nomeação
Nomeação Exemplo: Para textos científicos de divulgação: IN-CD-INOVATEC-nanotec-05jul06 IN : Texto divulgado pela Internet CD : Gênero textual Científico de Divulgação INOVATEC : Sigla que representa a Fonte (Inovação Tecnológica) nanotec : Sigla que representa o caderno/seção em que o texto foi publicado na fonte (Seção Nanotecnologia) 05jul06 : Data de publicação (05 de julho de 2006) Metodologia (3) – Anotação e Nomeação
Resultados Autenticidade ,[object Object],[object Object]
Resultados Tamanho finito: 2.565.490 palavras
Resultados Representatividade ,[object Object],[object Object]
Resultados Balanceamento  e  Amostragem ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Resultados Balanceamento  e  Amostragem ,[object Object]
Reuso do Corpus “ Estruturação do Conhecimento e Relações Semânticas: uma Ontologia para o Domínio de Nanociência e Nanotecnologia Deni Yuzo Kasama (Mestrado) “ Geração de Ontologias para Web Semântica a partir de Textos da Língua Portuguesa” Luiz Carlos Ribeiro Junior (Mestrado) “ Estruturação e Sistematização do Conhecimento em Ambientes Interativos de Aprendizagem”  David Nadler Prata (Doutorado)
Saiba mais www.joelsc.wordpress.com/publicacoes   Coleti, J. S.; Mattos, D. F.; Genoves Jr., l c; CANDIDO JR., A.; Di Felippo, A; ALMEIDA, G. M. B.; ALUÍSIO, S. M.; Oliveira Jr., O. N. (2007) Compilação de Corpus em Língua Portuguesa na Área de Nanociência/ Nanotecnologia: Problemas e Soluções. Anais do VI Encontro de Lingüística de Corpus. São Paulo, São Paulo: USP, Brasil, 2007.
MUITO OBRIGADO!!

Contenu connexe

Similaire à Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnologia: Problemas e Soluções

Programa da disciplina elab gest ling_documentaria_2011
Programa da disciplina elab gest ling_documentaria_2011Programa da disciplina elab gest ling_documentaria_2011
Programa da disciplina elab gest ling_documentaria_2011
cibeleac
 
Pesquisa bibliografica: Engenharia
Pesquisa bibliografica: EngenhariaPesquisa bibliografica: Engenharia
Pesquisa bibliografica: Engenharia
Leticia Strehl
 
AnáLise Da InformaçãO
AnáLise Da InformaçãOAnáLise Da InformaçãO
AnáLise Da InformaçãO
lulinha
 
Metodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNTMetodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNT
Biblioteca ICE-UFJF
 
Metodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNTMetodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNT
bibliotecaclorindoburnier
 
Linguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e TraduçãoLinguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e Tradução
Bruno Sampaio Garrido
 

Similaire à Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnologia: Problemas e Soluções (20)

Leituras complementares: Estudo preliminar do Tesauro Brasileiro de Ciências ...
Leituras complementares: Estudo preliminar do Tesauro Brasileiro de Ciências ...Leituras complementares: Estudo preliminar do Tesauro Brasileiro de Ciências ...
Leituras complementares: Estudo preliminar do Tesauro Brasileiro de Ciências ...
 
Programa da disciplina elab gest ling_documentaria_2011
Programa da disciplina elab gest ling_documentaria_2011Programa da disciplina elab gest ling_documentaria_2011
Programa da disciplina elab gest ling_documentaria_2011
 
Planejar gêneros acadêmicos cesp
 Planejar gêneros acadêmicos   cesp Planejar gêneros acadêmicos   cesp
Planejar gêneros acadêmicos cesp
 
As ferramentas, os percursos e as estratégias de tradução no universo digital...
As ferramentas, os percursos e as estratégias de tradução no universo digital...As ferramentas, os percursos e as estratégias de tradução no universo digital...
As ferramentas, os percursos e as estratégias de tradução no universo digital...
 
Comoelaborarresumo
ComoelaborarresumoComoelaborarresumo
Comoelaborarresumo
 
Pesquisa bibliografica: Engenharia
Pesquisa bibliografica: EngenhariaPesquisa bibliografica: Engenharia
Pesquisa bibliografica: Engenharia
 
AnáLise Da InformaçãO
AnáLise Da InformaçãOAnáLise Da InformaçãO
AnáLise Da InformaçãO
 
Defesa Mestrado
Defesa MestradoDefesa Mestrado
Defesa Mestrado
 
Metodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNTMetodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNT
 
Metodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNTMetodologia da pesquisa científica e normas da ABNT
Metodologia da pesquisa científica e normas da ABNT
 
Elaborar um trabalho de pesquisa
Elaborar um trabalho de pesquisaElaborar um trabalho de pesquisa
Elaborar um trabalho de pesquisa
 
Gestão Editorial: qualidade do periódico com foco na internacionalização
Gestão Editorial: qualidade do periódico com foco na internacionalizaçãoGestão Editorial: qualidade do periódico com foco na internacionalização
Gestão Editorial: qualidade do periódico com foco na internacionalização
 
Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)Presentation about Ontologies at my Masters (UFMG, pt_BR)
Presentation about Ontologies at my Masters (UFMG, pt_BR)
 
Abnt unicamp
Abnt unicampAbnt unicamp
Abnt unicamp
 
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogarRecursos didáticos: produzir, encontrar, remixar, organizar, catalogar
Recursos didáticos: produzir, encontrar, remixar, organizar, catalogar
 
#3# ebsco e b on-workshop de doutoramento__27 e 28 novembro 2015.ppt
#3# ebsco e b on-workshop de doutoramento__27 e 28 novembro 2015.ppt#3# ebsco e b on-workshop de doutoramento__27 e 28 novembro 2015.ppt
#3# ebsco e b on-workshop de doutoramento__27 e 28 novembro 2015.ppt
 
CST EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS IFPB 3º PERÍODO METODOLOGIA DA P...
CST EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS IFPB 3º PERÍODO METODOLOGIA DA P...CST EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS IFPB 3º PERÍODO METODOLOGIA DA P...
CST EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS IFPB 3º PERÍODO METODOLOGIA DA P...
 
Guia de normalização ABNT para referências e citações
Guia de normalização ABNT para referências e citaçõesGuia de normalização ABNT para referências e citações
Guia de normalização ABNT para referências e citações
 
Linguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e TraduçãoLinguística de Corpus, Terminologia e Tradução
Linguística de Corpus, Terminologia e Tradução
 
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
 

Plus de Joel S. Coleti

Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Joel S. Coleti
 
Seminário Bom Dia Camaradas de Ondjaki
Seminário Bom Dia Camaradas de OndjakiSeminário Bom Dia Camaradas de Ondjaki
Seminário Bom Dia Camaradas de Ondjaki
Joel S. Coleti
 
Rotaract Club de Santa Cruz das Palmeiras - 2009
Rotaract Club de Santa Cruz das Palmeiras - 2009Rotaract Club de Santa Cruz das Palmeiras - 2009
Rotaract Club de Santa Cruz das Palmeiras - 2009
Joel S. Coleti
 

Plus de Joel S. Coleti (8)

Da sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXIDa sala de aula ao corretor e tradutor automáticos: Letras no século XXI
Da sala de aula ao corretor e tradutor automáticos: Letras no século XXI
 
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
 
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
 
A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica
A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica
A terminologia da Nanociência e Nanotecnologia: descrição e análise morfológica
 
Base de dados morfológicos de terminologias do português do Brasil: descrição...
Base de dados morfológicos de terminologias do português do Brasil: descrição...Base de dados morfológicos de terminologias do português do Brasil: descrição...
Base de dados morfológicos de terminologias do português do Brasil: descrição...
 
Projeto de candidatura para CODIRC 2011 (D. 4590)
Projeto de candidatura para CODIRC 2011 (D. 4590)Projeto de candidatura para CODIRC 2011 (D. 4590)
Projeto de candidatura para CODIRC 2011 (D. 4590)
 
Seminário Bom Dia Camaradas de Ondjaki
Seminário Bom Dia Camaradas de OndjakiSeminário Bom Dia Camaradas de Ondjaki
Seminário Bom Dia Camaradas de Ondjaki
 
Rotaract Club de Santa Cruz das Palmeiras - 2009
Rotaract Club de Santa Cruz das Palmeiras - 2009Rotaract Club de Santa Cruz das Palmeiras - 2009
Rotaract Club de Santa Cruz das Palmeiras - 2009
 

Dernier

Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
TailsonSantos1
 
8 Aula de predicado verbal e nominal - Predicativo do sujeito
8 Aula de predicado verbal e nominal - Predicativo do sujeito8 Aula de predicado verbal e nominal - Predicativo do sujeito
8 Aula de predicado verbal e nominal - Predicativo do sujeito
tatianehilda
 
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
HELENO FAVACHO
 

Dernier (20)

Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfRecomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
 
Educação Financeira - Cartão de crédito665933.pptx
Educação Financeira - Cartão de crédito665933.pptxEducação Financeira - Cartão de crédito665933.pptx
Educação Financeira - Cartão de crédito665933.pptx
 
Conflitos entre: ISRAEL E PALESTINA.pdf
Conflitos entre:  ISRAEL E PALESTINA.pdfConflitos entre:  ISRAEL E PALESTINA.pdf
Conflitos entre: ISRAEL E PALESTINA.pdf
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
P P P 2024 - *CIEJA Santana / Tucuruvi*
P P P 2024  - *CIEJA Santana / Tucuruvi*P P P 2024  - *CIEJA Santana / Tucuruvi*
P P P 2024 - *CIEJA Santana / Tucuruvi*
 
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptxTeoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
Teoria heterotrófica e autotrófica dos primeiros seres vivos..pptx
 
Sistema de Bibliotecas UCS - Cantos do fim do século
Sistema de Bibliotecas UCS  - Cantos do fim do séculoSistema de Bibliotecas UCS  - Cantos do fim do século
Sistema de Bibliotecas UCS - Cantos do fim do século
 
8 Aula de predicado verbal e nominal - Predicativo do sujeito
8 Aula de predicado verbal e nominal - Predicativo do sujeito8 Aula de predicado verbal e nominal - Predicativo do sujeito
8 Aula de predicado verbal e nominal - Predicativo do sujeito
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
 
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdfTCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
TCC_MusicaComoLinguagemNaAlfabetização-ARAUJOfranklin-UFBA.pdf
 
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIAPROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
 
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdfPROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
PROJETO DE EXTENÇÃO - GESTÃO DE RECURSOS HUMANOS.pdf
 
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdfProjeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
Projeto_de_Extensão_Agronomia_adquira_ja_(91)_98764-0830.pdf
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
LENDA DA MANDIOCA - leitura e interpretação
LENDA DA MANDIOCA - leitura e interpretaçãoLENDA DA MANDIOCA - leitura e interpretação
LENDA DA MANDIOCA - leitura e interpretação
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
 
Cartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptxCartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptx
 
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
 
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
PROJETO DE EXTENSÃO I - TECNOLOGIA DA INFORMAÇÃO Relatório Final de Atividade...
 

Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnologia: Problemas e Soluções

  • 1. Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnologia: Problemas e Soluções
  • 2. Projeto Terminologia em Língua Portuguesa da Nanociência e Nanotecnologia: Sistematização do Repertório Vocabular e Elaboração de Dicionário-Piloto” (apoio CNPq, processo 400506/2006-8)
  • 3. Equipe Coordenadora: Gladis Maria de Barcellos Almeida (UFSCar) Pesquisadores: Daniela Ferreira de Mattos (UFSCar – IC) Joel Sossai Coleti (UFSCar – IC) Colaboradores: Ariane Di Felippo (UNESP – PG) Luiz Carlos Genoves Jr (Google) Arnaldo Candido Júnior (USP – PG) Leandro Henrique Mendonça de Oliveira (EMBRAPA) Sandra Maria Aluisio (USP) Osvaldo Novais de Oliveira (USP)
  • 4. Nanociência e Nanotecnologia Nano-, prefixo grego, remete a nánnos ' de excessiva pequenez ' Um nanômetro corresponde a 10 -9 metros
  • 5. Nanociência e Nanotecnologia ... o diâmetro de um fio de cabelo humano mede cerca de 30.000 nanômetros
  • 6. Nanociência e Nanotecnologia O termo Nanotecnologia foi criado em 1974 por Norio Taniguchi, da Universidade de Tóquio, para diferenciar os trabalhos de engenharia no domínio da microescala dos trabalhos em submicroescala, os quais ele denominou nanotecnologia.
  • 7. Nanociência e Nanotecnologia Fazem parte dos estudos em N&N as capacidades de medir, manusear e organizar a matéria em nanoescala, já que nessa escala a matéria apresenta propriedades, fenômenos e processos únicos .
  • 8. Motivação Nanociência e Nanotecnologia (N&N): crescente expansão no mundo todo. Os investimentos aplicados nessa área aumentam a cada ano.
  • 9. Motivação No Brasil, o cenário para pesquisas em N&N, embora promissor, apresenta grandes defasagens . Segundo a Agência Brasil, pelos cálculos do MCT, nos últimos cinco anos, foram investidos R$ 140 milhões. Já nos Estados Unidos, apenas em 2006, foram investidos cerca de US$ 1 bilhão.* * http://www.agenciabrasil.gov.br/noticias/2006/11/14/materia.2006-11-14.1809655804/view
  • 10. Proposta Para acompanhar esse desenvolvimento científico e tecnológico , além de investimentos financeiros expressivos e formação de recursos humanos especializados, é preponderante a sistematização de repertórios vocabulares em língua portuguesa.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. Metodologia (2) – Compilação e Manipulação Compilação: Problemas e Soluções 1. DURAN, N; MATTOSO, L.H.C; MORAIS, P.C. Nanotecnologia: introdução, preparação e caracterização de nanomateriais e exemplos de aplicação. São Paulo: Artliber, 2006. 2. ALVES, E. G.; CHAVES, A. S.; VALADARES, E. C. Aplicações da física quântica do transistor à nanotecnologia . São Paulo: Editora Livraria da Física. 2005. 3. TOMA H. E. O Mundo Nanométrico: A Dimensão do Novo Século. São Paulo: Oficina de Textos. 2004. 4. CNI/SENAI. Nanotecnologias. Série ocupações emergentes. nº 1. Brasília, 2004.
  • 18. Metodologia (2) – Compilação e Manipulação
  • 19. Metodologia (2) – Compilação e Manipulação
  • 20. Metodologia (2) – Compilação e Manipulação
  • 21.
  • 22.
  • 23.
  • 24. Anotação Estrutural A anotação estrutural compreende a marcação de dados externos e internos dos textos. Como dados externos entendemos a documentação do corpus (...) isto é, dados bibliográficos comuns, dados de catalogação como tamanho do arquivo, tipo da autoria, a tipologia textual e informação sobre a distribuição do corpus. Como dados internos temos a anotação de segmentação do texto cru, que envolve: a) marcação da estrutura geral – capítulos, parágrafos, títulos e subtítulos, notas de rodapé e elementos gráficos como tabelas e figuras, e b) marcação da estrutura de subparágrafos – elementos que são de interesse lingüístico, tais como sentenças, citações, palavras, abreviações, nomes, referências, datas e ênfases tipográficas do tipo negrito, itálico, sublinhado, etc. (Aluísio & Almeida, 2006)
  • 25. Metodologia (3) – Anotação e Nomeação Editor de Cabeçalhos Editor de Cabeçalhos do Projeto Lacio- Web adaptado por Luiz Carlos Genoves Jr. (NILC – USP)
  • 26. Anotação Estrutural Externa - Cabeçalho Metodologia (3) – Anotação e Nomeação
  • 27. Texto: Rumo a Nanotecnologia Global Nome do arquivo: IN-IF-AF-not-07nov06 Numero de Palavras: 206 Amostra: Íntegra Língua: Português do Brasil (PB) Fonte: Agência Fapesp Local de Publicação: São Paulo Data: 07 de novembro de 2006 Status: Original Comentários: Caderno “Notícias” Data de Acesso: 16 de novembro de 2006 Endereço Eletrônico: http://www.agencia.fapesp.br/boletim_dentro.php?id=6307 Tipo de Autoria: Individual Nome do Autor do Texto: Thiago Romero Sexo do autor: Masculino Gênero: Informativo Subgênero: Jornalístico Tipo Textual: Reportagem Domínio Geral: Generalidades Domínio Específico: Ciência & Tecnologia Definição: Anotador Distribuição: Internet (IN) Metodologia (3) – Anotação e Nomeação
  • 28. Anotação Estrutural Interna - Etiquetas Metodologia (3) – Anotação e Nomeação
  • 29. Metodologia (3) – Anotação e Nomeação
  • 30.
  • 31. Nomeação Exemplo: Para textos científicos de divulgação: IN-CD-INOVATEC-nanotec-05jul06 IN : Texto divulgado pela Internet CD : Gênero textual Científico de Divulgação INOVATEC : Sigla que representa a Fonte (Inovação Tecnológica) nanotec : Sigla que representa o caderno/seção em que o texto foi publicado na fonte (Seção Nanotecnologia) 05jul06 : Data de publicação (05 de julho de 2006) Metodologia (3) – Anotação e Nomeação
  • 32.
  • 33. Resultados Tamanho finito: 2.565.490 palavras
  • 34.
  • 35.
  • 36.
  • 37. Reuso do Corpus “ Estruturação do Conhecimento e Relações Semânticas: uma Ontologia para o Domínio de Nanociência e Nanotecnologia Deni Yuzo Kasama (Mestrado) “ Geração de Ontologias para Web Semântica a partir de Textos da Língua Portuguesa” Luiz Carlos Ribeiro Junior (Mestrado) “ Estruturação e Sistematização do Conhecimento em Ambientes Interativos de Aprendizagem” David Nadler Prata (Doutorado)
  • 38. Saiba mais www.joelsc.wordpress.com/publicacoes Coleti, J. S.; Mattos, D. F.; Genoves Jr., l c; CANDIDO JR., A.; Di Felippo, A; ALMEIDA, G. M. B.; ALUÍSIO, S. M.; Oliveira Jr., O. N. (2007) Compilação de Corpus em Língua Portuguesa na Área de Nanociência/ Nanotecnologia: Problemas e Soluções. Anais do VI Encontro de Lingüística de Corpus. São Paulo, São Paulo: USP, Brasil, 2007.