SlideShare une entreprise Scribd logo
1  sur  6
República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Superior

  Instituto Universitario Politécnico Santiago Mariño

                 Carrera 47 Nocturno

                  Materia: Electiva IV




                        PLN




                                                             Alumnos:

                                                           Luis Lamon

                                                        Jesus Castillo

                                               Bárbara Rodríguez

                                                Moisés Castellanos

                                                        Roberto García




                La Urbina, Junio 2011
Contenido

1 Introducción

2 Historia

3 Dificultades en el procesamiento de lenguajes naturales

        2.1 Ambigüedad

        2.2 Detección de separación entre las palabras

        2.3 Recepción imperfecta de datos

4 Componentes

5 Aplicaciones

        Síntesis del discurso

        Comprensión del lenguaje

        Generación de lenguajes naturales

        Traducción automática

        Respuesta a preguntas

        Recuperación de la información

        Extracción de la información
Procesamiento de lenguajes naturales

El Procesamiento de Lenguajes Naturales —abreviado PLN, o NLP del idioma inglés Natural
Language Processing— es una subdisciplina de la Inteligencia Artificial y la rama ingenieril de
la lingüística computacional. El PLN se ocupa de la formulación e investigación de
mecanismos eficaces computacionalmente para la comunicación entre personas o entre
personas y máquinas por medio de lenguajes naturales. El PLN no trata de la comunicación
por medio de lenguajes naturales de una forma abstracta, sino de diseñar mecanismos para
comunicarse que sean eficaces computacionalmente —que se puedan realizar por medio de
programas que ejecuten o simulen la comunicación—. Los modelos aplicados se enfocan no
sólo a la comprensión del lenguaje de por sí, sino a aspectos generales cognitivos humanos y
a la organización de la memoria. El lenguaje natural sirve sólo de medio para estudiar estos
fenómenos.

Historia

El Procesamiento del Lenguaje Natural (PLN) es una de las piedras angulares tempranas de la
inteligencia artificial (IA). La Traducción automática, por ejemplo, nació a finales de la
década de los cuarenta, antes de que se acuñara la propia expresión «Inteligencia Artificial».
No obstante, el PLN ha desempeñado múltiples papeles en el contexto de la IA, y su
importancia dentro de este campo ha crecido y decrecido a consecuencia de cambios
tecnológicos y científicos. Los primeros intentos de traducir textos por ordenador a finales
de los cuarenta y durante los cincuenta fracasaron debido a la escasa potencia de los
ordenadores y a la escasa sofistificación lingüística. Sin embargo, los esfuerzos realizados en
las décadas de los sesenta y los setenta para producir interfaces en lenguaje natural para
bases de datos y otras aplicaciones informáticas obtuvieron un cierto grado significativo de
éxito. La década de los ochenta y el principio de la de los noventa han visto resurgir la
investigación en el terreno de la Traducción Automática.

Dificultades en el procesamiento de lenguajes naturales

Ambigüedad El lenguaje natural es inherentemente ambiguo a diferentes niveles:

A nivel léxico, una misma palabra puede tener varios significados, y la selección del
apropiado se debe deducir a partir del contexto oracional o conocimiento básico. Muchas
investigaciones en el campo del procesamiento de lenguajes naturales han estudiado
métodos de resolver las ambigüedades léxicas mediante diccionarios, gramáticas, bases de
conocimiento y correlaciones estadísticas.

A nivel referencial, la resolución de anáforas y catáforas implica determinar la entidad
lingüística previa o posterior a que hacen referencia.

A nivel estructural, se requiere de la semántica para desambiguar la dependencia de los
sintagmas preposicionales que conducen a la construcción de distintos árboles sintácticos.
Por ejemplo, en la frase Rompió el dibujo de un ataque de nervios.

A nivel pragmático, una oración, a menudo, no significa lo que realmente se está diciendo.
Elementos tales como la ironía tienen un papel importante en la interpretación del mensaje.
Para resolver estos tipos de ambigüedades y otros, el problema central en el PLN es la
traducción de entradas en lenguaje natural a una representación interna sin ambigüedad,
como árboles de análisis.

Detección de separación entre las palabras

En la lengua hablada no se suelen hacer pausas entre palabra y palabra. El lugar en el que se
debe separar las palabras a menudo depende de cuál es la posibilidad que mantenga un
sentido lógico tanto gramatical como contextual. En la lengua escrita, idiomas como el chino
mandarín tampoco tienen separaciones entre las palabras.

Recepción imperfecta de datos

Acentos extranjeros, regionalismos o dificultades en la producción del habla, errores de
mecanografiado o expresiones no gramaticales, errores en la lectura de textos mediante
OCR

Componentes

Análisis morfológico. El análisis de las palabras para extraer raíces, rasgos flexivos, unidades
léxicas compuestas y otros fenómenos.

Análisis sintáctico. El análisis de la estructura sintáctica de la frase mediante una gramática
de la lengua en cuestión.

Análisis semántico. La extracción del significado de la frase, y la resolución de ambigüedades
léxicas y estructurales.

Análisis pragmático. El análisis del texto más allá de los límites de la frase, por ejemplo, para
determinar los antecedentes referenciales de los pronombres.

Planificación de la frase. Estructurar cada frase del texto con el fin de expresar el significado
adecuado.

Generación de la frase. La generación de la cadena lineal de palabras a partir de la estructura
general de la frase, con sus correspondientes flexiones, concordancias y restantes
fenómenos sintácticos y morfológicos.

Aplicaciones

Las principales tareas de trabajo en el PLN son:

Síntesis del discurso

La voz sintética es una voz artificial (no pregrabada), generada mediante un proceso de
sintetización del habla.

La síntesis de habla es la producción artificial de habla humana. Un sistema usado con este
propósito recibe el nombre de sintetizador de habla y puede llevarse a cabo en software o
en hardware. La síntesis de voz se llama a menudo en inglés text-to-speech (TTS), en
referencia a su capacidad de convertir texto en habla. Sin embargo, hay sistemas que en
lugar de producir voz a partir de texto lo hacen a partir de representación lingüística
simbólica en habla.

La calidad de una voz sintética vendrá dada por:

Su inteligibilidad: ¿con qué facilidad/dificultad es entendida?.

Su naturalidad: ¿en qué medida se asemeja a la voz real de un humano?

Comprensión del lenguaje

El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de Voz es una
parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada
entre seres humanos y computadoras electrónicas. El problema que se plantea en un
sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de
diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica
y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para
llegar a obtener una interpretación aceptable del mensaje acústico recibido.

Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar
la señal de voz emitida por el ser humano y reconocer la información contenida en ésta,
convirtiéndola en texto o emitiendo órdenes que actúan sobre un proceso. En su desarrollo
intervienen diversas disciplinas, tales como: la fisiología, la acústica, el procesamiento de
señales, la inteligencia artificial y la ciencia de la computación.

Generación de lenguajes naturales

La generación de lenguajes naturales (GLN) es el proceso de la construcción de un texto en
lenguaje natural para la comunicación con fines específicos. Texto se refiere aquí a un
término general y repetitivo aplicable a expresiones, o partes de ellas, de cualquier tamaño,
tanto habladas como escritas. En el ser humano, el que sea hablado o escrito tiene
consecuencias en el nivel deliberativo y de edición que ha tenido lugar; si el lenguaje es
hablado puede faltar revisión ya que la mayoría de los programas actuales pueden hablar, si
bien casi todos sólo presentan palabras en una pantalla. La decisión de revisar o usar la
palabra escrita o hablada no es una opción para la generación del programa en la actualidad;
pero se debe abordar el tema en el diseño de un programa en particular.

Traducción automática

La traducción automática (TA), también llamada MT (del inglés Machine Translation), es un
área de la lingüística computacional que investiga el uso de software para traducir texto o
habla de un lenguaje natural a otro. En un nivel básico, la traducción por computadora
realiza una sustitución simple de las palabras atómicas de un lenguaje natural por las de
otro. Por medio del uso de corpora lingüísticos se pueden intentar traducciones más
complejas, lo que permite un manejo más apropiado de las diferencias en la Tipología
lingüística, el reconocimiento de frases, la traducción de expresiones idiomáticas y el
aislamiento de anomalías.

Respuesta a preguntas
La búsqueda de respuestas, llamado en inglés Question Answering (QA) es un tipo de
recuperación de la información. Dada una cierta cantidad de documentos (tales como World
Wide Web), el sistema debería ser capaz de recuperar respuestas a preguntas planteadas en
lengua natural. QA es observado como un método que requiere una tecnología de
Procesamiento de lenguaje natural más compleja que otros tipos de sistemas para la
Recuperación de documentos, y, en algunos casos, se le observa como un paso por delante
de la tecnología del buscador.

Recuperación de la información

La Búsqueda y Recuperación de Información, llamada en inglés Information Search and
Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y
cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos
mismos, búsqueda de metadatos que describan documentos, o también la búsqueda en
bases de datos relacionales, ya sea a través de internet, intranet, y como objetivo realiza la
recuperación en textos, imágenes, sonido o datos de otras características, de manera
pertinente y relevante.

La recuperación de información es un estudio interdisciplinario. Cubre tantas disciplinas que
eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva.
Algunas de las disciplinas que se ocupan de estos estudios son la psicología cognitiva, la
arquitectura de la información, diseño de la información, inteligencia artificial, lingüística,
semiótica, informática, biblioteconomía, archivística y documentación.

Extracción de la información

La Extracción de la información (de sus siglas en inglés IE, Information Extraction) es un tipo
de recuperación de la información cuyo objetivo es extraer automáticamente información
estructurada o semiestructurada desde documentos legibles por una computadora.

Una aplicación típica de IE es el escaneado de una serie de documentos escritos en una
lengua natural y rellenar una base de datos con la información extraída. Las tendencias
actuales en relación con la IE utilizan técnicas de procesamiento de lenguaje natural que se
centran en áreas muy restringidas. Por ejemplo, la Message Understanding Conference
(MUC), o Conferencia para la Comprensión de Mensajes es una competición que se ha
centrado en los siguientes aspectos durante los últimos años:

Contenu connexe

Tendances

Proyecto Quebradona
Proyecto QuebradonaProyecto Quebradona
Proyecto Quebradonavilocardenas
 
Inteligencia linguistica
Inteligencia linguisticaInteligencia linguistica
Inteligencia linguisticaCristian Mori
 
Sampietro Clg10
Sampietro Clg10Sampietro Clg10
Sampietro Clg10agnese_sa
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
InteligencialinguisticaTABOADABRYAM
 
U1T1 - Presentación del curso de Metodología de la Programación IV
U1T1 - Presentación del curso de Metodología de la Programación IVU1T1 - Presentación del curso de Metodología de la Programación IV
U1T1 - Presentación del curso de Metodología de la Programación IVLuis Eduardo Pelaez Valencia
 
Traducción Jurídica vs. Científica (borrador)
Traducción Jurídica vs. Científica (borrador)Traducción Jurídica vs. Científica (borrador)
Traducción Jurídica vs. Científica (borrador)Patricia Oshiro
 
Propositos de la logica
Propositos de la logicaPropositos de la logica
Propositos de la logicaCiuad de Asis
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguisticaalejandra71091
 
Psicolinguistica introduccion xavier frias
Psicolinguistica introduccion xavier friasPsicolinguistica introduccion xavier frias
Psicolinguistica introduccion xavier friasdumatv
 
Inteligencia Linguística
Inteligencia LinguísticaInteligencia Linguística
Inteligencia Linguísticadocentecis
 
Inteligencialinguistica (1)
Inteligencialinguistica (1)Inteligencialinguistica (1)
Inteligencialinguistica (1)jorgemarinl
 

Tendances (19)

Proyecto Quebradona
Proyecto QuebradonaProyecto Quebradona
Proyecto Quebradona
 
Inteligencia linguistica
Inteligencia linguisticaInteligencia linguistica
Inteligencia linguistica
 
Sampietro Clg10
Sampietro Clg10Sampietro Clg10
Sampietro Clg10
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 
U1T1 - Presentación del curso de Metodología de la Programación IV
U1T1 - Presentación del curso de Metodología de la Programación IVU1T1 - Presentación del curso de Metodología de la Programación IV
U1T1 - Presentación del curso de Metodología de la Programación IV
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 
Traducción Jurídica vs. Científica (borrador)
Traducción Jurídica vs. Científica (borrador)Traducción Jurídica vs. Científica (borrador)
Traducción Jurídica vs. Científica (borrador)
 
Propositos de la logica
Propositos de la logicaPropositos de la logica
Propositos de la logica
 
Foneticaclase2
Foneticaclase2Foneticaclase2
Foneticaclase2
 
El lenguaje _escrito
El lenguaje _escritoEl lenguaje _escrito
El lenguaje _escrito
 
Exposición 3 tj.vs.ttc
Exposición 3 tj.vs.ttcExposición 3 tj.vs.ttc
Exposición 3 tj.vs.ttc
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 
Psicolinguistica introduccion xavier frias
Psicolinguistica introduccion xavier friasPsicolinguistica introduccion xavier frias
Psicolinguistica introduccion xavier frias
 
Inteligencia Linguística
Inteligencia LinguísticaInteligencia Linguística
Inteligencia Linguística
 
Inteligencialinguistica (1)
Inteligencialinguistica (1)Inteligencialinguistica (1)
Inteligencialinguistica (1)
 
Inteligencia linguistica
Inteligencia linguisticaInteligencia linguistica
Inteligencia linguistica
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 
Inteligencialinguistica
InteligencialinguisticaInteligencialinguistica
Inteligencialinguistica
 

En vedette

Ppt elementos estudio distancia medina gallo
Ppt elementos estudio distancia medina galloPpt elementos estudio distancia medina gallo
Ppt elementos estudio distancia medina galloedwinmedina200
 
Model Based Testing for Communications Industry - A Testing Experience Magazi...
Model Based Testing for Communications Industry - A Testing Experience Magazi...Model Based Testing for Communications Industry - A Testing Experience Magazi...
Model Based Testing for Communications Industry - A Testing Experience Magazi...Kalilur Rahman
 
que es power point
que es power pointque es power point
que es power pointalberts450
 
Copia de practica de word lorena
Copia de practica de word lorenaCopia de practica de word lorena
Copia de practica de word lorenamonicalorena1991
 
Manual terrômetro minipa mtr-1520 d
Manual   terrômetro minipa mtr-1520 dManual   terrômetro minipa mtr-1520 d
Manual terrômetro minipa mtr-1520 dRicardo Bussons
 
O poboamento humano. As cidades
O poboamento humano. As cidadesO poboamento humano. As cidades
O poboamento humano. As cidadesRosacidgalante
 
Dubai Retail Store Visit
Dubai Retail Store Visit Dubai Retail Store Visit
Dubai Retail Store Visit PESHWA ACHARYA
 
Mpp04 521-r1201 v
Mpp04 521-r1201 vMpp04 521-r1201 v
Mpp04 521-r1201 vTrí Công
 

En vedette (20)

Roberto Giraudo - Bari 13/09/2016
Roberto Giraudo  - Bari 13/09/2016Roberto Giraudo  - Bari 13/09/2016
Roberto Giraudo - Bari 13/09/2016
 
Ernesto Sábato
Ernesto SábatoErnesto Sábato
Ernesto Sábato
 
Ppt elementos estudio distancia medina gallo
Ppt elementos estudio distancia medina galloPpt elementos estudio distancia medina gallo
Ppt elementos estudio distancia medina gallo
 
Model Based Testing for Communications Industry - A Testing Experience Magazi...
Model Based Testing for Communications Industry - A Testing Experience Magazi...Model Based Testing for Communications Industry - A Testing Experience Magazi...
Model Based Testing for Communications Industry - A Testing Experience Magazi...
 
que es power point
que es power pointque es power point
que es power point
 
Saborin.[1]
Saborin.[1]Saborin.[1]
Saborin.[1]
 
color-combined
color-combinedcolor-combined
color-combined
 
Copia de practica de word lorena
Copia de practica de word lorenaCopia de practica de word lorena
Copia de practica de word lorena
 
Tecnologia MaríTima
Tecnologia MaríTimaTecnologia MaríTima
Tecnologia MaríTima
 
cv
cvcv
cv
 
Manual terrômetro minipa mtr-1520 d
Manual   terrômetro minipa mtr-1520 dManual   terrômetro minipa mtr-1520 d
Manual terrômetro minipa mtr-1520 d
 
News SSL 01 2017
News SSL 01 2017News SSL 01 2017
News SSL 01 2017
 
Fujama
FujamaFujama
Fujama
 
Amo você, pai!
Amo você, pai!Amo você, pai!
Amo você, pai!
 
Unidad educativa
Unidad educativaUnidad educativa
Unidad educativa
 
Metabolink Exprivia 14 settembre 2016
Metabolink Exprivia 14 settembre 2016Metabolink Exprivia 14 settembre 2016
Metabolink Exprivia 14 settembre 2016
 
Power point tic2
Power point tic2Power point tic2
Power point tic2
 
O poboamento humano. As cidades
O poboamento humano. As cidadesO poboamento humano. As cidades
O poboamento humano. As cidades
 
Dubai Retail Store Visit
Dubai Retail Store Visit Dubai Retail Store Visit
Dubai Retail Store Visit
 
Mpp04 521-r1201 v
Mpp04 521-r1201 vMpp04 521-r1201 v
Mpp04 521-r1201 v
 

Similaire à Exposicion

Ple y pnl trabajo final.
Ple y pnl trabajo final.Ple y pnl trabajo final.
Ple y pnl trabajo final.gam772010
 
Psicolinguistica computacional
Psicolinguistica computacionalPsicolinguistica computacional
Psicolinguistica computacionalCamila Marentes
 
Enfoque Comunicativo
Enfoque ComunicativoEnfoque Comunicativo
Enfoque ComunicativoJohan Fripp
 
Trabajo castellano
Trabajo castellanoTrabajo castellano
Trabajo castellanohaedco
 
Semestral final
Semestral finalSemestral final
Semestral finalRaul Perez
 
Escuela normal superior del distrito de barranquilla
Escuela normal superior del distrito de barranquillaEscuela normal superior del distrito de barranquilla
Escuela normal superior del distrito de barranquillakevingarcia18
 
LECTOESCRITURA Para niños infantes..pptx
LECTOESCRITURA Para niños infantes..pptxLECTOESCRITURA Para niños infantes..pptx
LECTOESCRITURA Para niños infantes..pptxMauricioAlejandroCai1
 
Procesamiento del Lenguaje Natural
Procesamiento del Lenguaje NaturalProcesamiento del Lenguaje Natural
Procesamiento del Lenguaje Naturalmenamigue
 
Inteligencia linguistica
Inteligencia linguisticaInteligencia linguistica
Inteligencia linguisticaronald1308
 
Complement del verb
Complement del verbComplement del verb
Complement del verbguest9f5196
 
Trabajo No 2 artículo individual ABP 4 x 4
Trabajo No 2 artículo individual ABP 4 x 4Trabajo No 2 artículo individual ABP 4 x 4
Trabajo No 2 artículo individual ABP 4 x 4Carlos Yepes
 
CARACTERISTICAS
CARACTERISTICASCARACTERISTICAS
CARACTERISTICASWil Mer
 
Problemas lectoescritura
Problemas lectoescrituraProblemas lectoescritura
Problemas lectoescrituraneiva sandra
 

Similaire à Exposicion (20)

La I. A. y el procesamiento del lenguaje natural
La I. A. y el procesamiento del lenguaje naturalLa I. A. y el procesamiento del lenguaje natural
La I. A. y el procesamiento del lenguaje natural
 
Ple y pnl trabajo final.
Ple y pnl trabajo final.Ple y pnl trabajo final.
Ple y pnl trabajo final.
 
Psicolinguistica computacional
Psicolinguistica computacionalPsicolinguistica computacional
Psicolinguistica computacional
 
LENGUAJE ARTIFICAL Y NATURAL
LENGUAJE ARTIFICAL Y NATURALLENGUAJE ARTIFICAL Y NATURAL
LENGUAJE ARTIFICAL Y NATURAL
 
Clase 2
Clase 2Clase 2
Clase 2
 
Enfoque Comunicativo
Enfoque ComunicativoEnfoque Comunicativo
Enfoque Comunicativo
 
Trabajo castellano
Trabajo castellanoTrabajo castellano
Trabajo castellano
 
Semestral final
Semestral finalSemestral final
Semestral final
 
Escuela normal superior del distrito de barranquilla
Escuela normal superior del distrito de barranquillaEscuela normal superior del distrito de barranquilla
Escuela normal superior del distrito de barranquilla
 
LECTOESCRITURA Para niños infantes..pptx
LECTOESCRITURA Para niños infantes..pptxLECTOESCRITURA Para niños infantes..pptx
LECTOESCRITURA Para niños infantes..pptx
 
LA LECTOESCRITURA Y EL PROCESO LECTOR
LA LECTOESCRITURA Y EL PROCESO LECTORLA LECTOESCRITURA Y EL PROCESO LECTOR
LA LECTOESCRITURA Y EL PROCESO LECTOR
 
Procesamiento del Lenguaje Natural
Procesamiento del Lenguaje NaturalProcesamiento del Lenguaje Natural
Procesamiento del Lenguaje Natural
 
Inteligencia linguistica
Inteligencia linguisticaInteligencia linguistica
Inteligencia linguistica
 
El lenguaje
El lenguaje   El lenguaje
El lenguaje
 
Complement del verb
Complement del verbComplement del verb
Complement del verb
 
Unidad 2 evid presentacion Códigos naturales y artificiales
Unidad 2 evid presentacion Códigos naturales y artificialesUnidad 2 evid presentacion Códigos naturales y artificiales
Unidad 2 evid presentacion Códigos naturales y artificiales
 
Unidad 2 evid presentacion Códigos naturales y artificiales
Unidad 2 evid presentacion Códigos naturales y artificialesUnidad 2 evid presentacion Códigos naturales y artificiales
Unidad 2 evid presentacion Códigos naturales y artificiales
 
Trabajo No 2 artículo individual ABP 4 x 4
Trabajo No 2 artículo individual ABP 4 x 4Trabajo No 2 artículo individual ABP 4 x 4
Trabajo No 2 artículo individual ABP 4 x 4
 
CARACTERISTICAS
CARACTERISTICASCARACTERISTICAS
CARACTERISTICAS
 
Problemas lectoescritura
Problemas lectoescrituraProblemas lectoescritura
Problemas lectoescritura
 

Dernier

Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxRAMON EUSTAQUIO CARO BAYONA
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfssuser50d1252
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicialLorenaSanchez350426
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfssuser50d1252
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfssuser50d1252
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORGonella
 
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADO
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADOCUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADO
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADOEveliaHernandez8
 
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsxJuanpm27
 
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docx
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docxIII SEGUNDO CICLO PLAN DE TUTORÍA 2024.docx
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docxMaritza438836
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxMartín Ramírez
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTESaraNolasco4
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 

Dernier (20)

Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicial
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
recursos naturales america cuarto basico
recursos naturales america cuarto basicorecursos naturales america cuarto basico
recursos naturales america cuarto basico
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIOR
 
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADO
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADOCUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADO
CUADERNILLO DE EJERCICIOS PARA EL TERCER TRIMESTRE, SEXTO GRADO
 
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
 
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docx
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docxIII SEGUNDO CICLO PLAN DE TUTORÍA 2024.docx
III SEGUNDO CICLO PLAN DE TUTORÍA 2024.docx
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 

Exposicion

  • 1. República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Superior Instituto Universitario Politécnico Santiago Mariño Carrera 47 Nocturno Materia: Electiva IV PLN Alumnos: Luis Lamon Jesus Castillo Bárbara Rodríguez Moisés Castellanos Roberto García La Urbina, Junio 2011
  • 2. Contenido 1 Introducción 2 Historia 3 Dificultades en el procesamiento de lenguajes naturales 2.1 Ambigüedad 2.2 Detección de separación entre las palabras 2.3 Recepción imperfecta de datos 4 Componentes 5 Aplicaciones Síntesis del discurso Comprensión del lenguaje Generación de lenguajes naturales Traducción automática Respuesta a preguntas Recuperación de la información Extracción de la información
  • 3. Procesamiento de lenguajes naturales El Procesamiento de Lenguajes Naturales —abreviado PLN, o NLP del idioma inglés Natural Language Processing— es una subdisciplina de la Inteligencia Artificial y la rama ingenieril de la lingüística computacional. El PLN se ocupa de la formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre personas o entre personas y máquinas por medio de lenguajes naturales. El PLN no trata de la comunicación por medio de lenguajes naturales de una forma abstracta, sino de diseñar mecanismos para comunicarse que sean eficaces computacionalmente —que se puedan realizar por medio de programas que ejecuten o simulen la comunicación—. Los modelos aplicados se enfocan no sólo a la comprensión del lenguaje de por sí, sino a aspectos generales cognitivos humanos y a la organización de la memoria. El lenguaje natural sirve sólo de medio para estudiar estos fenómenos. Historia El Procesamiento del Lenguaje Natural (PLN) es una de las piedras angulares tempranas de la inteligencia artificial (IA). La Traducción automática, por ejemplo, nació a finales de la década de los cuarenta, antes de que se acuñara la propia expresión «Inteligencia Artificial». No obstante, el PLN ha desempeñado múltiples papeles en el contexto de la IA, y su importancia dentro de este campo ha crecido y decrecido a consecuencia de cambios tecnológicos y científicos. Los primeros intentos de traducir textos por ordenador a finales de los cuarenta y durante los cincuenta fracasaron debido a la escasa potencia de los ordenadores y a la escasa sofistificación lingüística. Sin embargo, los esfuerzos realizados en las décadas de los sesenta y los setenta para producir interfaces en lenguaje natural para bases de datos y otras aplicaciones informáticas obtuvieron un cierto grado significativo de éxito. La década de los ochenta y el principio de la de los noventa han visto resurgir la investigación en el terreno de la Traducción Automática. Dificultades en el procesamiento de lenguajes naturales Ambigüedad El lenguaje natural es inherentemente ambiguo a diferentes niveles: A nivel léxico, una misma palabra puede tener varios significados, y la selección del apropiado se debe deducir a partir del contexto oracional o conocimiento básico. Muchas investigaciones en el campo del procesamiento de lenguajes naturales han estudiado métodos de resolver las ambigüedades léxicas mediante diccionarios, gramáticas, bases de conocimiento y correlaciones estadísticas. A nivel referencial, la resolución de anáforas y catáforas implica determinar la entidad lingüística previa o posterior a que hacen referencia. A nivel estructural, se requiere de la semántica para desambiguar la dependencia de los sintagmas preposicionales que conducen a la construcción de distintos árboles sintácticos. Por ejemplo, en la frase Rompió el dibujo de un ataque de nervios. A nivel pragmático, una oración, a menudo, no significa lo que realmente se está diciendo. Elementos tales como la ironía tienen un papel importante en la interpretación del mensaje.
  • 4. Para resolver estos tipos de ambigüedades y otros, el problema central en el PLN es la traducción de entradas en lenguaje natural a una representación interna sin ambigüedad, como árboles de análisis. Detección de separación entre las palabras En la lengua hablada no se suelen hacer pausas entre palabra y palabra. El lugar en el que se debe separar las palabras a menudo depende de cuál es la posibilidad que mantenga un sentido lógico tanto gramatical como contextual. En la lengua escrita, idiomas como el chino mandarín tampoco tienen separaciones entre las palabras. Recepción imperfecta de datos Acentos extranjeros, regionalismos o dificultades en la producción del habla, errores de mecanografiado o expresiones no gramaticales, errores en la lectura de textos mediante OCR Componentes Análisis morfológico. El análisis de las palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestas y otros fenómenos. Análisis sintáctico. El análisis de la estructura sintáctica de la frase mediante una gramática de la lengua en cuestión. Análisis semántico. La extracción del significado de la frase, y la resolución de ambigüedades léxicas y estructurales. Análisis pragmático. El análisis del texto más allá de los límites de la frase, por ejemplo, para determinar los antecedentes referenciales de los pronombres. Planificación de la frase. Estructurar cada frase del texto con el fin de expresar el significado adecuado. Generación de la frase. La generación de la cadena lineal de palabras a partir de la estructura general de la frase, con sus correspondientes flexiones, concordancias y restantes fenómenos sintácticos y morfológicos. Aplicaciones Las principales tareas de trabajo en el PLN son: Síntesis del discurso La voz sintética es una voz artificial (no pregrabada), generada mediante un proceso de sintetización del habla. La síntesis de habla es la producción artificial de habla humana. Un sistema usado con este propósito recibe el nombre de sintetizador de habla y puede llevarse a cabo en software o en hardware. La síntesis de voz se llama a menudo en inglés text-to-speech (TTS), en referencia a su capacidad de convertir texto en habla. Sin embargo, hay sistemas que en
  • 5. lugar de producir voz a partir de texto lo hacen a partir de representación lingüística simbólica en habla. La calidad de una voz sintética vendrá dada por: Su inteligibilidad: ¿con qué facilidad/dificultad es entendida?. Su naturalidad: ¿en qué medida se asemeja a la voz real de un humano? Comprensión del lenguaje El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de Voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido. Un sistema de reconocimiento de voz es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en ésta, convirtiéndola en texto o emitiendo órdenes que actúan sobre un proceso. En su desarrollo intervienen diversas disciplinas, tales como: la fisiología, la acústica, el procesamiento de señales, la inteligencia artificial y la ciencia de la computación. Generación de lenguajes naturales La generación de lenguajes naturales (GLN) es el proceso de la construcción de un texto en lenguaje natural para la comunicación con fines específicos. Texto se refiere aquí a un término general y repetitivo aplicable a expresiones, o partes de ellas, de cualquier tamaño, tanto habladas como escritas. En el ser humano, el que sea hablado o escrito tiene consecuencias en el nivel deliberativo y de edición que ha tenido lugar; si el lenguaje es hablado puede faltar revisión ya que la mayoría de los programas actuales pueden hablar, si bien casi todos sólo presentan palabras en una pantalla. La decisión de revisar o usar la palabra escrita o hablada no es una opción para la generación del programa en la actualidad; pero se debe abordar el tema en el diseño de un programa en particular. Traducción automática La traducción automática (TA), también llamada MT (del inglés Machine Translation), es un área de la lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. En un nivel básico, la traducción por computadora realiza una sustitución simple de las palabras atómicas de un lenguaje natural por las de otro. Por medio del uso de corpora lingüísticos se pueden intentar traducciones más complejas, lo que permite un manejo más apropiado de las diferencias en la Tipología lingüística, el reconocimiento de frases, la traducción de expresiones idiomáticas y el aislamiento de anomalías. Respuesta a preguntas
  • 6. La búsqueda de respuestas, llamado en inglés Question Answering (QA) es un tipo de recuperación de la información. Dada una cierta cantidad de documentos (tales como World Wide Web), el sistema debería ser capaz de recuperar respuestas a preguntas planteadas en lengua natural. QA es observado como un método que requiere una tecnología de Procesamiento de lenguaje natural más compleja que otros tipos de sistemas para la Recuperación de documentos, y, en algunos casos, se le observa como un paso por delante de la tecnología del buscador. Recuperación de la información La Búsqueda y Recuperación de Información, llamada en inglés Information Search and Retrieval (ISR), es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de éstos mismos, búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos relacionales, ya sea a través de internet, intranet, y como objetivo realiza la recuperación en textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante. La recuperación de información es un estudio interdisciplinario. Cubre tantas disciplinas que eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la psicología cognitiva, la arquitectura de la información, diseño de la información, inteligencia artificial, lingüística, semiótica, informática, biblioteconomía, archivística y documentación. Extracción de la información La Extracción de la información (de sus siglas en inglés IE, Information Extraction) es un tipo de recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por una computadora. Una aplicación típica de IE es el escaneado de una serie de documentos escritos en una lengua natural y rellenar una base de datos con la información extraída. Las tendencias actuales en relación con la IE utilizan técnicas de procesamiento de lenguaje natural que se centran en áreas muy restringidas. Por ejemplo, la Message Understanding Conference (MUC), o Conferencia para la Comprensión de Mensajes es una competición que se ha centrado en los siguientes aspectos durante los últimos años: