SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
#GlobalAzure
IA enriquecida con Azure
Cognitive Search
Luis Beltrán
#GlobalAzure
Luis Beltrán
• Investigador en Tomas Bata University en Zlín, República
Checa.
• Docente en Tecnológico Nacional de México en Celaya,
Mexico.
• Alto interés en Xamarin, Azure e Inteligencia Artificial
@darkicebeam
luis@luisbeltran.mx
#GlobalAzure
Agenda
• ¿Qué es Azure Search?
• Enriquecimiento de IA
• Descripción
• Pasos
• Demo
Descarga la presentación: https://bit.ly/LuisGlobalAzure04
#GlobalAzure
HTML
PNG
#GlobalAzure
Azure Cognitive Search
Search-as-a-Service
Gestión sencilla
Búsquedas por keywords
Analizadores de lenguaje
Soporte a requerimientos geoespaciales
Sugerencias / Autocompletado
Scoring personalizado
Búsqueda de proximidad
Sinónimos,
etc.
#GlobalAzure
Capacidades de los Cognitive Services
Integra la Inteligencia Artificial en tus aplicaciones, sitios web y bots
Detección de objetos, escenas
y actividades.
Reconocimiento e
identificación facial
Reconocimiento de
celebridades y lugares
emblemáticos
Reconocimiento de la emoción
Reconocimiento de texto y
escritura a mano (OCR)
Extracción y análisis de
metadatos de video, audio y
fotogramas clave
Moderación de contenido
explícito u ofensivo
Reconocimiento de imagen
personalizado
Visión
Detección de idioma
Análisis de sentimiento de
texto
Extracción de frases clave
Reconocimiento de la entidad
Corrección ortográfica
Moderación de contenido de
texto explícito u ofensivo,
detección de PII (Personally
Identifiable Information)
Traducción de textos
Traducción de texto
personalizable
Comprensión del lenguaje
contextual
Lenguaje
Resultados de búsqueda web,
noticias, imágenes y videos sin
publicidad
Tendencias para video, noticias
Identificación de imágenes,
clasificación y extracción de
conocimiento.
Identificación de imágenes y
productos similares.
Reconocimiento y clasificación
de entidades nombradas
Adquisición de conocimiento
para entidades nombradas
Creación de motores de
búsqueda personalizados sin
publicidad
Sugerencias automáticas
Conocimiento
Transcripción de voz (voz a
texto)
Síntesis de voz (texto a voz)
Traducción de voz en tiempo
real
Identificación y verificación del
orador
Modelos de voz
personalizados para
transcripción y traducción
Voz personalizada
Voz
Extracción de Q&A a partir de
texto no estructurado
Creación de base de
conocimiento (KB) a partir de
colecciones de preguntas y
respuestas
Emparejamiento semántico
para bases de conocimiento
Aprendizaje de
personalización de contenido
personalizable
Búsqueda
#GlobalAzure
Enriquecimiento de IA
El enriquecimiento de AI es una capacidad de indexación de Azure
Cognitive Search utilizada para extraer texto de imágenes, blobs y otras
fuentes de datos no estructurados.
El enriquecimiento y la extracción hacen que el contenido sea más
“buscable” mediante un índice o tienda de conocimiento.
La extracción y el enriquecimiento se implementan por medio de
habilidades cognitivas asociadas a un pipeline de indexación.
#GlobalAzure
Desde un punto de vista general…
INGIERE
Datos en cualquier
formato y cualquier
almacenamiento de
Azure
ENRIQUECE EXPLORA
Anotaciones
Habilidades cognitivas
Búsqueda
#GlobalAzure
Las habilidades cognitivas integradas en Serch se dividen en dos categorías:
• Las habilidades de procesamiento del lenguaje natural incluyen detección
de lenguaje, extracción de frases clave, manipulación de texto, detección
de sentimientos, reconocimiento de entidades. El texto no estructurado es
mapeado a campos filtrables y de búsqueda en un índice.
• Las habilidades de procesamiento de imágenes incluyen OCR e
identificación de características visuales: detección facial, interpretación de
imágenes, reconocimiento de imágenes (personas famosas y puntos de
referencia) o atributos como la orientación de la imagen. Estas habilidades
crean representaciones de texto del contenido de la imagen, lo que
permite realizar búsquedas con las capacidades de consulta de Azure
Cognitive Search.
#GlobalAzure
Arquitectura de Cognitive Search
Skillset:
Un pipeline extensible
de enriquecimiento
Indexación
para
búsqueda
Document
Cracking
Documentos
Anotados
Datos del
Cliente
IEnricherIEnricherHabilidad
Cognitiva
Índice de
Búsqueda
INGIERE ENRIQUECE EXPLORA
#GlobalAzure
• Las habilidades cognitivas en Azure Cognitive Search se basan en
modelos de aprendizaje automático previamente capacitados en API
de servicios cognitivos: Computer Vision y Text Analytics.
• El procesamiento de imágenes y lenguaje natural se aplica durante la
fase de ingestión de datos, y los resultados se convierten en parte de
la composición de un documento en un índice de búsqueda en Azure
Cognitive Search.
#GlobalAzure
• Los datos se obtienen como un Azure dataset y luego se envían a
través de una canalización de indexación utilizando las habilidades
integradas que necesite.
• La arquitectura es extensible, por lo que si las habilidades integradas
no son suficientes, puede crear y adjuntar habilidades personalizadas
para integrar el procesamiento personalizado. Por ejemplo, un
módulo de entidad personalizado o un clasificador de documentos
dirigido a dominios específicos, tales como publicaciones científicas,
finanzas o medicina.
#GlobalAzure
¿Cuándo utilizar el enriquecimiento de IA?
Deberías considerar el uso de habilidades cognitivas integradas…
• si tu contenido sin procesar es texto no estructurado, viene incluido
en imágenes o es un contenido que necesita detección y traducción
de idioma. La aplicación de IA a través de las habilidades cognitivas
incorporadas puede desbloquear este contenido, aumentando su
valor y utilidad en sus aplicaciones de búsqueda y ciencia de datos.
• si tienes código open-source o de terceros que quisieras integrar en
el pipeline. Modelos de clasificación que identifican características
sobresalientes de varios tipos de documentos se incluyen en esta
categoría, pero se podría usar cualquier paquete que agregue valor
a tu contenido.
#GlobalAzure
Requerimientos de las habilidades
personalizadas
https
Habilidad de
traducción
personalizada
{
"values": [
{
"recordId": "7cad2",
"data":
{
"value1":
"I owe you 5 grand"
}
},
{
"recordId": "7cad3",
"data":
{
"value1":
"Just my 2 cents",
}
},
…
]
}
{
"values": [
{
"recordId": "7cad2",
"data":
{
"myOuput1":
"Te debo cinco mil"
}
},
{
"recordId": "7cad3",
"data":
{
"myOutput1":
"Solo mis 2 centavos"
}
},
…
]
}
#GlobalAzure
Pasos a seguir para construir un pipeline de
enriquecimiento
Un pipeline de enriquecimiento está basado en indexadores.
Los indexadores cargan un índice basado en asignaciones campo-a-campo
entre el índice y su fuente de datos para descifrar documentos (document
cracking).
Las habilidades, ahora adjuntadas a los indexadores, interceptan y
enriquecen los documentos de acuerdo con los conjuntos de habilidades
(skillsets) definidos.
Una vez indexado, puedes acceder al contenido a través de solicitudes de
búsqueda usando cualquier tipo de consultas admitido por Azure Cognitive
Search.
#GlobalAzure
Paso 1: Fase de conexión y “document cracking”
Al comienzo del pipeline, tienes contenido no estructurado de texto o sin texto
(imágenes, documentos escaneados…). Los datos deben existir en un servicio
de almacenamiento de datos de Azure al que pueda acceder el indexador. Los
indexadores pueden "descifrar" los documentos fuente para extraer su texto o
crear contenido de texto de fuentes que no son de texto durante la indexación.
La indexación toma tiempo, así que comienza con un conjunto de datos
pequeño y representativo. Luego puedes aumentar gradualmente conforme la
la solución madura.
#GlobalAzure
Document cracking (descifrar documentos)
• Diferentes tipos de data sources
• Blob Storage
• Azure SQL
• Cosmos DB
• Azure Tables
• MySQL
• Azure Files (preview privado)
• Formatos de archivo
soportados en blob storage:
 rtf
 json
 html
 doc
 ppt
 xls
 pdf
 xml
 png
#GlobalAzure
Paso 2: Fase de cognitive skills y enriquecimiento
El enriquecimiento comienza con las habilidades cognitivas realizando
operaciones atómicas. Por ejemplo, una vez descifrado un PDF, puedes
aplicar reconocimiento de entidad, detección de idioma o extracción de
frases clave para producir nuevos campos en su índice que no están
disponibles de forma nativa en la fuente.
En conjunto, la colección de habilidades utilizadas en el pipeline se
denomina conjunto de habilidades (skillset).
#GlobalAzure
#GlobalAzure
Un skillset se basa en habilidades cognitivas integradas, o habilidades
personalizadas que se conectan al skillset.
Un skillset puede ser tan sencillo o complejo como se desee, y determina no
solo el tipo de procesamiento, sino también el orden de las operaciones. Un
skillset más las asignaciones de campo definidas como parte de un indexador
especifican por completo el pipeline de enriquecimiento.
Internamente, el pipeline genera una colección de documentos
enriquecidos. Puedes decidir qué partes de los documentos enriquecidos
deben asignarse a campos indexables en el índice de búsqueda. Por ejemplo,
si se aplicaron las habilidades de extracción de frases clave y reconocimiento
de entidades, esos nuevos campos se convertirían en parte del documento
enriquecido y se pueden asignar a campos en su índice.
#GlobalAzure
Habilidades Cognitivas
Habilidades integradas
Extracción de entidad
de ubicación
Extracción de
entidad de personas
Reconocimiento
de celebridades
Detección de
propiedades
Análisis de
sentimientos
Detección de
idioma
Extracción de
etiquetas de imagen
Reconocimiento de
texto impreso
Extracción de
palabras clave
Extracción de
entidad de organización
Detección de
rostros
Utilidades de
texto
Azure
Databricks
Machine Learning
VMs
Azure Machine
Learning
Habilidades
personalizadas
Tu habilidad
personalizada
va aquí
#GlobalAzure
Ejemplo de un skillset
texto
imágenes OCR
(reconocimiento
de texto)
reconocimiento
de entidades
de organización
fusionar texto
reconocimiento
de entidades
de localización
#GlobalAzure
Añade un elemento knowledgeStore para guardar los pipelines
La api-version=2019-05-06-Preview del servicio REST de Search extiende las
habilidades con una definición de KnowledgeStore que proporciona una
conexión de almacenamiento de Azure y proyecciones que describen cómo
se almacenan los enriquecimientos.
Esto es complementario al índice.
En un pipeline estándar de IA, los documentos enriquecidos son transitorios,
se usan solo durante la indexación y luego se descartan.
Con el knowledge store, se conservan los documentos enriquecidos.
#GlobalAzure
Paso 3: Índice de búsqueda y acceso basado en consultas
Cuando finaliza el procesamiento, se genera un índice de búsqueda que
consta de documentos enriquecidos que soportan búsquedas full-text en
Azure Cognitive Search.
Al consultar el índice, los desarrolladores y los usuarios acceden al contenido
enriquecido generado por el pipeline.
El índice es como cualquier otro que pueda crear para Azure Cognitive Search:
puede ser complementado con analizadores personalizados, invocar
consultas de búsqueda difusas, agregar búsqueda filtrada o experimentar con
perfiles de puntuación para remodelar los resultados de búsqueda.
#GlobalAzure
Los índices se generan a partir de un esquema de índice que define los
campos, atributos y otras construcciones adjuntas a un índice
específico, tales como perfiles de puntuación y mapas de sinónimos.
Una vez que se define y llena un índice, puedes indexar de forma
incremental para recoger nuevos documentos y actualizaciones de los
originales.
Ciertas modificaciones requieren una reconstrucción completa. Se
sugiere usar un pequeño conjunto de datos hasta que el diseño del
esquema sea estable.
#GlobalAzure
Checklist: Un flujo de trabajo típico
1. Obtén una muestra representativa de tus datos almacenados en Azure. La indexación
toma tiempo, así que comienza con un conjunto de datos pequeño y representativo, y
luego aumenta gradualmente a medida que la solución madura.
2. Crea un data source object en Azure Cognitive Search para proporcionar una cadena de
conexión y así obtener los datos.
3. Crea un skillset con los pasos de enriquecimiento descritos.
4. Define el esquema del índice. La colección Fields incluye campos de los datos de origen.
También deberías eliminar campos adicionales para contener los valores generados para el
contenido creado durante el enriquecimiento.
5. Define el indexador que hace referencia a la fuente de datos, el skillset y el índice.
6. Dentro del indexador, agrega outputFieldMappings. Esta sección asigna la salida del
skillset (en el paso 3) a los campos de entrada en el esquema de índice (en el paso 4).
7. Envía la solicitud Create Indexer que acabas de crear (una petición POST con una
definición de indexador en el cuerpo de la solicitud) para expresar el indexador en Azure
Cognitive Search. Este paso es la ejecución del indexador, invocando el pipeline.
8. Realiza consultas para evaluar los resultados y modifica el código para actualizar los
skillsets, el esquema o la configuración del indexador.
9. Restablece el indexador antes de reconstruir el pipeline.
#GlobalAzure
Demo
• En esta demostración, combinarás servicios y datos en la nube de
Azure para crear un skillset.
• Una vez que todo esté en su lugar, ejecutarás el asistente de
importación de datos en el portal para unirlo todo.
• El resultado final es un índice de búsqueda poblado con datos
creados por el procesamiento de IA que puede consultar en el portal
mediante el Search Explorer.
• Esta demostración usa Azure Cognitive Search, Azure Blob Storage
y Azure Cognitive Services para la IA.
#GlobalAzure
#GlobalAzure
#GlobalAzure
Proyecto open-source disponible en GitHub:
https://github.com/icebeam7/AIEnrichmentDemo
#GlobalAzure
Call to Action
Introducción al enriquecimiento con IA
https://docs.microsoft.com/es-mx/azure/search/cognitive-search-
concept-intro
Quickstart: Creación de un conjunto de aptitudes cognitivas
de Azure Cognitive Search en Azure Portal
https://docs.microsoft.com/es-mx/azure/search/cognitive-search-
quickstart-blob
#GlobalAzure
Call to Action
Tutorial: Uso de REST y AI para generar contenido en el que
se pueden realizar búsquedas desde blobs de Azure
https://docs.microsoft.com/es-mx/azure/search/cognitive-search-
tutorial-blob
Tutorial: Uso de C# y AI para generar contenido que permite
búsquedas desde blobs de Azure
https://docs.microsoft.com/es-mx/azure/search/cognitive-search-
tutorial-blob-dotnet
#GlobalAzure
#GlobalAzure
¡Gracias por tu
atención!
Luis Beltrán
Tomás Bata University in Zlín
Tecnológico Nacional de México en Celaya
luis@luisbeltran.mx luisbeltran.mx @darkicebeam
GitHub:
https://github.com/icebeam7
LinkedIn:
https://linkedin.com/in/luisantoniobeltran
SlideShare:
https://slideshare.net/icebeam
YouTube:
https://youtube.com/user/darkicebeam
About Me:
https://about.me/luis-beltran

Contenu connexe

Similaire à IA en Azure Cognitive Search

SOFTWARE, ANÁLISIS CUALITATIVO
SOFTWARE, ANÁLISIS CUALITATIVOSOFTWARE, ANÁLISIS CUALITATIVO
SOFTWARE, ANÁLISIS CUALITATIVOnallely murillo
 
Unidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptxUnidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptxfernandalemus15
 
Mejorando la búsqueda Web con Apache Solr
Mejorando la búsqueda Web con Apache SolrMejorando la búsqueda Web con Apache Solr
Mejorando la búsqueda Web con Apache SolrIván Campaña Naranjo
 
Arquitectura de Información (entregables)
Arquitectura de Información (entregables)Arquitectura de Información (entregables)
Arquitectura de Información (entregables)Mario Carvajal
 
kbee.docs CESSI - Caso De Estudio
kbee.docs CESSI - Caso De Estudiokbee.docs CESSI - Caso De Estudio
kbee.docs CESSI - Caso De Estudioatolomei
 
kbee.spaces
kbee.spaceskbee.spaces
kbee.spacesatolomei
 
Azure AI South Azure Cognitive Services en contenedores Docker.pptx
Azure AI South Azure Cognitive Services en contenedores Docker.pptxAzure AI South Azure Cognitive Services en contenedores Docker.pptx
Azure AI South Azure Cognitive Services en contenedores Docker.pptxLuis Beltran
 
Project Cortex (Ignite 2019 announcements)
Project Cortex (Ignite 2019 announcements)Project Cortex (Ignite 2019 announcements)
Project Cortex (Ignite 2019 announcements)Miguel Tabera
 
Herramientas de busqueda
Herramientas de busquedaHerramientas de busqueda
Herramientas de busquedaavelizapa
 
GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI Informática
 
Azure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxAzure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxLuis Beltran
 
Inteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxInteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxLuis Beltran
 
Programa tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxPrograma tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxicebeam7
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016jorge Muchaypiña
 
Gobernanza de datos - Azure Purview
Gobernanza de datos - Azure PurviewGobernanza de datos - Azure Purview
Gobernanza de datos - Azure PurviewdbLearner
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxLambofgod1993
 

Similaire à IA en Azure Cognitive Search (20)

Gestion del conocimiento
Gestion del conocimientoGestion del conocimiento
Gestion del conocimiento
 
SOFTWARE, ANÁLISIS CUALITATIVO
SOFTWARE, ANÁLISIS CUALITATIVOSOFTWARE, ANÁLISIS CUALITATIVO
SOFTWARE, ANÁLISIS CUALITATIVO
 
La nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivosLa nueva era de la inteligencia artificial: azure y servicios cognitivos
La nueva era de la inteligencia artificial: azure y servicios cognitivos
 
Unidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptxUnidad 4 clas int datos.pptx
Unidad 4 clas int datos.pptx
 
Mejorando la búsqueda Web con Apache Solr
Mejorando la búsqueda Web con Apache SolrMejorando la búsqueda Web con Apache Solr
Mejorando la búsqueda Web con Apache Solr
 
Arquitectura de Información (entregables)
Arquitectura de Información (entregables)Arquitectura de Información (entregables)
Arquitectura de Información (entregables)
 
kbee.docs CESSI - Caso De Estudio
kbee.docs CESSI - Caso De Estudiokbee.docs CESSI - Caso De Estudio
kbee.docs CESSI - Caso De Estudio
 
kbee.spaces
kbee.spaceskbee.spaces
kbee.spaces
 
Azure AI South Azure Cognitive Services en contenedores Docker.pptx
Azure AI South Azure Cognitive Services en contenedores Docker.pptxAzure AI South Azure Cognitive Services en contenedores Docker.pptx
Azure AI South Azure Cognitive Services en contenedores Docker.pptx
 
Project Cortex (Ignite 2019 announcements)
Project Cortex (Ignite 2019 announcements)Project Cortex (Ignite 2019 announcements)
Project Cortex (Ignite 2019 announcements)
 
Herramientas de busqueda
Herramientas de busquedaHerramientas de busqueda
Herramientas de busqueda
 
GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)GFI - APS BI Solucion Endeca (2013)
GFI - APS BI Solucion Endeca (2013)
 
Azure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptxAzure Video Analyzer - Guadalajara Connect.pptx
Azure Video Analyzer - Guadalajara Connect.pptx
 
Dhtic
DhticDhtic
Dhtic
 
Inteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptxInteligencia Artificial con Azure.pptx
Inteligencia Artificial con Azure.pptx
 
Programa tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptxPrograma tu Pandemia 2 Azure Video Indexer.pptx
Programa tu Pandemia 2 Azure Video Indexer.pptx
 
Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016Text Mining con R en SQL Server 2016
Text Mining con R en SQL Server 2016
 
Scraping o cómo escarbar datos
Scraping o cómo escarbar datosScraping o cómo escarbar datos
Scraping o cómo escarbar datos
 
Gobernanza de datos - Azure Purview
Gobernanza de datos - Azure PurviewGobernanza de datos - Azure Purview
Gobernanza de datos - Azure Purview
 
Aplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docxAplicando la Ciencia de Datos en una organización.docx
Aplicando la Ciencia de Datos en una organización.docx
 

Plus de Luis Beltran

AI for Accessibility.pptx
AI for Accessibility.pptxAI for Accessibility.pptx
AI for Accessibility.pptxLuis Beltran
 
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxNET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxLuis Beltran
 
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptxLuis Beltran
 
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...Luis Beltran
 
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfCEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfLuis Beltran
 
Computo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxComputo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxLuis Beltran
 
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptxLuis Beltran
 
ACW - Azure Speaker Recognition Biometria de Voz.pptx
ACW - Azure Speaker Recognition Biometria de Voz.pptxACW - Azure Speaker Recognition Biometria de Voz.pptx
ACW - Azure Speaker Recognition Biometria de Voz.pptxLuis Beltran
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxLuis Beltran
 
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Luis Beltran
 
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLatino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLuis Beltran
 
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Luis Beltran
 
ATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxLuis Beltran
 
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Luis Beltran
 
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Luis Beltran
 
Real NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxReal NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxLuis Beltran
 
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxSesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxLuis Beltran
 
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...Luis Beltran
 
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLatam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLuis Beltran
 
GAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxGAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxLuis Beltran
 

Plus de Luis Beltran (20)

AI for Accessibility.pptx
AI for Accessibility.pptxAI for Accessibility.pptx
AI for Accessibility.pptx
 
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptxNET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
NET Conf Bhubaneswar - Migrating your Xamarin.Forms app to .NET MAUI.pptx
 
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
03 GlobalAIBootcamp2020Lisboa-Rock, Paper, Scissors.pptx
 
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
BI LATAM Summit 2022 - Creación de soluciones de automatización serverless-...
 
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdfCEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
CEIAAIT - Fundamentos y Aplicaciones de Deep Learning.pdf
 
Computo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptxComputo en la Nube con Azure - AI Gaming Panama.pptx
Computo en la Nube con Azure - AI Gaming Panama.pptx
 
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
5StarsConf - Serverless Machine Learning con Azure Functions y ML.NET .pptx
 
ACW - Azure Speaker Recognition Biometria de Voz.pptx
ACW - Azure Speaker Recognition Biometria de Voz.pptxACW - Azure Speaker Recognition Biometria de Voz.pptx
ACW - Azure Speaker Recognition Biometria de Voz.pptx
 
UNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptxUNICABA - Azure Machine Learning.pptx
UNICABA - Azure Machine Learning.pptx
 
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
Azure Talks Bolivia - Aumente la confiabilidad de su negocio con Azure Anomal...
 
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptxLatino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
Latino NET - Integrando WhatsApp en nuestras apps .NET con Twilio.pptx
 
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
Netcoreconf 2021 Realidad mixta en apps móviles con Azure Spatial Anchors y ...
 
ATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptxATG Puebla - El cementerio de Microsoft.pptx
ATG Puebla - El cementerio de Microsoft.pptx
 
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
Data-Saturday-10-Sofia-2021 Azure Video Indexer- Advanced data extraction fro...
 
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
Azure Community Conference - Image Recognition in WhatsApp chatbot with Azure...
 
Real NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptxReal NET Docs Show - Serverless Machine Learning v3.pptx
Real NET Docs Show - Serverless Machine Learning v3.pptx
 
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptxSesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
Sesion 5 - Eficiencia del Rendimiento - Well Architected Backstage Tour.pptx
 
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
XamarinExpertDay - Creating PDF files in mobile apps with PdfSharpCore and Mi...
 
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptxLatam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
Latam Space Week - Clasificación de rocas espaciales por medio de IA.pptx
 
GAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptxGAIBT Pune - Future of AI.pptx
GAIBT Pune - Future of AI.pptx
 

Dernier

9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 

Dernier (16)

9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 

IA en Azure Cognitive Search

  • 1. #GlobalAzure IA enriquecida con Azure Cognitive Search Luis Beltrán
  • 2. #GlobalAzure Luis Beltrán • Investigador en Tomas Bata University en Zlín, República Checa. • Docente en Tecnológico Nacional de México en Celaya, Mexico. • Alto interés en Xamarin, Azure e Inteligencia Artificial @darkicebeam luis@luisbeltran.mx
  • 3. #GlobalAzure Agenda • ¿Qué es Azure Search? • Enriquecimiento de IA • Descripción • Pasos • Demo Descarga la presentación: https://bit.ly/LuisGlobalAzure04
  • 5. #GlobalAzure Azure Cognitive Search Search-as-a-Service Gestión sencilla Búsquedas por keywords Analizadores de lenguaje Soporte a requerimientos geoespaciales Sugerencias / Autocompletado Scoring personalizado Búsqueda de proximidad Sinónimos, etc.
  • 6. #GlobalAzure Capacidades de los Cognitive Services Integra la Inteligencia Artificial en tus aplicaciones, sitios web y bots Detección de objetos, escenas y actividades. Reconocimiento e identificación facial Reconocimiento de celebridades y lugares emblemáticos Reconocimiento de la emoción Reconocimiento de texto y escritura a mano (OCR) Extracción y análisis de metadatos de video, audio y fotogramas clave Moderación de contenido explícito u ofensivo Reconocimiento de imagen personalizado Visión Detección de idioma Análisis de sentimiento de texto Extracción de frases clave Reconocimiento de la entidad Corrección ortográfica Moderación de contenido de texto explícito u ofensivo, detección de PII (Personally Identifiable Information) Traducción de textos Traducción de texto personalizable Comprensión del lenguaje contextual Lenguaje Resultados de búsqueda web, noticias, imágenes y videos sin publicidad Tendencias para video, noticias Identificación de imágenes, clasificación y extracción de conocimiento. Identificación de imágenes y productos similares. Reconocimiento y clasificación de entidades nombradas Adquisición de conocimiento para entidades nombradas Creación de motores de búsqueda personalizados sin publicidad Sugerencias automáticas Conocimiento Transcripción de voz (voz a texto) Síntesis de voz (texto a voz) Traducción de voz en tiempo real Identificación y verificación del orador Modelos de voz personalizados para transcripción y traducción Voz personalizada Voz Extracción de Q&A a partir de texto no estructurado Creación de base de conocimiento (KB) a partir de colecciones de preguntas y respuestas Emparejamiento semántico para bases de conocimiento Aprendizaje de personalización de contenido personalizable Búsqueda
  • 7. #GlobalAzure Enriquecimiento de IA El enriquecimiento de AI es una capacidad de indexación de Azure Cognitive Search utilizada para extraer texto de imágenes, blobs y otras fuentes de datos no estructurados. El enriquecimiento y la extracción hacen que el contenido sea más “buscable” mediante un índice o tienda de conocimiento. La extracción y el enriquecimiento se implementan por medio de habilidades cognitivas asociadas a un pipeline de indexación.
  • 8. #GlobalAzure Desde un punto de vista general… INGIERE Datos en cualquier formato y cualquier almacenamiento de Azure ENRIQUECE EXPLORA Anotaciones Habilidades cognitivas Búsqueda
  • 9. #GlobalAzure Las habilidades cognitivas integradas en Serch se dividen en dos categorías: • Las habilidades de procesamiento del lenguaje natural incluyen detección de lenguaje, extracción de frases clave, manipulación de texto, detección de sentimientos, reconocimiento de entidades. El texto no estructurado es mapeado a campos filtrables y de búsqueda en un índice. • Las habilidades de procesamiento de imágenes incluyen OCR e identificación de características visuales: detección facial, interpretación de imágenes, reconocimiento de imágenes (personas famosas y puntos de referencia) o atributos como la orientación de la imagen. Estas habilidades crean representaciones de texto del contenido de la imagen, lo que permite realizar búsquedas con las capacidades de consulta de Azure Cognitive Search.
  • 10. #GlobalAzure Arquitectura de Cognitive Search Skillset: Un pipeline extensible de enriquecimiento Indexación para búsqueda Document Cracking Documentos Anotados Datos del Cliente IEnricherIEnricherHabilidad Cognitiva Índice de Búsqueda INGIERE ENRIQUECE EXPLORA
  • 11. #GlobalAzure • Las habilidades cognitivas en Azure Cognitive Search se basan en modelos de aprendizaje automático previamente capacitados en API de servicios cognitivos: Computer Vision y Text Analytics. • El procesamiento de imágenes y lenguaje natural se aplica durante la fase de ingestión de datos, y los resultados se convierten en parte de la composición de un documento en un índice de búsqueda en Azure Cognitive Search.
  • 12. #GlobalAzure • Los datos se obtienen como un Azure dataset y luego se envían a través de una canalización de indexación utilizando las habilidades integradas que necesite. • La arquitectura es extensible, por lo que si las habilidades integradas no son suficientes, puede crear y adjuntar habilidades personalizadas para integrar el procesamiento personalizado. Por ejemplo, un módulo de entidad personalizado o un clasificador de documentos dirigido a dominios específicos, tales como publicaciones científicas, finanzas o medicina.
  • 13. #GlobalAzure ¿Cuándo utilizar el enriquecimiento de IA? Deberías considerar el uso de habilidades cognitivas integradas… • si tu contenido sin procesar es texto no estructurado, viene incluido en imágenes o es un contenido que necesita detección y traducción de idioma. La aplicación de IA a través de las habilidades cognitivas incorporadas puede desbloquear este contenido, aumentando su valor y utilidad en sus aplicaciones de búsqueda y ciencia de datos. • si tienes código open-source o de terceros que quisieras integrar en el pipeline. Modelos de clasificación que identifican características sobresalientes de varios tipos de documentos se incluyen en esta categoría, pero se podría usar cualquier paquete que agregue valor a tu contenido.
  • 14. #GlobalAzure Requerimientos de las habilidades personalizadas https Habilidad de traducción personalizada { "values": [ { "recordId": "7cad2", "data": { "value1": "I owe you 5 grand" } }, { "recordId": "7cad3", "data": { "value1": "Just my 2 cents", } }, … ] } { "values": [ { "recordId": "7cad2", "data": { "myOuput1": "Te debo cinco mil" } }, { "recordId": "7cad3", "data": { "myOutput1": "Solo mis 2 centavos" } }, … ] }
  • 15. #GlobalAzure Pasos a seguir para construir un pipeline de enriquecimiento Un pipeline de enriquecimiento está basado en indexadores. Los indexadores cargan un índice basado en asignaciones campo-a-campo entre el índice y su fuente de datos para descifrar documentos (document cracking). Las habilidades, ahora adjuntadas a los indexadores, interceptan y enriquecen los documentos de acuerdo con los conjuntos de habilidades (skillsets) definidos. Una vez indexado, puedes acceder al contenido a través de solicitudes de búsqueda usando cualquier tipo de consultas admitido por Azure Cognitive Search.
  • 16. #GlobalAzure Paso 1: Fase de conexión y “document cracking” Al comienzo del pipeline, tienes contenido no estructurado de texto o sin texto (imágenes, documentos escaneados…). Los datos deben existir en un servicio de almacenamiento de datos de Azure al que pueda acceder el indexador. Los indexadores pueden "descifrar" los documentos fuente para extraer su texto o crear contenido de texto de fuentes que no son de texto durante la indexación. La indexación toma tiempo, así que comienza con un conjunto de datos pequeño y representativo. Luego puedes aumentar gradualmente conforme la la solución madura.
  • 17. #GlobalAzure Document cracking (descifrar documentos) • Diferentes tipos de data sources • Blob Storage • Azure SQL • Cosmos DB • Azure Tables • MySQL • Azure Files (preview privado) • Formatos de archivo soportados en blob storage:  rtf  json  html  doc  ppt  xls  pdf  xml  png
  • 18. #GlobalAzure Paso 2: Fase de cognitive skills y enriquecimiento El enriquecimiento comienza con las habilidades cognitivas realizando operaciones atómicas. Por ejemplo, una vez descifrado un PDF, puedes aplicar reconocimiento de entidad, detección de idioma o extracción de frases clave para producir nuevos campos en su índice que no están disponibles de forma nativa en la fuente. En conjunto, la colección de habilidades utilizadas en el pipeline se denomina conjunto de habilidades (skillset).
  • 20. #GlobalAzure Un skillset se basa en habilidades cognitivas integradas, o habilidades personalizadas que se conectan al skillset. Un skillset puede ser tan sencillo o complejo como se desee, y determina no solo el tipo de procesamiento, sino también el orden de las operaciones. Un skillset más las asignaciones de campo definidas como parte de un indexador especifican por completo el pipeline de enriquecimiento. Internamente, el pipeline genera una colección de documentos enriquecidos. Puedes decidir qué partes de los documentos enriquecidos deben asignarse a campos indexables en el índice de búsqueda. Por ejemplo, si se aplicaron las habilidades de extracción de frases clave y reconocimiento de entidades, esos nuevos campos se convertirían en parte del documento enriquecido y se pueden asignar a campos en su índice.
  • 21. #GlobalAzure Habilidades Cognitivas Habilidades integradas Extracción de entidad de ubicación Extracción de entidad de personas Reconocimiento de celebridades Detección de propiedades Análisis de sentimientos Detección de idioma Extracción de etiquetas de imagen Reconocimiento de texto impreso Extracción de palabras clave Extracción de entidad de organización Detección de rostros Utilidades de texto Azure Databricks Machine Learning VMs Azure Machine Learning Habilidades personalizadas Tu habilidad personalizada va aquí
  • 22. #GlobalAzure Ejemplo de un skillset texto imágenes OCR (reconocimiento de texto) reconocimiento de entidades de organización fusionar texto reconocimiento de entidades de localización
  • 23. #GlobalAzure Añade un elemento knowledgeStore para guardar los pipelines La api-version=2019-05-06-Preview del servicio REST de Search extiende las habilidades con una definición de KnowledgeStore que proporciona una conexión de almacenamiento de Azure y proyecciones que describen cómo se almacenan los enriquecimientos. Esto es complementario al índice. En un pipeline estándar de IA, los documentos enriquecidos son transitorios, se usan solo durante la indexación y luego se descartan. Con el knowledge store, se conservan los documentos enriquecidos.
  • 24. #GlobalAzure Paso 3: Índice de búsqueda y acceso basado en consultas Cuando finaliza el procesamiento, se genera un índice de búsqueda que consta de documentos enriquecidos que soportan búsquedas full-text en Azure Cognitive Search. Al consultar el índice, los desarrolladores y los usuarios acceden al contenido enriquecido generado por el pipeline. El índice es como cualquier otro que pueda crear para Azure Cognitive Search: puede ser complementado con analizadores personalizados, invocar consultas de búsqueda difusas, agregar búsqueda filtrada o experimentar con perfiles de puntuación para remodelar los resultados de búsqueda.
  • 25. #GlobalAzure Los índices se generan a partir de un esquema de índice que define los campos, atributos y otras construcciones adjuntas a un índice específico, tales como perfiles de puntuación y mapas de sinónimos. Una vez que se define y llena un índice, puedes indexar de forma incremental para recoger nuevos documentos y actualizaciones de los originales. Ciertas modificaciones requieren una reconstrucción completa. Se sugiere usar un pequeño conjunto de datos hasta que el diseño del esquema sea estable.
  • 26. #GlobalAzure Checklist: Un flujo de trabajo típico 1. Obtén una muestra representativa de tus datos almacenados en Azure. La indexación toma tiempo, así que comienza con un conjunto de datos pequeño y representativo, y luego aumenta gradualmente a medida que la solución madura. 2. Crea un data source object en Azure Cognitive Search para proporcionar una cadena de conexión y así obtener los datos. 3. Crea un skillset con los pasos de enriquecimiento descritos. 4. Define el esquema del índice. La colección Fields incluye campos de los datos de origen. También deberías eliminar campos adicionales para contener los valores generados para el contenido creado durante el enriquecimiento. 5. Define el indexador que hace referencia a la fuente de datos, el skillset y el índice. 6. Dentro del indexador, agrega outputFieldMappings. Esta sección asigna la salida del skillset (en el paso 3) a los campos de entrada en el esquema de índice (en el paso 4). 7. Envía la solicitud Create Indexer que acabas de crear (una petición POST con una definición de indexador en el cuerpo de la solicitud) para expresar el indexador en Azure Cognitive Search. Este paso es la ejecución del indexador, invocando el pipeline. 8. Realiza consultas para evaluar los resultados y modifica el código para actualizar los skillsets, el esquema o la configuración del indexador. 9. Restablece el indexador antes de reconstruir el pipeline.
  • 27. #GlobalAzure Demo • En esta demostración, combinarás servicios y datos en la nube de Azure para crear un skillset. • Una vez que todo esté en su lugar, ejecutarás el asistente de importación de datos en el portal para unirlo todo. • El resultado final es un índice de búsqueda poblado con datos creados por el procesamiento de IA que puede consultar en el portal mediante el Search Explorer. • Esta demostración usa Azure Cognitive Search, Azure Blob Storage y Azure Cognitive Services para la IA.
  • 30. #GlobalAzure Proyecto open-source disponible en GitHub: https://github.com/icebeam7/AIEnrichmentDemo
  • 31. #GlobalAzure Call to Action Introducción al enriquecimiento con IA https://docs.microsoft.com/es-mx/azure/search/cognitive-search- concept-intro Quickstart: Creación de un conjunto de aptitudes cognitivas de Azure Cognitive Search en Azure Portal https://docs.microsoft.com/es-mx/azure/search/cognitive-search- quickstart-blob
  • 32. #GlobalAzure Call to Action Tutorial: Uso de REST y AI para generar contenido en el que se pueden realizar búsquedas desde blobs de Azure https://docs.microsoft.com/es-mx/azure/search/cognitive-search- tutorial-blob Tutorial: Uso de C# y AI para generar contenido que permite búsquedas desde blobs de Azure https://docs.microsoft.com/es-mx/azure/search/cognitive-search- tutorial-blob-dotnet
  • 34. #GlobalAzure ¡Gracias por tu atención! Luis Beltrán Tomás Bata University in Zlín Tecnológico Nacional de México en Celaya luis@luisbeltran.mx luisbeltran.mx @darkicebeam GitHub: https://github.com/icebeam7 LinkedIn: https://linkedin.com/in/luisantoniobeltran SlideShare: https://slideshare.net/icebeam YouTube: https://youtube.com/user/darkicebeam About Me: https://about.me/luis-beltran