Proyecto integrador. Las TIC en la sociedad S4.pptx
Identificación y caracterización de productos de análisis de información.
1. UNIVERSIDAD DE GUADALAJARA
SISTEMA DE UNIVERSIDAD VIRTUAL
Licenciatura en Tecnologías e Información 2010B
Análisis de la información.
Objeto de estudio IV
Identificación y caracterización de productos de análisis de información.
Actividad de aprendizaje 1.
Alumno:
C. Alejandro Serralde Romero.
210219574
2. Herramientas y Técnicas De Análisis De Información.
Definir el tipo de herramientas utilizadas para evaluar el flujo de información en la
internet, son un poco difíciles de definir basándonos en el artículo “Tendencias en
minería de datos de la Web de Ricardo Baeza-Yates”, pues en él se mencionan los
puntos que las grandes empresas de internet intentan evaluar con la ayuda de dichas
herramientas.
La minería de datos prepara, sondea y explora los datos para sacar la información
oculta en ellos, Statistica y Excel son las primeras herramientas de análisis de datos
estadísticos que se nos vienen a la mente, sin embargo en mi opinión creo que una
herramienta más especifica seria OLAP, la cual es una solución utilizada en el campo
de la llamada Inteligencia empresarial cuyo objetivo es agilizar la consulta de grandes
cantidades de datos. Para ello utiliza estructuras multidimensionales que contienen
datos resumidos de grandes Bases de datos o Sistemas Transaccionales. Se usa en
informes de negocios de ventas, marketing, informes de dirección, minería de datos y
áreas similares.
La razón de usar OLAP es la velocidad de respuesta. Una base de datos relacional
almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es
buena en un sistema pero para las complejas consultas multitabla es relativamente
lenta. Un modelo mejor para búsquedas (aunque peor desde el punto de vista
operativo) es una base de datos multidimensional.
3. Con respecto a las técnicas usadas, sin duda la más popular es lo que se llama
aprendizaje automático, consiste en aprender como predecir variables en función de
otras variables a través de subconjuntos de datos completos y luego evaluar cuán
buena es la predicción en otro subconjunto de datos. El algoritmo resultante se usa en
los datos reales con la suposición de que su desempeño será similar. Este proceso se
repite en el tiempo para ir mejorando la herramienta con casos difíciles. Para esto se
pueden utilizar árboles de decisión, máquinas de soporte vectorial o redes neuronales,
entre otros.
Como conclusión podemos afirmar que cuando se aplican adecuadamente las
herramientas para el análisis estadístico y minería de datos, se pueden obtener datos
reales, que nos permiten una visión correcta del comportamiento de la información en
la red.
4. Bibliografía.
Baeza-Yates Ricardo. (s.f.). Tendencias en la minería de datos de la web. Obtenido de
http://148.202.105.242/metacampus-liferay-
portlet/viewFile?id=2799&persistence=AVACursosPersistenceF0087
Wikipedia. (s.f.). Minería De Datos. Obtenido De
http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
Wikipedia. (s.f.). OLAP. Obtenido de http://es.wikipedia.org/wiki/OLAP