2. 1. LA IMPORTANCIA DE
LA ANALÍTICA DE
DATOS EN LA GESTIÓN
DE UN CENTRO
EDUCATIVO
3. Big Data
• El término "big data" se
refiere a los datos que son tan
grandes, rápidos o complejos
que es difícil o imposible
procesarlos con los métodos
tradicionales
4. La analítica de
aprendizaje y Big Data
• Volumen:
• Grandes volúmenes de información. Se
está pasando de hablar en Gigabytes o
Terabytes a tamaños de datos de
Petabytes, Exabytes o Zettabytes.
Volúmenes que se nos escapan.
5. • Velocidad:
• Velocidad con la que se
genera la información. La
velocidad a la que se genera
esta información hace
imposible gestionarla con
sistemas de base de datos
convencionales. Las
empresas y las personas ya
no quieren estar al día,
quieren “estar al segundo”.
6. • Variedad:
• Información de tipos muy
diversos. Ya no solo
tenemos información
estructurada en Bases de
Datos o Archivos. Ahora
empezamos a tener
información con tipos
diferentes y totalmente
desestructurados.
7. • Veracidad:
• Incertidumbre sobre la consistencia y
veracidad de los datos. En un
entorno de analítica de negocio
tradicional, los orígenes de datos son
mucho más reducidos en número y
tipo (menor Variedad) y la
organización suele tener más control
sobre ellos y mucho más
conocimiento sobre su volumen y
calidad (mayor Veracidad). En un
entorno Big Data, la mayor Variedad
implica, necesariamente, mayor
incertidumbre sobre la calidad de
cada dato y su disponibilidad futura.
8. • Valor:
• Hace referencia a la información útil
que se puede extraer de los datos.
Esa misma que te ayudará a generar
un valor agregado para tu negocio,
que se convierte en conocimiento y
en una acción o decisión.
• Pero para que esa información se
considere de valor, debe cumplir las
cuatro V mencionadas con
anterioridad.
• Se trata, por tanto, de una información
de valor que deberás saber utilizar
para exprimir al máximo los datos de
tus clientes y definir estrategias de
negocio más inteligentes y eficaces.
9. La analítica de
aprendizaje
• Se conoce por analítica de
aprendizaje al uso de los datos
disponibles en las instituciones
educativas, a través de
herramientas de análisis,
usualmente estadísticas.
10. • La analítica de aprendizaje
estudia el pasado y el presenta
del comportamiento de los
alumnos para intentar predecir el
futuro. Para ello elabora modelos
de datos predictivos y
aproximaciones estadísticas
Esta foto de Autor desconocido está bajo licencia CC BY-NC-ND
11. Informe de analíticas
Tendencias pasadas y
observaciones
Analíticas
automatizadas
Datos automatizados y
proporciona datos a usuarios
finales
Analíticas Predictivas
Utiliza gran cantidad de datos
histórica
12. • Los centros educativos son una fuente
muy importante de datos. De cada
aula de clase emergen datos que
alimentan un sistema institucional, el
cual, a su vez, alimenta un sistema
local, municipal, nacional y así, hasta el
conjunto global.
• Estos niveles, en analítica de datos del
aprendizaje, se conocen como analítica
de nivel macro, meso y micro.
Esta foto de Autor desconocido está bajo licencia CC BY-NC-ND
13. POR CONSIGUIENTE, PUEDE HABER
ANÁLISIS HORIZONTALES O AL MISMO
NIVEL, O ANÁLISIS TRANSVERSALES O
ENTRE NIVELES.
CADA UNO PROPORCIONA DIFERENTES
TIPOS DE INFORMACIÓN, HACIENDO QUE
LOS HALLAZGOS EN UN NIVEL
FORTALEZCAN LOS HALLAZGOS EN OTROS
NIVELES, O DERIVEN EN OTROS ESTUDIOS
O RELACIONES
14. El proceso de analítica de
aprendizaje
1. Establecer
objetivos y
métricas.
2. Recolectar datos.
3. Analizar y
visualizar
información.
4. Actuar.
5. Evaluar
15. Objetivos de la analítica de aprendizaje
• Entender qué ocurre
en nuestros entornos
educativos.
• Conocer el
comportamiento de
nuestros alumnos más
allá del aula física.
• Establecer acciones
para la mejora
educativa.
• Prevenir posibles
fracasos.
• Entender los distintos
sucesos en entornos
virtuales.
• Potenciar la tutoría
offline y online.
• Conseguir una
evaluaci6n más
objetiva.
• Mejorar el contexto y
recursos de
aprendizaje.
• Auditar cursos para
su mejora continuada.
• Analizar el uso de los
contenidos de un
curso.
• Realizar un
seguimiento exhaustivo
de los alumnos.
• Comprobar que un
video ha sido
visualizado.
• Comprobar la
idoneidad de un
recurso educativo.
• Soportar cualquier
metodología y
didáctica en el aula.
• Conocer
comportamientos.
16. Los objetivos para un profesor podrían ser:
Hacer el seguimiento del
proceso de aprendizaje.
• Explorar datos del
estudiante.
• Identificar problemas. • Descubrir patrones.
• Encontrar indicadores
hacia la consecución del
éxito.
• Encontrar indicadores
hacia notas bajas,
suspensos o abandonos.
Asegurar la utilidad de
los materiales.
• Incrementar la
reflexión, autorreflexión
y conciencia en el
proceso de aprendizaje.
• Incrementar la
comprensión de
entornos virtuales de
aprendizaje.
• Intervenir, supervisar,
aconsejar y asistir.
• Establecer acciones
para la mejora de la
enseñanza, los recursos y
el contexto educativo.
• Conocer el
comportamiento de
nuestros alumnos más
allá del aula física.
• Potenciar la tutoría
offline y online.
17. Los objetivos para un estudiante:
• Hacer el seguimiento
de sus actividades e
interacciones.
• Hacer el seguimiento
de su proceso de
aprendizaje.
• Comparar su actividad
con la de otros.
• Incrementar la
reflexión, autorreflexión
y conciencia en el
proceso de aprendizaje.
• Mejorar la
participación en los
debates.
• Mejorar el
comportamiento del
aprendizaje.
• Mejorar el
rendimiento.
• Llegar a ser mejores
aprendices.
• iAprender mejor!
18. Tableros
analíticos de
control
(Analytics
dashboards)
LOS TABLEROS DE CONTROL SON
REPRESENTACIONES GRÁFICAS
QUE PERMITEN TENER UN
SEGUIMIENTO DE LOS
INDICADORES SIGNIFICATIVOS DE
UNA SITUACIÓN.
UN TABLERO DE CONTROL ESTÁ
COMPUESTO POR UNA SERIE DE
INDICADORES QUE PERMITEN
ENTENDER UNA SITUACIÓN
DETERMINADA.
19.
20. Los expertos identifican tres tipos
específicos de secciones que deberían
tener los tableros analíticos de
control:
(a) para quien
realice la función de
instructor y diseñe
el curso
(b) para estudiantes
y docentes y
(c) los propios de un
sistema de analítica
de datos del
aprendizaje (ADA).
21. Marco metodológico
Selección de la muestra
Validación de instrumentos
Diseño de base de datos funcional
Elaboración de visualizaciones o tableros
analíticos de control
Socialización de las visualizaciones y tableros
(estudiantes, profesores y administrativos)
22. 2. TÉCNICAS DE
EXTRACCIÓN Y
TRATAMIENTO
DE DATOS
Esta foto de Autor desconocido está bajo licencia CC BY-SA
23. Business Intelligence
BI.
• La BI es una herramienta bajo la cual
diferentes tipos de organizaciones, pueden
soportar la toma de decisiones basadas en
información precisa y oportuna;
garantizando la generación del conocimiento
necesario que permita escoger la alternativa
que sea más conveniente para el éxito de la
empresa.
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
24. 2.1 El proceso de descubrimiento de
información en los datos
1.- Comprender el dominio de
aplicación y plantear objetivos.
•La correcta definición de
objeticos es siempre la clave
del éxito de cualquier análisis
de datos. Nos ayuda a centrar
el problema y sirve de guía
para todo el resto de etapas.
Ayuda a evaluar la idoneidad
de los resultados obtenidos en
el resto de tareas que siempre
deberían estar guiadas por los
objetivos de conocimientos del
proyecto.
2.- Seleccionar y crear el
conjunto de datos para el
análisis.
•Ver los datos disponibles,
obtener datos adicionales,
extraer la información
relevante e integrar todos ellos.
3.- Preprocesado y limpieza.
•Para uniformizar los distintos
formatos de datos, eliminar
datos erróneos... La calidad de
los resultados dependerá en
gran medida de la calidad de
los datos empleados.
4.- Transformación. Se generan
los mejores datos.
•Se emplean métodos como
reducción de dimensión o
transformación de atributos.
Este proceso de preparación de
los datos es fundamental para
facilitar los posteriores trabajos
de análisis.
25. 5.- Buscar la herramienta
de análisis de datos
adecuada en función de
los objetivos.
•Se buscará la aplicación
o entorno en el mercado
que nos permita
automatizar la mayor
parte del
procesamiento. De esta
manera evitaremos
realizar desarrollo si
contamos con un
software para la misma
función
6.- Elección del algoritmo
de análisis.
•Se selecciona el método
específico para buscar
patrones.
7.- Emplear el algoritmo
seleccionado.
•Aplicar el algoritmo
seleccionado y obtener
resultados.
8.- Evaluación. Se evalúan
e interpretan los patrones
encontrados, respecto a
los objetivos fijados
inicialmente.
•La interpretación de los
resultados deberá ser
llevada a cabo por un
experto en el ámbito de
los datos. Solo él podrá
dar sentido a los
resultados generados.
9.- Usar el conocimiento
descubierto.
27. En este proceso se hace uso de diferentes
técnicas:
Scraping .
• Extracción de datos desde fuentes de información en formatos no apropiados para la reutilización.
• Transformación.
• Convierten la estructura de un conjunto de datos a otra diferente que nos resulte más apta para el
aprovechamiento posterior en forma de productos, servicios o aplicaciones.
• Análisis.
• Proceso de transformación de la información en conocimiento mediante análisis descriptivo,
inferencial o predictivo, entre otros.
• Presentación.
• Presentar los resultados del análisis como mapas, gráficos o líneas del tiempo, entre otros
28. 2. EXTRACCIÓN,
TRANSFORMACIÓN
Y LIMPIEZA
• La Extracción, Transformación y
Limpieza (ETL) es un proceso, o
conjunto de procesos, que extrae
datos de fuentes, hace cumplir las
normas de calidad de los datos y la
consistencia, se adecuan los datos de
modo que las fuentes separadas se
pueden utilizar juntos, y finalmente
entrega datos en un formato definido
para que los desarrolladores puedan
crear las aplicaciones y los usuarios
finales pueden manejar datos fiables.
29. En la extracción se obtienen los datos para el análisis a partir de las fuentes de datos
• BASES DE
DATOS
• HOJAS DE
CÁLCULO
• DOCUMENTOS
PDF
• CORREOS
ELECTRÓNICOS
• INFORMACIÓN
EN LA WEB…
30. En la tarea
de limpieza
podemos
definir las
siguientes
fases:
• Definir tipos de error
• Buscar e identificar instancias erróneas
• Corregir los errores
• Herramientas (para identificar datos “atípicos”)
• Estadística. Medias desviaciones, intervalos de confianza
• Clasificación. Basada en distancia euclídea.
• Basados en patrones. Identifica datos atípicos que no se ajustan a los
patrones existentes
• Reglas de asociación. Definen patrones. Permite asociar más de un
campo
31. La transformación tiene
por objeto conseguir
una la visión integrada,
consistente y
consolidada de los
datos, es decir, refinar
datos para que cumplan
requisitos de entrada de
algoritmos de análisis.
• Conversión de
variables
• Reducción /adición de
variables
• Discretización /
generalización
32. 2.3 Técnicas de extracción de
datos
• El data scraping, raspado de datos o escrapeo de datos es
un conjunto de técnicas de programación con las que es
posible extraer la información (o los datos), sea cual sea la
presentación, de un documento mediante ingeniería
inversa. Estas técnicas simulan la exploración humana de
un documento o sitio web, extrayendo la información que
contiene y presentándola en un formato
33. Las técnicas de scraping tienen algunas limitaciones, por lo que se
utilizan como herramientas de
último recurso, es decir, cuando la fuente de información no
proporciona los datos en formatos
reutilizables, y aplicar estas técnicas es la única alternativa.
Formato.
• Cuando los datos que se presentan en el
documento origen no son listados o tablas, el
resultado tras el scraping queda poco estructurado,
complicando el trabajo de procesado de los datos.
Para estos casos, los asistentes de scraping como
los que presentamos en el siguiente punto, no son
del todo útiles, al requerir habilidades en desarrollo
software para el uso de las librerías de
programación de scraping.
34. Paginación.
• Cuando los resultados en
el documento origen están
repartidos en diversas
páginas, el scraping
resulta complejo y
requiere en ocasiones de
conocimientos de
programación para poder
realizar la extracción.
35. Codificación de caracteres.
• Son necesarias herramientas (o una
combinación de ellas) capaces de
manejar un juego de caracteres amplio
(tildes, eñes, caracteres extraños), pues
en caso contrario, la codificación de los
mismos en el documento origen puede
dar lugar a extracciones con errores
36. 2. 4 Herramientas
para la extracción
de datos
• Se han seleccionado un conjunto de
aplicaciones que sirven para dar
soporte al proceso de extracción de
datos.
• La selección se ha realizado en
función de la
• sencillez,
• disponibilidad y
• gratuidad.
37.
38. 2. 5 Técnicas de transformación
En ocasiones, los conjuntos de datos
representados en tablas no son perfectos,
están expresados en diferentes formas,
utilizan abreviaturas, contiene errores de
codificación, etc., y corregirlos de forma
manual no es viable.
Se utilizan entonces unas herramientas de
transformación de datos para mejorar la
calidad de la información y hacerlos útiles
para el análisis, pues ayudan a filtrar, mejorar
y clasificar la información.
39. DATA CLEANSING
(limpieza de datos)
• Corrigen errores en los datos que afectan a
la calidad, por ejemplo, eliminan caracteres
extraños que pueden dificultar la búsqueda
o normalizar nombres de ciudades o códigos
postales a fin de que todas sigan la misma
nomenclatura.
40. DATA WRANGLING
(transformación de datos)
• Convierten la estructura de los datos en otra
diferente, más apta para su utilización
posterior en forma de visualización o análisis
estadístico.
41. DATA WRANGLING
(transformación de datos)
• Convierten la estructura de los datos en otra
diferente, más apta para su utilización
posterior en forma de visualización o análisis
estadístico.