1. Tema 1:Introducción a la estadística. Equipo 1: 1-Samantha Carolina García Sánchez. 2-Dora Elia Bonilla Leal. 3-María Verónica Castro Puente. 4-Elvia Nayeli Rodríguez Castillo. 5-Ramón René Cisneros Rivera. 6-José de Jesús Treviño Cruz. 7-Alberto E. Martínez Vigil. Fecha de exposición: Jueves 7 de febrero del 2008. Universidad Autónoma de Nuevo León Facultad de Ciencias Políticas y Administración Publica
2. Tema 1: Introducción a la Estadística 1.1 Concepto y Clasificación de Estadística 1.2 Medidas de: Escalas y estadígrafos 1.3 Tabulación y Representación de Datos 1.4 Medidas de Tendencia Central 1.5 Medidas de Variabilidad
3. La palabra estadística tiene fundamentalmente dos significados. El primero de ellos se refiere a datos clasificados, especialmente numéricos, acerca de una clase de objetos. En segundo término, se llama estadística a la ciencia que trata de la recolección, análisis, interpretación y representación de datos numéricos. La estadística tiene su origen en dos áreas de interés que en apariencia tiene muy poco en común: la ciencia política y los juegos de azar. Quizá aquellos que hayan seguido la carrera de algunos lideres políticos conciban la vida política como un juego de azar en el que en ciertos periodos o sexenios la fortuna les sonríe, mientras que en otros periodos son victimas de ataques, o peor aun, del olvido. En el siglo XXXI a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística.
4. Los gobiernos han tenido intereses desde la antigüedad en contar a las personas de dicho lugar, sus propiedades y en especial los impuestos que recaudaban o podían recaudar. Ya en el antiguo testamento se menciona censos de carácter militar, mientras que en babilonia, china Egipto y roma se elaboraban censos con propósitos fiscales. El primer censo del que se tiene noticia en México data del año 1116, cuando el rey chichimeca Xólotl ordeno que fueran censados todos sus súbditos. Para contarlos, cada uno tiro una piedra en un montón llamado nepohualco (contadero). Se formaron así doce montones de piedras y, de acuerdo con los códices, el resultado arrojo la cifra de 3200000 personas. Desde fines de siglo XIX, salvo en la época de la revolución mexicana, se han conducido censos generales de población y vivienda cada 10 años. Es a través de su lectura que vemos como ha evolucionado la sociedad mexicana a lo largo del tiempo. Los problemas asociados a la descripción, resumen y análisis de los datos de los cencos ha dado lugar al desarrollo de métodos que constituyen una de las partes de la estadística que más ha sido estudiada, la estadística descriptiva.
5. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de “interpretación” de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.
6. El empleo de la estadística tanto en la vida profesional como en multitud de aspectos de la vida personal ha aumentado considerablemente en las ultimas décadas. Esto se debe, por un lado, a la necesidad de aplicar métodos cuantitativos en muchas áreas del quehacer humano, tales como la administración de empresas, las finanzas, la medicina, la psicología, la producción, la contaminación ambiental, la política, etc. Por otro lado, la tecnología computacional ha avanzado considerablemente y hoy en día es posible manipular datos de manera sencilla y eficiente con el uso de paquetes estadísticos o de una hoja de cálculo en una computadora personal. Existen por lo menos tres razones para estudiar la estadística: (1) los datos se encuentran en todos lados (2) las técnicas estadísticas se utilizan para la toma de muchas decisiones que afectan nuestra vida, y (3) sin importar su línea de trabajo futura, usted tendrá que tomar decisiones que involucran datos. El conocimiento de los métodos estadísticos ayudara a tomar esas decisiones con mayor efectividad.
7. ¿Qué es la estadística? Estadística . La ciencia de recolectar, clasificar, describir e interpretar datos numéricos. La estadística es una rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones. Es también el lenguaje universal de la ciencia, tanto en sus ramas físicas como sociales. La comprensión y el uso de la estadística nos permite comunicar más exactamente los descubrimientos de las investigaciones estadísticas. La estadística es también un instrumento que, utilizado con cuidado y precisión, nos permite describir nuestros resultados y adoptar decisiones al respecto a lo que nos dicen. El primer campo de actuación de la estadística, como se ha visto, es la demografía. De esta ciencia ha tomado la nomenclatura (población, individuo…).
8. El campo de la estadística puede dividirse en dos áreas: estadística descriptivas y estadísticas de inferencias. La estadística descriptiva es aquella parte del tema en que piensa la mayoría de la gente cuando oye la palabra “estadística”. Consiste en el área de la estadística dedicada a la recolección, presentación y descripción de datos numéricos. También es el conjunto de métodos para organizar, resumir y presentar los datos de manera informativa. Tiene sus raíces en la necesidad de las grandes organizaciones políticas y sociales de guardar registros. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos: - Selección de caracteres dignos de ser estudiados. - Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres seleccionados. - Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro de cada carácter. - Representación gráfica de los resultados (elaboración de graficas estadísticas…
9. La estadística de inferencia también denominada inferencia estadística y estadística inductiva, y se refiere a las técnicas de interpretar los valores que se obtienen a partir de las técnicas descriptivas y a la técnica de tomar decisiones sobre la base de los resultados . Trabaja con muestras, subconjuntos formados por algunos individuos de la población. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la población. Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de confianza se puede tener en ella son aspectos fundamentales de la estadística inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad y matemáticas. Su principal objetivo es encontrar algo sobre una población basándose en una muestra tomada de dicha población.
10. La probabilidad su concepto se desarrollo históricamente para estudiar los juegos de azar, una definición de probabilidad que solo es valida cuando todos los resultados son igualmente probables es: Si hay “n” posibilidades igualmente probables y una de ella debe ocurrir, entonces la probabilidad de que ocurra alguna de “k” de estas “n” posibilidades es k/n. Es una rama interesada en el concepto y medición de la incertidumbre de que suceda algún evento de interés. De esto podemos deducir que la probabilidad de que suceda un evento es un número real entre cero y uno. Entre mas pequeño sea este numero, el evento es menos probable, y entre mas cercano a uno sea este numero, el evento es mas probable. Cuando la probabilidad es igual a ½ (0.5), el evento tiene la misma probabilidad e ocurrir que de no ocurrir.
11. Una población puede constar de individuos, incluir objetos y estar formada por un grupo de medidas. Entonces cabe mencionar que una población, en el sentido estadístico, no siempre se refiere a personas. Por lo tanto la definición exacta de población es la siguiente: Conjunto de todos los posibles individuos, objetos o medidas de interés Por lo general siempre se toma una muestra de una población para inferir algo acerca de la misma.
12. Una muestra no es más que una porción, o parte, de la población de interés para su análisis. Un parámetro es la medida numérica que describe una característica de la población. Un estadístico es la medida numérica que describe alguna característica de la muestra. Los métodos inferenciales utilizan los datos de la muestra para calcular los estadísticos que proporcionan los estimados de las características de una población.
13. Tipos de datos. Los datos son los valores observados de las variables, por ejemplo las respuestas de una encuesta. Existen 2 tipos de variables: categóricas y numéricas. Las variables categóricas producen respuestas categóricas como sí o no. Las variables numéricas producen respuestas tales como la estatura en metros. Las variables numéricas a su vez se dividen en discretas y continuas. Las variables numéricas discretas producen respuestas numéricas que surgen de un proceso de conteo. Las variables numéricas continuas producen respuestas numéricas que surgen de un proceso de medición. Tipo de dato Tipo de preguntas Respuestas Categórico ¿Posee actualmente acciones o bonos? Si No Numérico discreto ¿A cuántas revistas esta suscrito actualmente? ___________ revistas Numérico continuo ¿Cuánto mide? ___________ mts.
14. Las variables pueden clasificarse con base a su escala de medida. La manera en que se clasifican las variables afecta en gran parte la forma como se utilizan en el análisis. a) Las variables pueden ser: 1- Nominales 3- De intervalo 2- Ordinales 4- De razón
15. Una Medida de Escala Nominal se crea cuando se utilizan nombres para establecer categorías dentro de las cuales las variables pueden registrarse exclusivamente, es decir estas clasificaciones se utilizan para datos y categorías distintas y separadas. Las Medidas en Escala Ordinales son las que clasifican las observaciones en categorías con un orden significativo. En una escala de intervalo las variables se miden de manera numérica, y al igual que los datos ordinales, llevan inherente un rango u ordenamiento. Sin embargo, a diferencia de los rangos ordinales, la diferencia entre los valores es importante. A diferencia de una medida en escala nominal, la de escala ordinal sí muestra un ordenamiento o secuencia de los datos. Las encuestas de opinión con frecuencia una medida en escala ordinal como “totalmente de acuerdo”, “de acuerdo”, “sin opinión”, “en desacuerdo”, “totalmente en desacuerdo”.
16. Las Medidas en Escala de Intervalo son medidas en una escala numérica en la cual el valor cero es arbitrario pero la diferencia entre los valores es importante. Las Medidas de Escala de Razón son medidas numéricas que se basan en un sistema numérico en el cual el cero es significativo, es un valor fijo en cualquier escala y la diferencia entre valores es importante.
17. b) Estadígrafos Los estadígrafos están enfocados a llevar a cabo inferencias sobre patrones de la población, observados a partir de la muestra. Sin embargo, una tarea importante es la construcción de juicios acerca de la certeza de los valores obtenidos para los estadígrafos, es decir, una gran parte del estudio de la estadística consiste en la determinación de la confianza sobre los estadígrafos. En general debemos de considerar que los estadígrafos son construidos en la optimización de recursos y en el acceso a la interpretación de la población. La clasificación dada para los estadígrafos los divide en:
18. * Específicos están enfocados a estadígrafos que permiten describir parámetros propios del área por lo cual el término especifico se refiere a la obtención de parámetros que solo tienen utilidad en un área del conocimiento. Ejem.- (Administrativos o de producción, clínicos, económicos, matemáticos, informáticos, ópticos, entre otros.) *De Posición (Como la media, mediana, moda, percentiles, entre otros.) *De Dispersión (desviación estándar, varianza, rango, amplitud, entre otros.) Los estadígrafos de posición y de dispersión son estadígrafos que no están sujetos a un área particular, por ejemplo, la media es un estadígrafo que no depende de un área del conocimiento sino que puede ser una herramienta en diversas áreas del conocimiento, así vemos que se usa en la economía, en el área médica, en el áreas administrativas, entre otras.
19.
20. Razón Porcentaje Comparación de compra 23 Conveniencia 33 Gastos de envío gratis 34 Variedad en la selección 6 Velocidad 4 total 100
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38. 1.4 Medidas de Tendencia Central La mayor parte de las series de datos muestran una clara tendencia a agruparse alrededor de un cierto punto central. Entonces dada cualquier serie de datos particular, por lo general es posible seleccionar algún valor o promedio típico para describir toda la serie de datos. Este valor descriptivo típico es una medición de tendencia central o de ubicación. Cinco tipos de promedios a menudo usados como mediciones de tendencia central. Son la media aritmética, mediana, moda, el rango medio y el eje medio.
39. Cinco tipos de promedios a menudo usados como mediciones de tendencia central. Son la media aritmética, mediana, moda, el rango medio y el eje medio. *Media aritmética: es la más común. Se calcula sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el número de elementos involucrados. *Mediana: es el valor medio de una secuencia ordenada de datos. *Moda: es el valor de una serie de datos que aparece con más frecuencia. Se obtiene fácilmente de una clasificación ordenada. *Rango Medio: es el promedio de las observaciones menores y mayores de una serie se datos. *Eje Medio: es el promedio del primer y tercer cuartiles de una serie de datos. (Cuartiles: mediciones de ubicación no central, se emplean particularmente al resumir o describir las propiedades de grandes series de datos numéricos)
40. 1.5 Medidas de Variabilidad La variación es la cantidad de dispersión o propagación en los datos. Dos series de datos pueden diferir tanto en la tendencia central como en la variación. Pero también dos series de datos pueden tener las mismas mediciones de tendencia central, pero diferir grandemente en términos de variación. Algunas de éstas medidas de variabilidad son:
41. *Rango: es la diferencia entre la mayor y la menor observación en una serie de datos. *Rango intercuartil: (propagación media) es la diferencia entre el tercer y cuarto cuartiles en una serie de datos. *La varianza y la desviación estándar: toman en cuenta cómo se distribuyen todos los valores en los datos. *Varianza de muestra: es aproximadamente el promedio de las diferencias cuadradas entre cada una de las observaciones en una serie de datos y la media. Así, para una muestra que contiene “n” observaciones, X 1 , X 2 , X n , la varianza de muestra (dada por el símbolo S 2 ) puede escribirse como *Desviación estándar de muestra: (dada por el símbolo S) es simplemente la raíz cuadrada de la varianza de muestra. La varianza y la desviación estándar miden la dispersión “promedio” alrededor de la media, es decir, como las observaciones mayores fluctúan por encima de esta y como las observaciones menores se distribuyen por debajo de esta. .
42. Los conjuntos de datos representan la intersección entre la oferta y la demanda de información, de acuerdo con los recursos disponibles. En cuanto a la divulgación de la información estadística; para que esta sea oportuna y confiable es indispensable contar con un programa de publicaciones bien diseñado y ejecutado, se requiere una modernización constante de medios .