SlideShare une entreprise Scribd logo
1  sur  45
Python para la Ciencia de
Datos
por : Isabel Rodríguez
https://www.linkedin.com/profile/view?id=384254439&trk=
hp-identity-name
Python
Python en realidad su nombre a una serie de comedia de la BBC de los años setenta "de Monty
Python Flying Circus". El diseñador necesita un nombre que fuera corto, único, y un poco
misterioso.
What is Python
Python is a widely used general-purpose, high-level programming language.
Its design philosophy emphasizes code readability, and its syntax allows programmers to express concepts in fewer lines of code
Guido van Rossum is the creator of Python.
core philosophy of the language is summarized by
● Beautiful is better than ugly
● Explicit is better than implicit
● Simple is better than complex
● Complex is better than complicated
● Readability counts
https://www.python.org/
https://wiki.python.org/moin/BeginnersGuide/Programmers
https://wiki.python.org/moin/BeginnersGuide/NonProgrammers
Python uses whitespace indentation, rather than curly braces or keywords, to delimit blocks; this feature is also termed the off-side
rule.
Que es Python
Python su propósito general, es el lenguaje de la programación utilizado en alto nivel.
Su filosofía de diseño hace hincapié en la legibilidad del código, y su sintaxis permite a los programadores para expresar
conceptos en menos líneas de código
Guido van Rossum es el creador de Python.
filosofía de la base de la lengua se resume en
● Hermoso es mejor que feo
● Explícito es mejor que implícito
● Simple es mejor que complejo
● Complejo es mejor que complicado
● recuentos de legibilidad
https://www.python.org/
https://wiki.python.org/moin/BeginnersGuide/Programmers
https://wiki.python.org/moin/BeginnersGuide/NonProgrammers
Python usa sangría espacios en blanco, en lugar de llaves o palabras clave rizado, para delimitar bloques; esta característica
también se denomina la regla outside de juego.
Que es Python?
Que es Python?
Porque
Error?
Que es iPython
IPython es un shell de comandos para la computación interactiva en múltiples lenguajes de programación, desarrollado
originalmente para el lenguaje de programación Python, que ofrece la introspección mejorado, rich media, sintaxis adicional
cáscara, la implementación del tabulador, y su rica historia.
http://ipython.org/
Ipython Notebook
IPython Notebook es un entorno computacional interactiva basada en la web para la creación de cuadernos IPython. Un
cuaderno IPython es un documento JSON que contiene una lista ordenada de las células de entrada / salida que pueden
contener código, texto, matemáticas, solares y rich media.
Scipy
NumPy
NumPy
NumPy es el paquete fundamental para la computación científica con Python. Contiene entre otras cosas:
● un poderoso objeto de matriz N-dimensional
● sofisticadas funciones (radiodifusión)
● herramientas para la integración de C / C ++ y Fortran
● álgebra lineal útil, transformada de Fourier, y capacidades de números aleatorios
http://www.numpy.org/
Statsmodels
Statsmodels es un módulo de Python que permite a los usuarios explorar datos, estiman modelos estadísticos, y realizar pruebas
estadísticas. Una extensa lista de estadística descriptiva, pruebas estadísticas, funciones de trazado, y las estadísticas de resultados
están disponibles para diferentes tipos de datos y cada estimador. Los investigadores a través de campos pueden encontrar que
statsmodels cumple plenamente sus necesidades de computación estadística y análisis de datos en Python. Las características
incluyen:
● Modelos de regresión lineal
● Modelos lineales generalizados
● Modelos de elección discreta
● Modelos lineales robustas
● Muchos modelos y funciones para el análisis de series de tiempo
● Estimadores no paramétricos
● Una colección de conjuntos de datos para ver ejemplos
● Una amplia gama de pruebas estadísticas
● Herramientas de entrada-salida para la producción de tablas en varios formatos (texto, LaTeX, HTML) y para la lectura de
archivos de Stata en NumPy y pandas
Statsmodels
http://statsmodels.sourceforge.net/devel/examples/notebooks/generated/ols.html
Sci-kit learn
http://scikit-learn.org/stable/
Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.
Sci-kit learn
http://scikit-learn.org/stable/
Matplotlib
matplotlib es una biblioteca conspirar python 2D que produce figuras de calidad la publicación en una variedad de
formatos impresos y entornos interactivos a través de plataformas. matplotlib se puede utilizar en scripts python,
la pitón y ipython shell (ala MATLAB® * o Mathematica® †), servidores de aplicaciones web, y seis juegos de
herramientas de interfaz gráfica de usuario.
Seaborn
Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto nivel para la elaboración
de gráficos estadísticos atractivos. http://stanford.edu/~mwaskom/software/seaborn/
ggplot
http://ggplot.yhathq.com/
Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto
nivel para la elaboración de gráficos estadísticos atractivos.
http://stanford.edu/~mwaskom/software/seaborn/
Pandas
Pandas
pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools
for the Python programming language .
Python has long been great for data munging and preparation, but less so for data analysis and modeling. pandas helps fill this
gap, enabling you to carry out your entire data analysis workflow in Python without having to switch to a more domain specific
language like R.
pandas does not implement significant modeling functionality outside of linear and panel regression; for this, look to statsmodels
and scikit-learn.
http://pandas.pydata.org/
Interfaces to Python :IDLE
Interfaces to Python :Spyder
Interfaces to Python :Rodeo
Rodeo es un IDE centrado en datos para Python. Usted puede pensar en él como una interfaz de usuario alternativa a
la portátil para el IPython Kernel.
Que es iPython Notebook
Pandas
 Un objeto trama de datos rápido y eficiente para la manipulación de datos con la indexación integrado;
● Herramientas para la lectura y escritura de datos: CSV y archivos de texto,Microsoft Excel, bases de datos SQL,
etc.
● Alineación inteligente de datos y el manejo integrado de los datos faltantes
● Rebanar inteligente basado en etiquetas, la indexación de lujo, y subconjuntos de grandes conjuntos de datos;
● Remodelación Flexible y giro de los conjuntos de datos; Las columnas pueden ser insertados y borrados de las
estructuras de datos para el tamaño de la mutabilidad; La agregación o la transformación de datos con un grupo
poderoso motor de búsqueda que permite dividir a aplicar-se combinan
● Alto rendimiento fusión y unión de los conjuntos de datos con la indexación ejej erárquica
● Tiempo serie funcionalidad:
Altamente optimizado para un rendimiento, con rutas de código críticos escritos en C.
Python con pandas está en uso en una amplia variedad de ámbitos académicos y comerciales, incluyendo Finanzas,
Neurociencia, Economía, Estadística,Publicidad, Web Analytics, y más.
Data input
read_csv
diamonds=pd.read_csv("diamondsbig.csv")
#nota cabecera = 0 significa que tomamos la primera fila como encabezado (por defecto) más que podamos
especificar encabezado = Ninguno
Data Inputhttp://pandas.pydata.org/pandas-docs/stable/io.html
The pandas I/O API es un conjunto de las mejores funciones de lector nivel de acceso como pd.read_csv() que por lo general
devuelven un objetivo pandas .
● read_csv
● read_excel
● read_hdf
● read_sql
● read_json
● read_msgpack (experimental)
● read_html
● read_gbq (experimental)
● read_stata
● read_clipboard
● read_pickle
Las funciones escritor correspondientes son métodos de objeto que se accede como df.to_csv()
Data Input
http://www.sqlalchemy.org/
Data Input
http://docs.sqlalchemy.org/en/latest/dialects/index.html
Instalar paquetes adicionales en Py
pip instalar packagename
Data Input
http://crs4.github.io/pydoop/
Pydoop es un paquete que ofrece a
Python API for Hadoop.
http://crs4.github.io/pydoop/tutorial/hdfs_api.html
Data
Input
Data Inspección
objname=read_csv(‘name”)
objname.info()
#checking object import
objname.head()
#checking data
objname.tail()
#checking data
Data inspección
objname.columns
len(objname)
random sampling
Describe
Describe
Grupos por
Grupos por
Cross Tab
Cross Tab
Corelación
Corelación
Data visualización
Data visualización
Modelado

Contenu connexe

Tendances

Memoria dinamica
Memoria dinamicaMemoria dinamica
Memoria dinamica
gusolis93
 
Estructura basica de_un_programa_en_c_
Estructura basica de_un_programa_en_c_Estructura basica de_un_programa_en_c_
Estructura basica de_un_programa_en_c_
Diego Arturo
 

Tendances (19)

Lifo
Lifo Lifo
Lifo
 
Adt
AdtAdt
Adt
 
Python para principiantes
Python para principiantesPython para principiantes
Python para principiantes
 
Recuperacin 333333
Recuperacin 333333Recuperacin 333333
Recuperacin 333333
 
Programacion en R
Programacion en RProgramacion en R
Programacion en R
 
Una visión de las técnicas y métodos de análisis en entornos Big Data utiliza...
Una visión de las técnicas y métodos de análisis en entornos Big Data utiliza...Una visión de las técnicas y métodos de análisis en entornos Big Data utiliza...
Una visión de las técnicas y métodos de análisis en entornos Big Data utiliza...
 
Intro MatLab
Intro MatLabIntro MatLab
Intro MatLab
 
Introduccion al Programa R
Introduccion al Programa RIntroduccion al Programa R
Introduccion al Programa R
 
Saiymari colas, filas y nos e que otra cosa
Saiymari colas, filas y nos e que otra cosaSaiymari colas, filas y nos e que otra cosa
Saiymari colas, filas y nos e que otra cosa
 
Memoria dinamica
Memoria dinamicaMemoria dinamica
Memoria dinamica
 
Python Pilas y Colas
Python Pilas y ColasPython Pilas y Colas
Python Pilas y Colas
 
Tema 4 - Tipos datos avanzados (I)
Tema 4 - Tipos datos avanzados (I)Tema 4 - Tipos datos avanzados (I)
Tema 4 - Tipos datos avanzados (I)
 
Estructura basica de_un_programa_en_c_
Estructura basica de_un_programa_en_c_Estructura basica de_un_programa_en_c_
Estructura basica de_un_programa_en_c_
 
PILAS
PILASPILAS
PILAS
 
Estructura de datos. listas, pilas y colas
Estructura de datos. listas, pilas y colasEstructura de datos. listas, pilas y colas
Estructura de datos. listas, pilas y colas
 
Info proyecto4
Info proyecto4Info proyecto4
Info proyecto4
 
Pilas
PilasPilas
Pilas
 
Octave
OctaveOctave
Octave
 
Tema 4 - Tipos datos avanzados (III)
Tema 4 - Tipos datos avanzados (III)Tema 4 - Tipos datos avanzados (III)
Tema 4 - Tipos datos avanzados (III)
 

En vedette

Python at yhat (august 2013)
Python at yhat (august 2013)Python at yhat (august 2013)
Python at yhat (august 2013)
Austin Ogilvie
 

En vedette (20)

Python at yhat (august 2013)
Python at yhat (august 2013)Python at yhat (august 2013)
Python at yhat (august 2013)
 
Ggplot in python
Ggplot in pythonGgplot in python
Ggplot in python
 
Table of Useful R commands.
Table of Useful R commands.Table of Useful R commands.
Table of Useful R commands.
 
Analyze this
Analyze thisAnalyze this
Analyze this
 
Building a Beer Recommender with Yhat (PAPIs.io - November 2014)
Building a Beer Recommender with Yhat (PAPIs.io - November 2014)Building a Beer Recommender with Yhat (PAPIs.io - November 2014)
Building a Beer Recommender with Yhat (PAPIs.io - November 2014)
 
Hadley verse
Hadley verseHadley verse
Hadley verse
 
Using R for Social Media and Sports Analytics
Using R for Social Media and Sports AnalyticsUsing R for Social Media and Sports Analytics
Using R for Social Media and Sports Analytics
 
Analyzing mlb data with ggplot
Analyzing mlb data with ggplotAnalyzing mlb data with ggplot
Analyzing mlb data with ggplot
 
Rcpp
RcppRcpp
Rcpp
 
Kush stats alpha
Kush stats alpha Kush stats alpha
Kush stats alpha
 
Logical Fallacies
Logical FallaciesLogical Fallacies
Logical Fallacies
 
Yhat - Applied Data Science - Feb 2016
Yhat - Applied Data Science - Feb 2016Yhat - Applied Data Science - Feb 2016
Yhat - Applied Data Science - Feb 2016
 
Applied Data Science: Building a Beer Recommender | Data Science MD - Oct 2014
Applied Data Science: Building a Beer Recommender | Data Science MD - Oct 2014Applied Data Science: Building a Beer Recommender | Data Science MD - Oct 2014
Applied Data Science: Building a Beer Recommender | Data Science MD - Oct 2014
 
Training in Analytics and Data Science
Training in Analytics and Data ScienceTraining in Analytics and Data Science
Training in Analytics and Data Science
 
Software Testing for Data Scientists
Software Testing for Data ScientistsSoftware Testing for Data Scientists
Software Testing for Data Scientists
 
Pandas Sindrome
Pandas SindromePandas Sindrome
Pandas Sindrome
 
ggplot for python
ggplot for pythonggplot for python
ggplot for python
 
Electron - Build desktop apps using javascript
Electron - Build desktop apps using javascriptElectron - Build desktop apps using javascript
Electron - Build desktop apps using javascript
 
Introduccion a Data Science
Introduccion a Data ScienceIntroduccion a Data Science
Introduccion a Data Science
 
Training in Analytics, R and Social Media Analytics
Training in Analytics, R and Social Media AnalyticsTraining in Analytics, R and Social Media Analytics
Training in Analytics, R and Social Media Analytics
 

Similaire à Summer school python in spanish

Similaire à Summer school python in spanish (20)

procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...procesamiento de datos con python para resolucion de ciencia de datos, aplica...
procesamiento de datos con python para resolucion de ciencia de datos, aplica...
 
Python - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de DatosPython - Lenguaje de programación para Ciencia de Datos
Python - Lenguaje de programación para Ciencia de Datos
 
Yudy Centeno M
Yudy Centeno MYudy Centeno M
Yudy Centeno M
 
Sesion8_Python.pptx
Sesion8_Python.pptxSesion8_Python.pptx
Sesion8_Python.pptx
 
Clase1_Python-CTIC
Clase1_Python-CTICClase1_Python-CTIC
Clase1_Python-CTIC
 
Tipo de Aplicaciones
Tipo de AplicacionesTipo de Aplicaciones
Tipo de Aplicaciones
 
Python-01.pdf
Python-01.pdfPython-01.pdf
Python-01.pdf
 
Python y la POO, en una clase, UNNe-Corrientes
Python y la POO, en una clase, UNNe-CorrientesPython y la POO, en una clase, UNNe-Corrientes
Python y la POO, en una clase, UNNe-Corrientes
 
Introducción a python
Introducción a pythonIntroducción a python
Introducción a python
 
Tu Primer Página Web con Python
Tu Primer Página Web con PythonTu Primer Página Web con Python
Tu Primer Página Web con Python
 
Introduccion a-python
Introduccion a-pythonIntroduccion a-python
Introduccion a-python
 
El tutorial PYTHON EMERSON EDUARDO RODRIGUES
El tutorial PYTHON  EMERSON EDUARDO RODRIGUESEl tutorial PYTHON  EMERSON EDUARDO RODRIGUES
El tutorial PYTHON EMERSON EDUARDO RODRIGUES
 
Python_Module_01_Courtesy.pdf
Python_Module_01_Courtesy.pdfPython_Module_01_Courtesy.pdf
Python_Module_01_Courtesy.pdf
 
Herramientas de visualización de datos
Herramientas de visualización de datosHerramientas de visualización de datos
Herramientas de visualización de datos
 
Tutorial python2
Tutorial python2Tutorial python2
Tutorial python2
 
Manual python2
Manual python2Manual python2
Manual python2
 
Tutorial python2
Tutorial python2Tutorial python2
Tutorial python2
 
Tutorial python2
Tutorial python2Tutorial python2
Tutorial python2
 
Tutorial python2
Tutorial python2Tutorial python2
Tutorial python2
 
Tutorial python2
Tutorial python2Tutorial python2
Tutorial python2
 

Plus de Ajay Ohri

Plus de Ajay Ohri (19)

Introduction to R ajay Ohri
Introduction to R ajay OhriIntroduction to R ajay Ohri
Introduction to R ajay Ohri
 
Introduction to R
Introduction to RIntroduction to R
Introduction to R
 
Social Media and Fake News in the 2016 Election
Social Media and Fake News in the 2016 ElectionSocial Media and Fake News in the 2016 Election
Social Media and Fake News in the 2016 Election
 
Pyspark
PysparkPyspark
Pyspark
 
Download Python for R Users pdf for free
Download Python for R Users pdf for freeDownload Python for R Users pdf for free
Download Python for R Users pdf for free
 
Install spark on_windows10
Install spark on_windows10Install spark on_windows10
Install spark on_windows10
 
Ajay ohri Resume
Ajay ohri ResumeAjay ohri Resume
Ajay ohri Resume
 
Statistics for data scientists
Statistics for  data scientistsStatistics for  data scientists
Statistics for data scientists
 
National seminar on emergence of internet of things (io t) trends and challe...
National seminar on emergence of internet of things (io t)  trends and challe...National seminar on emergence of internet of things (io t)  trends and challe...
National seminar on emergence of internet of things (io t) trends and challe...
 
Tools and techniques for data science
Tools and techniques for data scienceTools and techniques for data science
Tools and techniques for data science
 
How Big Data ,Cloud Computing ,Data Science can help business
How Big Data ,Cloud Computing ,Data Science can help businessHow Big Data ,Cloud Computing ,Data Science can help business
How Big Data ,Cloud Computing ,Data Science can help business
 
Tradecraft
Tradecraft   Tradecraft
Tradecraft
 
Craps
CrapsCraps
Craps
 
A Data Science Tutorial in Python
A Data Science Tutorial in PythonA Data Science Tutorial in Python
A Data Science Tutorial in Python
 
How does cryptography work? by Jeroen Ooms
How does cryptography work?  by Jeroen OomsHow does cryptography work?  by Jeroen Ooms
How does cryptography work? by Jeroen Ooms
 
Analytics what to look for sustaining your growing business-
Analytics   what to look for sustaining your growing business-Analytics   what to look for sustaining your growing business-
Analytics what to look for sustaining your growing business-
 
Introduction to sas
Introduction to sasIntroduction to sas
Introduction to sas
 
Summer School with DecisionStats brochure
Summer School with DecisionStats brochureSummer School with DecisionStats brochure
Summer School with DecisionStats brochure
 
Social media and social media analytics by decisionstats.org
Social media and social media analytics by decisionstats.orgSocial media and social media analytics by decisionstats.org
Social media and social media analytics by decisionstats.org
 

Dernier

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
CelesteRolon2
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdf
arteagaara
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 

Dernier (20)

Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdf
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 

Summer school python in spanish

  • 1. Python para la Ciencia de Datos por : Isabel Rodríguez https://www.linkedin.com/profile/view?id=384254439&trk= hp-identity-name
  • 2. Python Python en realidad su nombre a una serie de comedia de la BBC de los años setenta "de Monty Python Flying Circus". El diseñador necesita un nombre que fuera corto, único, y un poco misterioso.
  • 3. What is Python Python is a widely used general-purpose, high-level programming language. Its design philosophy emphasizes code readability, and its syntax allows programmers to express concepts in fewer lines of code Guido van Rossum is the creator of Python. core philosophy of the language is summarized by ● Beautiful is better than ugly ● Explicit is better than implicit ● Simple is better than complex ● Complex is better than complicated ● Readability counts https://www.python.org/ https://wiki.python.org/moin/BeginnersGuide/Programmers https://wiki.python.org/moin/BeginnersGuide/NonProgrammers Python uses whitespace indentation, rather than curly braces or keywords, to delimit blocks; this feature is also termed the off-side rule.
  • 4. Que es Python Python su propósito general, es el lenguaje de la programación utilizado en alto nivel. Su filosofía de diseño hace hincapié en la legibilidad del código, y su sintaxis permite a los programadores para expresar conceptos en menos líneas de código Guido van Rossum es el creador de Python. filosofía de la base de la lengua se resume en ● Hermoso es mejor que feo ● Explícito es mejor que implícito ● Simple es mejor que complejo ● Complejo es mejor que complicado ● recuentos de legibilidad https://www.python.org/ https://wiki.python.org/moin/BeginnersGuide/Programmers https://wiki.python.org/moin/BeginnersGuide/NonProgrammers Python usa sangría espacios en blanco, en lugar de llaves o palabras clave rizado, para delimitar bloques; esta característica también se denomina la regla outside de juego.
  • 7. Que es iPython IPython es un shell de comandos para la computación interactiva en múltiples lenguajes de programación, desarrollado originalmente para el lenguaje de programación Python, que ofrece la introspección mejorado, rich media, sintaxis adicional cáscara, la implementación del tabulador, y su rica historia. http://ipython.org/ Ipython Notebook IPython Notebook es un entorno computacional interactiva basada en la web para la creación de cuadernos IPython. Un cuaderno IPython es un documento JSON que contiene una lista ordenada de las células de entrada / salida que pueden contener código, texto, matemáticas, solares y rich media.
  • 9. NumPy NumPy NumPy es el paquete fundamental para la computación científica con Python. Contiene entre otras cosas: ● un poderoso objeto de matriz N-dimensional ● sofisticadas funciones (radiodifusión) ● herramientas para la integración de C / C ++ y Fortran ● álgebra lineal útil, transformada de Fourier, y capacidades de números aleatorios http://www.numpy.org/
  • 10. Statsmodels Statsmodels es un módulo de Python que permite a los usuarios explorar datos, estiman modelos estadísticos, y realizar pruebas estadísticas. Una extensa lista de estadística descriptiva, pruebas estadísticas, funciones de trazado, y las estadísticas de resultados están disponibles para diferentes tipos de datos y cada estimador. Los investigadores a través de campos pueden encontrar que statsmodels cumple plenamente sus necesidades de computación estadística y análisis de datos en Python. Las características incluyen: ● Modelos de regresión lineal ● Modelos lineales generalizados ● Modelos de elección discreta ● Modelos lineales robustas ● Muchos modelos y funciones para el análisis de series de tiempo ● Estimadores no paramétricos ● Una colección de conjuntos de datos para ver ejemplos ● Una amplia gama de pruebas estadísticas ● Herramientas de entrada-salida para la producción de tablas en varios formatos (texto, LaTeX, HTML) y para la lectura de archivos de Stata en NumPy y pandas
  • 12. Sci-kit learn http://scikit-learn.org/stable/ Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.
  • 14. Matplotlib matplotlib es una biblioteca conspirar python 2D que produce figuras de calidad la publicación en una variedad de formatos impresos y entornos interactivos a través de plataformas. matplotlib se puede utilizar en scripts python, la pitón y ipython shell (ala MATLAB® * o Mathematica® †), servidores de aplicaciones web, y seis juegos de herramientas de interfaz gráfica de usuario.
  • 15. Seaborn Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto nivel para la elaboración de gráficos estadísticos atractivos. http://stanford.edu/~mwaskom/software/seaborn/
  • 16. ggplot http://ggplot.yhathq.com/ Seaborn es una librería de visualización basado en Python matplotlib. Proporciona una interfaz de alto nivel para la elaboración de gráficos estadísticos atractivos. http://stanford.edu/~mwaskom/software/seaborn/
  • 18. Pandas pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language . Python has long been great for data munging and preparation, but less so for data analysis and modeling. pandas helps fill this gap, enabling you to carry out your entire data analysis workflow in Python without having to switch to a more domain specific language like R. pandas does not implement significant modeling functionality outside of linear and panel regression; for this, look to statsmodels and scikit-learn. http://pandas.pydata.org/
  • 21. Interfaces to Python :Rodeo Rodeo es un IDE centrado en datos para Python. Usted puede pensar en él como una interfaz de usuario alternativa a la portátil para el IPython Kernel.
  • 22. Que es iPython Notebook
  • 23.
  • 24.
  • 25. Pandas  Un objeto trama de datos rápido y eficiente para la manipulación de datos con la indexación integrado; ● Herramientas para la lectura y escritura de datos: CSV y archivos de texto,Microsoft Excel, bases de datos SQL, etc. ● Alineación inteligente de datos y el manejo integrado de los datos faltantes ● Rebanar inteligente basado en etiquetas, la indexación de lujo, y subconjuntos de grandes conjuntos de datos; ● Remodelación Flexible y giro de los conjuntos de datos; Las columnas pueden ser insertados y borrados de las estructuras de datos para el tamaño de la mutabilidad; La agregación o la transformación de datos con un grupo poderoso motor de búsqueda que permite dividir a aplicar-se combinan ● Alto rendimiento fusión y unión de los conjuntos de datos con la indexación ejej erárquica ● Tiempo serie funcionalidad: Altamente optimizado para un rendimiento, con rutas de código críticos escritos en C. Python con pandas está en uso en una amplia variedad de ámbitos académicos y comerciales, incluyendo Finanzas, Neurociencia, Economía, Estadística,Publicidad, Web Analytics, y más.
  • 26. Data input read_csv diamonds=pd.read_csv("diamondsbig.csv") #nota cabecera = 0 significa que tomamos la primera fila como encabezado (por defecto) más que podamos especificar encabezado = Ninguno
  • 27. Data Inputhttp://pandas.pydata.org/pandas-docs/stable/io.html The pandas I/O API es un conjunto de las mejores funciones de lector nivel de acceso como pd.read_csv() que por lo general devuelven un objetivo pandas . ● read_csv ● read_excel ● read_hdf ● read_sql ● read_json ● read_msgpack (experimental) ● read_html ● read_gbq (experimental) ● read_stata ● read_clipboard ● read_pickle Las funciones escritor correspondientes son métodos de objeto que se accede como df.to_csv()
  • 30. Instalar paquetes adicionales en Py pip instalar packagename
  • 31. Data Input http://crs4.github.io/pydoop/ Pydoop es un paquete que ofrece a Python API for Hadoop. http://crs4.github.io/pydoop/tutorial/hdfs_api.html
  • 33. Data Inspección objname=read_csv(‘name”) objname.info() #checking object import objname.head() #checking data objname.tail() #checking data