More Related Content
Similar to Pyladies Tokyo meet up #6 (17)
Pyladies Tokyo meet up #6
- 9. PyData = Python + Data
私の用途:
1. データ処理
– ファイルの分割、欠測値補完、値抽出、etc.
2. 数値計算
– 統計解析、分析、 etc.
- 10. PyDataの基本ツール
Python 2.x系/3.x系 お好きな方を。
1. NumPy 多次元配列が扱える。
2. Pandas DataFrameが便利。データベースっぽい使い方ができる。
3. matplotlib データの可視化。グラフ描きツール。
4. IPython ・Ipython notebook・Jupiter
対話型シェルと ブラウザでの操作ツール
5. Sympy 記号計算。方程式を解いたりできる。
6. Scikit-Learn 機械学習
7. SciPy Numpyより高度な科学計算(特殊関数、積分、統計、etc.)
- 16. パッケージとライブラリ
• パッケージ
– サードパーティ製パッケージ
• Numpy, Scipy, etc.
– Pythonとは別に入手が必要
• ライブラリ
– Python標準ライブラリ
– Pythonにもとから同梱されているライブラリ
• 使うときはいずれもimport宣言して利用
– 組み込み関数・定数・型を除く
参考: Pythonエンジニア養成読本
- 17. パッケージの入手(インストール)
Mac・Linux
pip install numpy
pip install scipy
pip install pandas
pip install scikit-learn
pip install matplotlib
pip install ipython
# ipython notebookに必要な異存ライブラリ
pip install pyzmq
pip install jinja2
pip install tornado
Editor's Notes
- こうしたらいいいですよをいう。
- ((モデリングと統計解析の話がごっちゃになってる。ここでは「モデリング」について話すのか、「統計」について話すのか、はっきりさせる必要がある))
- 例 ゾウの皮膚のきめの荒さ-ゾウの全体像
- 企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム