1.
Think
Stats
-Probability
and
Statistics
for
Programmers-
プログラマのための統計⼊入⾨門
第1章 プログラマのための統計的な考え⽅方
Be
a
pythonista!!!
@millionsmile
4th
of
Oct,
2012,
集合知プログラミング勉強会LT
2.
2
Pythonの実⾏行行環境を準備する
Pythonのインストール(まだ2.x系をインストールがよさげ)
http://www.python.org/download/
環境設定いろいろ
http://www.pythonweb.jp/install/
シェルの⽤用意。IPythonオススメ
http://ipython.org/download.html
テキストエディタの⽤用意。Sublime
Text
2がちょーオススメ
http://www.sublimetext.com/2
※テキストエディタ戦争には巻き込まれたくはないので基本的にはお好みのエディタをご利⽤用ください。
※PEP8とか適宜プラグインやパッケージを設定する必要があります。
※PythonTidyとPython、IPython
Integrationあたりがオススメ
by
@kenchan0312_aki
3.
3
統計的なアプローチ
個⼈人的な経験に基づくデータのことを事例証拠(anecdotal
evidence)といい、往々にして、少なすぎる標本数(small
number
of
observations)、選択バイアス(selection
bias)、
確証バイアス(confirmation
bias)、不正確さ(inaccuracy)と
いった問題を持っている。
事例証拠の問題を解消するために「統計」という道具を使いこな
し、より正当でより正確な結論を出すことができる。統計には以
下のようなものが含まれる。
データ収集(data
collection)、記述統計学(descriptive
statistics)、探索的データ解析(exploratory
data
analysis)、
仮説検定(hypothesis
testing)、推定(estimation)
7.
7
サンプルデータをダウンロード
サイトにアクセス。 I
accept
these
terms をクリック
http://greenteapress.com/thinkstats/nsfg.html
以下のファイルをダウンロード
2002FemPreg.dat.gz
→回答者ファイル(⼥女女性回答者7643⼈人分。1⾏行行1⼈人のデータ)
2002FemResp.dat.gz
→回答者から報告のあった妊娠のデータが1⾏行行ごとに記録
ダウンロードしたファイルはローカルの任意のフォルダーにおい
てください。
8.
8
サンプルコードの実⾏行行
サンプルコードをダウンロード
http://greenteapress.com/thinkstats/survey.py
サンプルコードを前⾴頁のサンプルデータと同じディレクトリに保存
シェルで実⾏行行、もしくはSublime
Text
2でbuildすると
Number
of
respondents
7643
Number
of
pregnancies
13593
と出⼒力力される。