SlideShare a Scribd company logo
1 of 18
Download to read offline
「生物統計学」	
  
Rを用いた検定の演習	
	
  
三浦佳二 担当	
  
2015年10月7日	
  
レポート問題について	
•  実験データに真に差があるのか、実験のばら
つきによる見せかけの差なのかを検定する。	
  
•  例題を参考にして、類題のp値と考察を導け。	
  
このアイコンをクリック
して立ち上げましょう。
(石村園子「やさしく学べる統計学」より)	
#	
  BMI値(女性8名,入会したて)	
before	
  =	
  c(22.5,	
  22.3,	
  23.2,	
  25.8,	
  24.1,	
  25.1,	
  22.5,	
  25.7)	
	
#	
  BMI値(女性9名,入会6ヶ月後)	
a<er	
  =	
  c(21.5,	
  21.0,	
  21.9,	
  24.1,	
  23.3,	
  23.8,	
  21.4,	
  24.2,	
  22.3)	
  
	
  
#	
  描画	
  
BMI	
  =	
  c(before,	
  a<er)	
  
group	
  =	
  c(rep(0,8),	
  rep(1,9))	
  
plot(group,	
  BMI)	
  
	
  
#	
  t検定(母平均に差無しを仮定)	
  
t.test(before,	
  a<er)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.075(>0.05)なので有意な差は見られない	
例題1:フィットネスクラブのダイエットコー
スは女性に対して効果がありそうか?	
2122232425
BMI
before after
(Dyson	
  et	
  al.,	
  2007)	
#	
  体重変化(kg,	
  低炭水化物食,12名)	
low	
  =	
  c(-­‐1.35,	
  -­‐2.44,	
  -­‐3.37,	
  -­‐3.71,	
  -­‐4.38,	
  -­‐6.74,	
  -­‐7.92,	
  -­‐8.08,	
  
-­‐8.84,	
  -­‐9.35,	
  -­‐13.14,	
  -­‐13.89)	
	
#	
  体重変化(kg,	
  通常食,10名)	
normal	
  =	
  c(2.36,	
  0,	
  -­‐0.34,	
  -­‐1.26,	
  -­‐2.02,	
  -­‐2.69,	
  -­‐2.86,	
  -­‐3.37,	
  
-­‐5.22,	
  -­‐5.39)	
  
	
  
#	
  描画	
  
weight	
  =	
  c(low,	
  normal)	
  
group	
  =	
  c(rep(0,12),	
  rep(1,10))	
  
plot(group,	
  weight)	
  
	
  
#	
  t検定(母平均に差無しを仮定)	
  
t.test(low,	
  normal)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.002549	
  (<0.05)なので有意な差が見られる	
類題1:低炭水化物食はダイエット(体重
変化)に効果があるか?	
-10-50
weight
low normal
例題2:オート麦外皮のシリアルは、コレ
ステロール値を低下させるか?	
#	
  LDLコレステロール値(高LDL男性14名,コーンフレーク)	
LDL_corn	
  =	
  c(4.61,	
  6.42,	
  5.40,	
  4.54,	
  3.98,	
  3.82,	
  5.01,	
  4.34,	
  
3.80,	
  4.56,	
  5.35,	
  3.89,	
  2.25,	
  4.24)	
  
#	
  LDLコレステロール値(同,オーツブランシリアル)	
  
LDL_oat	
  =	
  c(3.84,	
  5.57,	
  5.85,	
  4.80,	
  3.68,	
  2.96,	
  4.41,	
  3.72,	
  
3.49,	
  3.84,	
  5.26,	
  3.73,	
  1.84,	
  4.14)	
  
	
  
#	
  対応する点を線で結んで描画	
  
group	
  =	
  rbind(rep(0,14),	
  rep(1,14))	
  
LDL	
  =	
  rbind(LDL_corn,	
  LDL_oat)	
  
matplot(group,	
  LDL,	
  type="b",xaxt="n",xlab="",	
  xlim=c(-­‐0.3,	
  
1.3),	
  pch="o",	
  lty=1,	
  col=1);	
  axis(1,0:1,c("corn","oat"))	
  
	
  
#対応ありt検定(コーンとオーツで差無しを仮定)	
  
t.test(LDL_corn,	
  LDL_oat,	
  paired=T)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.005278(<0.05)なので有意な差が見られる	
(Pagano「生物統計学入門」より)	
o
o
23456
LDL
o
oo
o
o
o
o
oo
o
o
oo
oo
o
o
o
o o
o o
o
o
o o
corn oat
類題2:6人のパセドウ病患者への自律
神経遮断剤は脈拍数を変化させるか?	
#	
  脈拍数(6人のパセドウ病患者,投与前)	
pulse_before	
  =	
  c(98,	
  88,	
  100,	
  96,	
  107,	
  114)	
  
#	
  脈拍数(同,投与後)	
  
pulse_a<er	
  =	
  c(86,	
  73,	
  95,	
  92,	
  99,	
  116)	
  
	
  
#	
  対応する点を線で結んで描画	
  
group	
  =	
  rbind(rep(0,6),	
  rep(1,6))	
  
pulse	
  =	
  rbind(pulse_before,	
  pulse_a<er)	
  
matplot(group,	
  pulse,	
  type="b",xaxt="n",	
  xlab="",	
  xlim=c(-­‐.
3,	
  1.3),	
  pch="o",	
  lty=1,	
  col=1);	
  axis(1,0:1,c("before","a<er"))	
  
	
  
#	
  対応ありt検定(投与前後で差無しを仮定)	
  
t.test(pulse_before,	
  pulse_a<er,	
  paired=T)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.03683	
  (<0.05)	
  なので有意な差がある。	
o
o
8090100110
pulse
o
o
o
oo
o
o
o
o
o
before after
(市原「バイオサイエンスの統計学」より)
例題3:医療機関3施設にて計測された
ベースラインは等しいか?	
(Pagano「生物統計学入門」より)	
#	
  冠状動脈疾患者の肺活量	
  
x	
  =	
  c(3.23,	
  3.47,	
  1.86,	
  2.47,	
  3.01,1.69,2.10,2.81,3.28,	
  3.36,	
  
2.61,	
  2.91,	
  1.98,	
  2.57,	
  2.08,	
  2.47,	
  2.47,	
  2.74,	
  2.88,2.63,	
  2.53,	
  
3.22,	
  2.88,	
  1.71,	
  2.89,	
  3.77,	
  3.29,	
  3.39,3.86,	
  2.64,	
  2.71,	
  2.71,	
  
3.41,	
  2.87,	
  2.61,	
  3.39,	
  3.17,	
  2.79,	
  3.22,	
  2.25,	
  2.98,	
  2.47,	
  2.77,	
  
2.95,	
  3.56,	
  2.88,	
  2.63,	
  3.38,	
  3.07,	
  2.81,	
  3.17,	
  2.23,	
  2.19,	
  4.06,	
  
1.98,	
  2.81,	
  2.85,	
  2.43,	
  3.20,	
  3.53)	
  
#	
  計測機関:	
  John	
  Hopkins	
  /	
  Rancho	
  Los	
  Amigos	
  /	
  St.	
  Louis	
  
group	
  =	
  c(1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  1,	
  
2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  2,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  
3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3)	
  
#	
  各機関毎の箱ひげ図	
  
boxplot(x~group,	
  xaxt="n")	
  
axis(1,1:3,	
  c("John	
  Hopkins",	
  "Rancho",	
  "St.	
  Louis"))	
  
	
  
#	
  F検定(一元配置分散分析,病院の差異は無しと仮定)	
  
oneway.test(x	
  ~	
  group,	
  var.equal=T)	
  
#	
  結論(p値と考察)	
  
#	
  p=0.052(>0.05)なので、有意な差は無い。	
2.02.53.03.54.0
John Hopkins Rancho St. Louis
類題3:在胎週数によって新生児期黄疸
の強さに差があると考えてよいか?	
#	
  黄疸指数	
  
x	
  =	
  c(13,	
  11,	
  6,	
  11,	
  10,	
  7,	
  7,	
  5,	
  8,	
  7,	
  5,	
  5,	
  4,	
  3,	
  3)	
  
	
  
#	
  在胎週数(3段階):	
  〜36	
  /	
  〜38	
  /	
  〜40	
  
group	
  =	
  c(1,	
  1,	
  1,	
  2,	
  2,	
  2,	
  2,	
  2,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3,	
  3)	
  
	
  
#	
  各在胎週数毎の箱ひげ図	
  
boxplot(x~group,	
  xaxt="n")	
  
axis(1,1:3,	
  c("<36",	
  "<38",	
  "<40"))	
  
	
  
#	
  F検定(一元配置分散分析,在胎週数での差異無と仮定)	
  
oneway.test(x	
  ~	
  group,	
  var.equal=T)$p.value	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p値=0.0263361なので有意な差があると言える。	
(市原「バイオサイエンスの統計学」より)	
4681012
<36 <38 <40
例題4:白血病の治療法AとBに違いはあ
るか?	
(市原「バイオサイエンスの統計学」より)	
#	
  χ2検定(独立を仮定)	
  
count	
  =	
  matrix(c(48,32,24,36),	
  ncol=2)	
  
chisq.test(count)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.02984	
  (<0.05)なので治療法に有意な差がある。
類題4:(重症外傷患者の)敗血症発症
と遺伝型に関連はあるか?	
(Ziegler他「ゲノム疫学の発想と実用化」より)	
#	
  χ2検定(独立を仮定)	
  
count	
  =	
  matrix(c(33,9,38,74),	
  ncol=2)	
  
chisq.test(count)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=1.859e-­‐06	
  (<0.05)	
  なので有意な関連がある。	
TNF-­‐308A	
  >	
  G(rs1800629)変異型
例題5:我々の宇宙は膨張しているか?
=銀河は距離に比例して遠ざかるか?	
(Everih「Rによる統計解析ハンドブック」より)	
#	
  銀河の距離	
  
distance	
  =	
  c(62,	
  283,	
  499,	
  555,	
  676,	
  	
  99,	
  347,	
  363,	
  112,	
  426,	
  
309,	
  325,	
  205,	
  470,	
  547,	
  459,	
  501,	
  488,	
  461,	
  679,	
  382,	
  139,	
  	
  
97,	
  455)	
  
	
  
#	
  銀河の速度	
velocity	
  =	
  c(0.42,	
  2.10,	
  5.67,	
  5.04,	
  4.65,	
  0.88,	
  2.26,	
  2.79,	
  
0.25,	
  2.44,	
  2.03,	
  2.43,	
  1.92,	
  4.53,	
  1.96,	
  4.50,	
  4.37,	
  4.56,	
  4.50,	
  
4.43,	
  3.49,	
  1.00,	
  0.73,	
  3.16)	
  
	
  
#	
  散布図の描画	
  
plot(distance,	
  velocity,	
  xlim=c(0,679),	
  ylim=c(0,5.8))	
  
	
  
#	
  F検定(回帰分析,傾き0を仮定)	
  
res	
  =	
  lm(velocity~distance-­‐1);	
  	
  abline(res);	
  	
  summary(res)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=1.02e-­‐15	
  (<<0.05)なので傾き128は有意に0から異なる	
0 200 400 600
0123456
distance
velocity
類題5:地下炭鉱労働者の死亡率は減
少しているか?	
#	
  死亡率(1000人当たり)	
  
death_rate	
  =	
  c(2.419,	
  1.732,	
  1.361,	
  1.108,	
  0.996,	
  0.952,	
  
0.904,	
  0.792,	
  0.701,	
  0.890,	
  0.799,	
  1.084)	
  
	
  
#	
  年度	
year	
  =	
  1970:1981	
  
	
  
#	
  散布図の描画	
  
plot(year,	
  death_rate)	
  
	
  
#	
  F検定(回帰分析,傾き0を仮定)	
  
res	
  =	
  lm(death_rate~year);	
  	
  abline(res);	
  	
  summary(res)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=0.00518	
  (<0.05)	
  なので傾きは有意に0から異なる。	
(Pagano「生物統計学入門」より)	
1970 1972 1974 1976 1978 1980
1.01.52.0
year
death_rate
例題6:薬品を与えるとカブトムシの死亡
率は上がるか?	
#	
  薬品の量	
  
dose	
  =	
  c(1.69,	
  1.72,	
  1.76,	
  1.78,	
  1.81,	
  1.84,	
  1.86,	
  1.88)	
  
#	
  カブトムシの死亡数	
  
y	
  =	
  c(6,	
  13,	
  18,	
  28,	
  52,	
  53,	
  61,	
  60)	
  
#	
  カブトムシの総数	
  
n	
  =	
  c(59,	
  60,	
  62,	
  56,	
  63,	
  59,	
  62,	
  60)	
  
	
  
#	
  死亡率の描画	
  
death_rate	
  =	
  y/n;	
  plot(dose,	
  death_rate)	
  
	
  
#	
  F検定(ロジスティック回帰分析,「傾き」0を仮定)	
  
res	
  =	
  glm(cbind(y,n-­‐y)	
  ~	
  dose,	
  binomial)	
  
lines(dose,	
  fihed(res));	
  	
  	
  summary(res)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=2e-­‐16	
  (<<0.05)なので「傾き」は0から有意に異なる	
(Dobsonら「An	
  Introducjon	
  to	
  Generalized	
  Linear	
  Models,	
  3rd」より)	
1.70 1.75 1.80 1.85
0.20.40.60.81.0
dose
death_rate
類題6:エバーメクチンを経口投与すると
羊の寄生虫の数は減少するか?	
#	
  抗生物質Avermecjnの量	
  (mg/kg)	
  
dose	
  =	
  c(0,	
  0.025,	
  0.05,	
  0.10)	
  
#	
  T.	
  colubriformis,	
  C.	
  oncophora,	
  C.	
  oncophoraの総数	
  
n	
  	
  =	
  c(1897,	
  1366,	
  76,	
  38)	
  
n2	
  =	
  c(6195,	
  6009,	
  3283,	
  1549);	
  	
  	
  n3=	
  c(6117,	
  0,	
  0,	
  0)	
  
	
  
#	
  死亡率の描画	
  
plot(dose,	
  n/max(n));	
  points(dose,	
  n2/max(n2),	
  col=2);	
  
	
  
#	
  F検定(ロジスティック回帰分析,「傾き」0を仮定)	
  
res	
  =	
  glm(cbind(n,	
  max(n)-­‐n)	
  ~	
  dose,	
  binomial)	
  
lines(dose,	
  fihed(res));	
  summary(res)	
  
res2	
  =	
  glm(cbind(n2,	
  max(n2)-­‐n2)	
  ~	
  dose,	
  binomial)	
  
lines(dose,	
  fihed(res2),	
  col=2);	
  summary(res2)	
  
	
  
#	
  結論(p値と考察)	
  
#	
  p=2e-­‐16	
  (<<0.05)なので「傾き」は0から有意に異なる	
(Egerton	
  et	
  al.,	
  Anjmicrobial	
  Agents	
  and	
  Chemotherapy,	
  1979)	
0.00 0.02 0.04 0.06 0.08 0.10
0.00.20.40.60.81.0
dose
n/max(n)
ノーベル賞のkey	
  publicajonのデータをプロット
最近の大村先生の論文から	
(Mayadera	
  et	
  al.,	
  PNAS,	
  2003)	
(Hirose	
  et	
  al.,	
  J.	
  Anjbiojcs,	
  2009)	
(Tanaka	
  et	
  al.,	
  PNAS,	
  2009)	
(Hayashi	
  et	
  al.,	
  PNAS,	
  2002)
毎日新聞記事からの教訓	
•  スキー練習でもひとのまねをしていてはダメ	
  
•  信念「オリジナリティーを追求するのが科学」	
  
•  1973年に帰国して研究室を開いた際「動物薬
の開発を目指す」とスタッフに宣言した。	
  
•  抗生物質の研究で傍流だった「マクロライド
系」系統の追跡に専念した。	
  
•  「企業の下請けにはならない。研究室の根幹
は自分たちで決めていた。」
読売新聞の分析	
•  土から奇跡の菌	
  
•  年間6000種 分析の結果	
  
•  採取袋持ち歩き 掘り起こした特効薬

More Related Content

What's hot

Anova君を使った分散分析
Anova君を使った分散分析Anova君を使った分散分析
Anova君を使った分散分析
Takashi Yamane
 
Rでピボットテーブル
RでピボットテーブルRでピボットテーブル
Rでピボットテーブル
Yohei Sato
 
傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling
Yohei Sato
 

What's hot (20)

実験計画法入門 Part 2
実験計画法入門 Part 2実験計画法入門 Part 2
実験計画法入門 Part 2
 
Rで架空データの発生
Rで架空データの発生Rで架空データの発生
Rで架空データの発生
 
Anova君を使った分散分析
Anova君を使った分散分析Anova君を使った分散分析
Anova君を使った分散分析
 
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
 
あなたの心にBridgeSampling
あなたの心にBridgeSamplingあなたの心にBridgeSampling
あなたの心にBridgeSampling
 
これからの仮説検証・モデル評価
これからの仮説検証・モデル評価これからの仮説検証・モデル評価
これからの仮説検証・モデル評価
 
Rでピボットテーブル
RでピボットテーブルRでピボットテーブル
Rでピボットテーブル
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
主成分分析(Pca)
主成分分析(Pca)主成分分析(Pca)
主成分分析(Pca)
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
ANOVA君とanovatan
ANOVA君とanovatanANOVA君とanovatan
ANOVA君とanovatan
 
馬に蹴られるモデリング
馬に蹴られるモデリング馬に蹴られるモデリング
馬に蹴られるモデリング
 
コンジョイント分析の書き方 Slideshare
コンジョイント分析の書き方 Slideshareコンジョイント分析の書き方 Slideshare
コンジョイント分析の書き方 Slideshare
 
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
 
StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9StanとRでベイズ統計モデリング読書会Ch.9
StanとRでベイズ統計モデリング読書会Ch.9
 
相関係数は傾きに影響される
相関係数は傾きに影響される相関係数は傾きに影響される
相関係数は傾きに影響される
 
データ入力が終わってから分析前にすること
データ入力が終わってから分析前にすることデータ入力が終わってから分析前にすること
データ入力が終わってから分析前にすること
 
傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling傾向スコア解析とUplift Modelling
傾向スコア解析とUplift Modelling
 
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
 
WAICとWBICのご紹介
WAICとWBICのご紹介WAICとWBICのご紹介
WAICとWBICのご紹介
 

Viewers also liked

Professional Experience Forum Presentation
Professional Experience Forum PresentationProfessional Experience Forum Presentation
Professional Experience Forum Presentation
Margo Johnston
 

Viewers also liked (17)

T検定と相関分析概要
T検定と相関分析概要T検定と相関分析概要
T検定と相関分析概要
 
Presentación arquitectura autosustentables genesis cardenas
Presentación arquitectura autosustentables genesis cardenasPresentación arquitectura autosustentables genesis cardenas
Presentación arquitectura autosustentables genesis cardenas
 
Professional Experience Forum Presentation
Professional Experience Forum PresentationProfessional Experience Forum Presentation
Professional Experience Forum Presentation
 
Reglas para el Curador
Reglas para el CuradorReglas para el Curador
Reglas para el Curador
 
Travelnz
TravelnzTravelnz
Travelnz
 
[DL輪読会]Semi supervised qa with generative domain-adaptive nets
[DL輪読会]Semi supervised qa with generative domain-adaptive nets[DL輪読会]Semi supervised qa with generative domain-adaptive nets
[DL輪読会]Semi supervised qa with generative domain-adaptive nets
 
Perencanaan proyek si
Perencanaan proyek siPerencanaan proyek si
Perencanaan proyek si
 
Higher criticism, SKAT and SKAT-o for whole genome studies
Higher criticism, SKAT and SKAT-o for whole genome studiesHigher criticism, SKAT and SKAT-o for whole genome studies
Higher criticism, SKAT and SKAT-o for whole genome studies
 
Sequential Kernel Association Test (SKAT) for rare and common variants
Sequential Kernel Association Test (SKAT) for rare and common variantsSequential Kernel Association Test (SKAT) for rare and common variants
Sequential Kernel Association Test (SKAT) for rare and common variants
 
Qué es la tecnologia
Qué es la tecnologiaQué es la tecnologia
Qué es la tecnologia
 
RED DE PRODUCCIÓN Y CONSUMO SOLIDARIO
RED DE PRODUCCIÓN Y CONSUMO SOLIDARIORED DE PRODUCCIÓN Y CONSUMO SOLIDARIO
RED DE PRODUCCIÓN Y CONSUMO SOLIDARIO
 
Best Practices for Migrating your Data Warehouse to Amazon Redshift
Best Practices for Migrating your Data Warehouse to Amazon RedshiftBest Practices for Migrating your Data Warehouse to Amazon Redshift
Best Practices for Migrating your Data Warehouse to Amazon Redshift
 
Ecomobility - Ασφαλής μετακίνηση πεζών στη πόλη της νάουσας
Ecomobility - Ασφαλής μετακίνηση πεζών στη πόλη της νάουσαςEcomobility - Ασφαλής μετακίνηση πεζών στη πόλη της νάουσας
Ecomobility - Ασφαλής μετακίνηση πεζών στη πόλη της νάουσας
 
Deep Dive on Amazon Redshift
Deep Dive on Amazon RedshiftDeep Dive on Amazon Redshift
Deep Dive on Amazon Redshift
 
Diabetes gestacional (1)
Diabetes gestacional (1)Diabetes gestacional (1)
Diabetes gestacional (1)
 
(Tutoriel) Installer et Utiliser Huginn - Outil de veille open source
(Tutoriel) Installer et Utiliser Huginn - Outil de veille open source(Tutoriel) Installer et Utiliser Huginn - Outil de veille open source
(Tutoriel) Installer et Utiliser Huginn - Outil de veille open source
 
Making (Almost) Any Database Faster and Cheaper with Caching
Making (Almost) Any Database Faster and Cheaper with CachingMaking (Almost) Any Database Faster and Cheaper with Caching
Making (Almost) Any Database Faster and Cheaper with Caching
 

Similar to 「生物統計学」演習問題集

Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
Issei Kurahashi
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
Miyoshi Yuya
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
Yasuyuki Okumura
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
Haruka Ozaki
 

Similar to 「生物統計学」演習問題集 (20)

非劣性試験の入門
非劣性試験の入門非劣性試験の入門
非劣性試験の入門
 
カテゴリカルデータの解析 (Kashiwa.R#3)
カテゴリカルデータの解析 (Kashiwa.R#3)カテゴリカルデータの解析 (Kashiwa.R#3)
カテゴリカルデータの解析 (Kashiwa.R#3)
 
傾向スコアの概念とその実践
傾向スコアの概念とその実践傾向スコアの概念とその実践
傾向スコアの概念とその実践
 
統計モデリングで癌の5年生存率データから良い病院を探す
統計モデリングで癌の5年生存率データから良い病院を探す統計モデリングで癌の5年生存率データから良い病院を探す
統計モデリングで癌の5年生存率データから良い病院を探す
 
データ解析4 確率の復習
データ解析4 確率の復習データ解析4 確率の復習
データ解析4 確率の復習
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
 
2018年度秋学期 統計学 第14回 分布についての仮説を検証するー検定 (2019. 1. 8)
2018年度秋学期 統計学 第14回 分布についての仮説を検証するー検定 (2019. 1. 8)2018年度秋学期 統計学 第14回 分布についての仮説を検証するー検定 (2019. 1. 8)
2018年度秋学期 統計学 第14回 分布についての仮説を検証するー検定 (2019. 1. 8)
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
2022年度春学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2)
2022年度春学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2)2022年度春学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2)
2022年度春学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2)
 
NL20161222invited
NL20161222invitedNL20161222invited
NL20161222invited
 
2021年度秋学期 統計学 第15回 分布についての仮説を検証する - 仮説検定(2)(2022. 1. 18)
2021年度秋学期 統計学 第15回 分布についての仮説を検証する - 仮説検定(2)(2022. 1. 18)2021年度秋学期 統計学 第15回 分布についての仮説を検証する - 仮説検定(2)(2022. 1. 18)
2021年度秋学期 統計学 第15回 分布についての仮説を検証する - 仮説検定(2)(2022. 1. 18)
 
ベイズ統計入門
ベイズ統計入門ベイズ統計入門
ベイズ統計入門
 
統計的検定と例数設計の基礎
統計的検定と例数設計の基礎統計的検定と例数設計の基礎
統計的検定と例数設計の基礎
 
クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定クラシックな機械学習の入門  9. モデル推定
クラシックな機械学習の入門  9. モデル推定
 
2015年度春学期 統計学 第5回 分布をまとめる ― 記述統計量(平均・分散など) (2015. 5. 14)
2015年度春学期 統計学 第5回 分布をまとめる ― 記述統計量(平均・分散など) (2015. 5. 14)2015年度春学期 統計学 第5回 分布をまとめる ― 記述統計量(平均・分散など) (2015. 5. 14)
2015年度春学期 統計学 第5回 分布をまとめる ― 記述統計量(平均・分散など) (2015. 5. 14)
 
2022年度秋学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2) (2023. 1. 17)
2022年度秋学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2) (2023. 1. 17) 2022年度秋学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2) (2023. 1. 17)
2022年度秋学期 統計学 第15回 分布についての仮説を検証するー仮説検定(2) (2023. 1. 17)
 
P値を使わないフィットネステストの評価法
P値を使わないフィットネステストの評価法P値を使わないフィットネステストの評価法
P値を使わないフィットネステストの評価法
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
 
Survival analysis0702
Survival analysis0702Survival analysis0702
Survival analysis0702
 
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
 

「生物統計学」演習問題集

  • 2. レポート問題について •  実験データに真に差があるのか、実験のばら つきによる見せかけの差なのかを検定する。   •  例題を参考にして、類題のp値と考察を導け。   このアイコンをクリック して立ち上げましょう。
  • 3. (石村園子「やさしく学べる統計学」より) #  BMI値(女性8名,入会したて) before  =  c(22.5,  22.3,  23.2,  25.8,  24.1,  25.1,  22.5,  25.7) #  BMI値(女性9名,入会6ヶ月後) a<er  =  c(21.5,  21.0,  21.9,  24.1,  23.3,  23.8,  21.4,  24.2,  22.3)     #  描画   BMI  =  c(before,  a<er)   group  =  c(rep(0,8),  rep(1,9))   plot(group,  BMI)     #  t検定(母平均に差無しを仮定)   t.test(before,  a<er)     #  結論(p値と考察)   #  p=0.075(>0.05)なので有意な差は見られない 例題1:フィットネスクラブのダイエットコー スは女性に対して効果がありそうか? 2122232425 BMI before after
  • 4. (Dyson  et  al.,  2007) #  体重変化(kg,  低炭水化物食,12名) low  =  c(-­‐1.35,  -­‐2.44,  -­‐3.37,  -­‐3.71,  -­‐4.38,  -­‐6.74,  -­‐7.92,  -­‐8.08,   -­‐8.84,  -­‐9.35,  -­‐13.14,  -­‐13.89) #  体重変化(kg,  通常食,10名) normal  =  c(2.36,  0,  -­‐0.34,  -­‐1.26,  -­‐2.02,  -­‐2.69,  -­‐2.86,  -­‐3.37,   -­‐5.22,  -­‐5.39)     #  描画   weight  =  c(low,  normal)   group  =  c(rep(0,12),  rep(1,10))   plot(group,  weight)     #  t検定(母平均に差無しを仮定)   t.test(low,  normal)     #  結論(p値と考察)   #  p=0.002549  (<0.05)なので有意な差が見られる 類題1:低炭水化物食はダイエット(体重 変化)に効果があるか? -10-50 weight low normal
  • 5. 例題2:オート麦外皮のシリアルは、コレ ステロール値を低下させるか? #  LDLコレステロール値(高LDL男性14名,コーンフレーク) LDL_corn  =  c(4.61,  6.42,  5.40,  4.54,  3.98,  3.82,  5.01,  4.34,   3.80,  4.56,  5.35,  3.89,  2.25,  4.24)   #  LDLコレステロール値(同,オーツブランシリアル)   LDL_oat  =  c(3.84,  5.57,  5.85,  4.80,  3.68,  2.96,  4.41,  3.72,   3.49,  3.84,  5.26,  3.73,  1.84,  4.14)     #  対応する点を線で結んで描画   group  =  rbind(rep(0,14),  rep(1,14))   LDL  =  rbind(LDL_corn,  LDL_oat)   matplot(group,  LDL,  type="b",xaxt="n",xlab="",  xlim=c(-­‐0.3,   1.3),  pch="o",  lty=1,  col=1);  axis(1,0:1,c("corn","oat"))     #対応ありt検定(コーンとオーツで差無しを仮定)   t.test(LDL_corn,  LDL_oat,  paired=T)     #  結論(p値と考察)   #  p=0.005278(<0.05)なので有意な差が見られる (Pagano「生物統計学入門」より) o o 23456 LDL o oo o o o o oo o o oo oo o o o o o o o o o o o corn oat
  • 6. 類題2:6人のパセドウ病患者への自律 神経遮断剤は脈拍数を変化させるか? #  脈拍数(6人のパセドウ病患者,投与前) pulse_before  =  c(98,  88,  100,  96,  107,  114)   #  脈拍数(同,投与後)   pulse_a<er  =  c(86,  73,  95,  92,  99,  116)     #  対応する点を線で結んで描画   group  =  rbind(rep(0,6),  rep(1,6))   pulse  =  rbind(pulse_before,  pulse_a<er)   matplot(group,  pulse,  type="b",xaxt="n",  xlab="",  xlim=c(-­‐. 3,  1.3),  pch="o",  lty=1,  col=1);  axis(1,0:1,c("before","a<er"))     #  対応ありt検定(投与前後で差無しを仮定)   t.test(pulse_before,  pulse_a<er,  paired=T)     #  結論(p値と考察)   #  p=0.03683  (<0.05)  なので有意な差がある。 o o 8090100110 pulse o o o oo o o o o o before after (市原「バイオサイエンスの統計学」より)
  • 7. 例題3:医療機関3施設にて計測された ベースラインは等しいか? (Pagano「生物統計学入門」より) #  冠状動脈疾患者の肺活量   x  =  c(3.23,  3.47,  1.86,  2.47,  3.01,1.69,2.10,2.81,3.28,  3.36,   2.61,  2.91,  1.98,  2.57,  2.08,  2.47,  2.47,  2.74,  2.88,2.63,  2.53,   3.22,  2.88,  1.71,  2.89,  3.77,  3.29,  3.39,3.86,  2.64,  2.71,  2.71,   3.41,  2.87,  2.61,  3.39,  3.17,  2.79,  3.22,  2.25,  2.98,  2.47,  2.77,   2.95,  3.56,  2.88,  2.63,  3.38,  3.07,  2.81,  3.17,  2.23,  2.19,  4.06,   1.98,  2.81,  2.85,  2.43,  3.20,  3.53)   #  計測機関:  John  Hopkins  /  Rancho  Los  Amigos  /  St.  Louis   group  =  c(1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,  1,   2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,  3,  3,  3,  3,   3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  3,  3)   #  各機関毎の箱ひげ図   boxplot(x~group,  xaxt="n")   axis(1,1:3,  c("John  Hopkins",  "Rancho",  "St.  Louis"))     #  F検定(一元配置分散分析,病院の差異は無しと仮定)   oneway.test(x  ~  group,  var.equal=T)   #  結論(p値と考察)   #  p=0.052(>0.05)なので、有意な差は無い。 2.02.53.03.54.0 John Hopkins Rancho St. Louis
  • 8. 類題3:在胎週数によって新生児期黄疸 の強さに差があると考えてよいか? #  黄疸指数   x  =  c(13,  11,  6,  11,  10,  7,  7,  5,  8,  7,  5,  5,  4,  3,  3)     #  在胎週数(3段階):  〜36  /  〜38  /  〜40   group  =  c(1,  1,  1,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,  3,  3)     #  各在胎週数毎の箱ひげ図   boxplot(x~group,  xaxt="n")   axis(1,1:3,  c("<36",  "<38",  "<40"))     #  F検定(一元配置分散分析,在胎週数での差異無と仮定)   oneway.test(x  ~  group,  var.equal=T)$p.value     #  結論(p値と考察)   #  p値=0.0263361なので有意な差があると言える。 (市原「バイオサイエンスの統計学」より) 4681012 <36 <38 <40
  • 9. 例題4:白血病の治療法AとBに違いはあ るか? (市原「バイオサイエンスの統計学」より) #  χ2検定(独立を仮定)   count  =  matrix(c(48,32,24,36),  ncol=2)   chisq.test(count)     #  結論(p値と考察)   #  p=0.02984  (<0.05)なので治療法に有意な差がある。
  • 10. 類題4:(重症外傷患者の)敗血症発症 と遺伝型に関連はあるか? (Ziegler他「ゲノム疫学の発想と実用化」より) #  χ2検定(独立を仮定)   count  =  matrix(c(33,9,38,74),  ncol=2)   chisq.test(count)     #  結論(p値と考察)   #  p=1.859e-­‐06  (<0.05)  なので有意な関連がある。 TNF-­‐308A  >  G(rs1800629)変異型
  • 11. 例題5:我々の宇宙は膨張しているか? =銀河は距離に比例して遠ざかるか? (Everih「Rによる統計解析ハンドブック」より) #  銀河の距離   distance  =  c(62,  283,  499,  555,  676,    99,  347,  363,  112,  426,   309,  325,  205,  470,  547,  459,  501,  488,  461,  679,  382,  139,     97,  455)     #  銀河の速度 velocity  =  c(0.42,  2.10,  5.67,  5.04,  4.65,  0.88,  2.26,  2.79,   0.25,  2.44,  2.03,  2.43,  1.92,  4.53,  1.96,  4.50,  4.37,  4.56,  4.50,   4.43,  3.49,  1.00,  0.73,  3.16)     #  散布図の描画   plot(distance,  velocity,  xlim=c(0,679),  ylim=c(0,5.8))     #  F検定(回帰分析,傾き0を仮定)   res  =  lm(velocity~distance-­‐1);    abline(res);    summary(res)     #  結論(p値と考察)   #  p=1.02e-­‐15  (<<0.05)なので傾き128は有意に0から異なる 0 200 400 600 0123456 distance velocity
  • 12. 類題5:地下炭鉱労働者の死亡率は減 少しているか? #  死亡率(1000人当たり)   death_rate  =  c(2.419,  1.732,  1.361,  1.108,  0.996,  0.952,   0.904,  0.792,  0.701,  0.890,  0.799,  1.084)     #  年度 year  =  1970:1981     #  散布図の描画   plot(year,  death_rate)     #  F検定(回帰分析,傾き0を仮定)   res  =  lm(death_rate~year);    abline(res);    summary(res)     #  結論(p値と考察)   #  p=0.00518  (<0.05)  なので傾きは有意に0から異なる。 (Pagano「生物統計学入門」より) 1970 1972 1974 1976 1978 1980 1.01.52.0 year death_rate
  • 13. 例題6:薬品を与えるとカブトムシの死亡 率は上がるか? #  薬品の量   dose  =  c(1.69,  1.72,  1.76,  1.78,  1.81,  1.84,  1.86,  1.88)   #  カブトムシの死亡数   y  =  c(6,  13,  18,  28,  52,  53,  61,  60)   #  カブトムシの総数   n  =  c(59,  60,  62,  56,  63,  59,  62,  60)     #  死亡率の描画   death_rate  =  y/n;  plot(dose,  death_rate)     #  F検定(ロジスティック回帰分析,「傾き」0を仮定)   res  =  glm(cbind(y,n-­‐y)  ~  dose,  binomial)   lines(dose,  fihed(res));      summary(res)     #  結論(p値と考察)   #  p=2e-­‐16  (<<0.05)なので「傾き」は0から有意に異なる (Dobsonら「An  Introducjon  to  Generalized  Linear  Models,  3rd」より) 1.70 1.75 1.80 1.85 0.20.40.60.81.0 dose death_rate
  • 14. 類題6:エバーメクチンを経口投与すると 羊の寄生虫の数は減少するか? #  抗生物質Avermecjnの量  (mg/kg)   dose  =  c(0,  0.025,  0.05,  0.10)   #  T.  colubriformis,  C.  oncophora,  C.  oncophoraの総数   n    =  c(1897,  1366,  76,  38)   n2  =  c(6195,  6009,  3283,  1549);      n3=  c(6117,  0,  0,  0)     #  死亡率の描画   plot(dose,  n/max(n));  points(dose,  n2/max(n2),  col=2);     #  F検定(ロジスティック回帰分析,「傾き」0を仮定)   res  =  glm(cbind(n,  max(n)-­‐n)  ~  dose,  binomial)   lines(dose,  fihed(res));  summary(res)   res2  =  glm(cbind(n2,  max(n2)-­‐n2)  ~  dose,  binomial)   lines(dose,  fihed(res2),  col=2);  summary(res2)     #  結論(p値と考察)   #  p=2e-­‐16  (<<0.05)なので「傾き」は0から有意に異なる (Egerton  et  al.,  Anjmicrobial  Agents  and  Chemotherapy,  1979) 0.00 0.02 0.04 0.06 0.08 0.10 0.00.20.40.60.81.0 dose n/max(n) ノーベル賞のkey  publicajonのデータをプロット
  • 15. 最近の大村先生の論文から (Mayadera  et  al.,  PNAS,  2003) (Hirose  et  al.,  J.  Anjbiojcs,  2009) (Tanaka  et  al.,  PNAS,  2009) (Hayashi  et  al.,  PNAS,  2002)
  • 16.
  • 17. 毎日新聞記事からの教訓 •  スキー練習でもひとのまねをしていてはダメ   •  信念「オリジナリティーを追求するのが科学」   •  1973年に帰国して研究室を開いた際「動物薬 の開発を目指す」とスタッフに宣言した。   •  抗生物質の研究で傍流だった「マクロライド 系」系統の追跡に専念した。   •  「企業の下請けにはならない。研究室の根幹 は自分たちで決めていた。」
  • 18. 読売新聞の分析 •  土から奇跡の菌   •  年間6000種 分析の結果   •  採取袋持ち歩き 掘り起こした特効薬