Contenu connexe
Plus de Tsuda University Institute for Mathematics and Computer Science (18)
C ai p3_jp_no5v1.2
- 3. 第7章 最適化尺度
法
第6章 次元を縮減
する
第5章 Χ2距離をプ
ロットする
第4章 Χ2距離と慣
性
第1章 散布図と
マップ
第2章 プロファイ
ルとプロファイル
空間
第3章 質量と重⼼
2つの量変数の関係を⾒る
→ 散布図
カテゴリカル変数をどう扱うか
距離!
CAの基本概念:プロファイル
それが位置するプロファイル
空間。三⾓座標でみていく。
プロファイル:周辺度数→質量
頂点とプロファイル、
平均プロファイル(期待値プロ
ファイル)、重⼼
距離: Χ2距離
慣性: Χ2値/n(プロファイル値で
表現)
最⼤慣性:頂点に⼀致
最⼩慣性:原点(重⼼)に⼀致
Χ2距離をユークリッド距離
に変換し図⽰する。
分布の同等性(分布的に等価)
ここまで3次元。これからより
多数の次元を扱う。
低次元下位空間を同定する(回帰
との⽐較)
SVD:特異値分解
近似:表⽰の質
第10章 さらに3つ
の事例
DS5:科学研究者の評価
DS6:海底試料中海洋種
DS7:著者ごとの⽂字種
慣性の分解
⾮対称マップ/対称マップ
慣性の⼤きさによる表⽰
の特徴
第9章 2次元表⽰ 主軸のネスティング
プロファイルと頂点
⾮対称マップ/対称マップ
第8章 ⾏分析と列
分析の対称性
頂点位置とプロファイル
スケーリング係数
主座標と標準座標
正準相関:最⼤化
整数尺度(likert)
解釈の基準
プロファイル空間の幾何学(1)
プロファイル空間の幾何学(2)
2021/4/17 対応分析研究会 第5回 3
DS1
DS2
DS3
DS4
- 8. r-tips: 対⾓⾏列を左から/右からかける
• 表が⾏列として与えられている。M
• このMの⾏プロファイルを求めるには
• ⾏和(周辺度数)をもとめ、それをベクトルにする。r
• そのベクトル分の1を要素とする対⾓⾏列 Dr−1 をMに対して左からか
かける。
• Dr−1 %*% M (%*% は、Rでの⾏列の掛け算)
• このMの列にウェイトをかける場合は、5:1(5,4,3,2,1)を対⾓
にもった対⾓⾏列 DI を右からかける。
• M %*% DI
• Rmarkdownで記述したもの(付録)を⾒てください。
2021/4/17 対応分析研究会 第5回 8
- 26. CAのresultを表⽰するtool
• factoextra
• ggplotベースのグラフ表⽰
• plot.caのmapオプションにも対応
• 当初、マップエリアでの⽇本語表⽰に問題があったがshowtextを使っ
て解決。Tokyo.Rでの報告。
• explor
• shinyを使ったインターラクティブ・ツール。
• MCAに対してのほうが威⼒を感じます。
• スナップショット的なものを、コードとして吐き出すので、それを
Rmarkdownに貼り込める。
2021/4/17 対応分析研究会 第5回 26
- 27. 参考⽂献
• 第7章
• ⻄⾥静彦,2007, 『データ解析への洞察―数量化の存在理由 』K.G.リブレット、
関⻄学院⼤学出版会、
• ⻄⾥静彦,2014, 「⾏動科学への数理の応⽤:探索的データ解析と測度の関係
の理解」⾏動計量学会論⽂ページ
• 藤本が、Tokyo.RのLTで報告したスライド
• 「その数量化、⼤丈夫ですか?」 https://www.slideshare.net/kazuofujimoto/ss-
89428948
• 第8章
• 第9章
• 藤本,2017,「対応分析のグラフを適切に解釈する条件−Standard coordinate,
Principal Coordinate を理解する−」『津⽥塾⼤学紀要』49,141-153,
http://id.nii.ac.jp/1234/00000110/
• 藤本,2015,『対応分析⼊⾨』オーム社:p73にパッケージの⽐較表
2021/4/17 対応分析研究会 第5回 27
- 28. CAに関係するRのpackage
• CA本体
• ca Michael Greenacre, Oleg Nenadic, Michael Friendly
• FactoMineR Francois Husson, Julie Josse, Sebastien Le, Jeremy Mazet
• GDATools Nicolas Robette
• CAのresultを解析するツール
• factoextra Alboukadel Kassambara, Fabian Mundt
• explor Julien Barnier
• カテゴリカルデータ解析
• vcd David Meyer Achim Zeileis ORCID iD, Kurt Hornik, Florian Gerber,
Michael Friendly
• vcdExtra Michael Friendly, Heather Turner, Achim Zeileis, Duncan Murdoch,
David Firth
• 次回は、第10章の三つのデータセットの解説と、これまでに使ったデータ
セットのレビューをこれらのパッケージを使って、総合的にやってみたい
と思っております。(提案!)
2021/4/17 対応分析研究会 第5回 28