近年,Web上でテストを実施するeテスティングが注目されており,試験やeラーニングのツールとして利用されている.しかし,eテスティングでは,項目を管理するための項目データベースが必要となり,項目の内容的な分類は手動で階層的に行われることが多い.ゆえに,項目数が増えると,項目の検索や分類が困難となる.
そこで,本論文では,多肢選択式の項目を対象とした項目間の内容的な類似性の定量化を目的とし,項目間の類似度算出手法を提案した.類似性とは,「項目内で問われている知識や解決の中心となる知識の類似性」を意味し,それらの知識(以下,対象知識)が一致する項目同士を「類似項目」とした.この類似度を用いることで,項目データベース内(間)における,項目の自動的な検索や分類が可能となる.
本論文では,対象知識の出現箇所(問題文,正答,誤答)自動決定アルゴリズム(前処理)を基に,抽出された「語」(手法1),または,語の共起性から推定される「トピック」(手法2)を特徴量とし各項目をベクトル表現する手法を提案した.なお,手法2のトピックの推定にはLDA (latent Dirchlet Allocation)を用いた.
さらに,一般的な文書を対象とした既存手法と上述した提案手法を利用した類似項目の検索実験を行った結果,手法2>手法1>既存手法,の順で再現性と適合性が有意に向上した.これらの評価結果から,項目間類似度の算出に前処理やトピックを用いることの有効性が示唆された.
引用:高木 輝彦: 多肢選択式項目の類似度算出手法に関する研究, 人工知能学会誌,
特集「人工知能分野における博士論文」, Vol30, No.1, pp.131 (2015).