次はサンプルサイズの問題である。前回の指摘は以下のとおり。
さらに、ある選択行動を取る人は無数にいるわけで、推計する場合にはそれらの人々の情報をなるべく吸い上げることが重要となる。そのとき、必要とされるサンプルサイズはどのようにして求めれば良いのであろうか。
離散選択モデルにおいてサンプルサイズを解析的な方法により求めることはできない(いろいろ統計量が求められないらしい)。現在まで言われているのは以下のような数値である(以下の記述は、土木学会編「非集計行動モデルの理論と実際」1995年からの引用)。
・ 従来から言われているものとして、2000〜3000サンプル:アメリカにおける2、3の経験から言われたもの。理論的根拠やパラメータ数との関連については不明。
・ 日本におけるサンプル数の研究では、800〜1000サンプルあれば、パラメータの変動係数が0.1以下(95%の確率)で相対誤差20%以内で推定できるとの研究成果がある。
・ 選択肢別抽出法では、選択肢ごとのサンプル数は300〜500程度でよいという研究結果。
・ 別の研究では、同サンプル数は280〜350でよいとされている。
土木学会の本自体がすでに10年前に出版されたものであるので、現状ではこのあたりの議論がどうなっているのかを調べる必要がある。
これに関しては、明日、Jordan J. Louviere, 他、”Stated Choice Methods”の関連箇所を読んでみようと思う。
関連記事 競争評価2004:サンプル