日本橋濱町Weblog（日々酔亭）

Quality Economic Analyses Produces Winning Markets

競争評価２００４：サンプル数３

デジタル社会の経済分析

サンプル数の求め方は以下のとおり。

標本サイズnの単純無作為抽出で得られる比率pnの漸近分布は、N(p, pq/n)に従う（但しq=1-p)。

このとき、確率α以上で真の値pに関してaパーセント以内の真の比率pを推定するとき、Prob(|pn-p|<=ap)>=αという要件を満たす最小サンプル数を見つけることが問題となる。

ここで最小サンプル数は以下のように表現できる。

n>=(q/pa²)Φ^{(-1)((1+α)/2)}.

このとき、真の比率pが大きいときには、信頼区間αや相対精度aを変えてもサンプル数にはそれほど差はない。ところが、真の比率pが小さい場合、最小サンプル数は急速に大きくなる。特に相対精度aが低い場合、真の比率pが小さくなると最小サンプル数の大きさは急速に上昇する。

意識調査による研究では、多くの場合、回答者は、調査票の上で、選択行動においてr個の選択シナリオについて回答することになる。それを考慮すると、以下のように式は修正される。

n>=(q/rpa²)Φ^{(-1)((1+α)/2}).

さて、これで計算すると、･･･r個の選択シナリオを持ち、0.95の確率でのpの10％の相対精度持つシチュエーションにおいてのpの選択確率を求めるのに必要な回答者数は、432ということになり、選択肢の数は3457ということになる。

このサンプル数で十分だとすると、僕が持っていたサンプル数に対する疑問はあっけなく解決ということになり、昨年度の総務省の定量分析結果も十分評価するに絶えうるモデルだということになる。

しかし、この項の最後の方に、標本抽出は本書のレベルを超え複雑であるから、上記の方法について評価しないとある。RPの選択分析を行う者は、Ben-Akiva, Lerman(1985), Discrete choice analysis, MIT,の第8章等を見よとある。

ということは、RPは上記のSPを前提とした場合の標本抽出とは異なるということなのだろうか。

Jordan J. Louviere, 他、”Stated Choice Methods”、pp261-264.