ドクター論文の指導小委員会で気になったこと二点への解答(回答ではありません^^)をメモしておきます。出張中にフト思い出したんだけど、次の小委員会まで会う機会がないようだし(次の小委員会にボクが呼ばれるかどうかもわからんし^^)、1ヶ月も経つとそろそろ忘れてしまいそうだから。
(1) 某君の研究報告から。 銀行の貸出行動が企業倒産に与える影響を調べる回帰分析です。 y を企業倒産件数、x を銀行貸出総額、e を誤差、a と b を回帰係数として、 y(i) = a(i) + b(i)x(i) + e(i) for i=1,2,...,N ただし、(i) は i 番目の産業をあらわします(産業はN個あります)。 しかし、産業ごとの倒産件数 y(i) のデータが利用できないのです。全産業の合計倒産件数 Σy(i) と産業ごとの貸出総額 x(i) は公表されています。そこで・・・上の式を産業1からNまですべて、辺々、足し合わせます。 Σy(i) = Σa(i) + Σ b(i)x(i) + Σe(i) = A + Σ b(i)*x(i) + u これを推計して、産業ごとの回帰係数 b(i) の推定値を得ようとしています。
こんなことはできません(元の b(i) の値は得られません)。できる場合もありますが、各 x(i) が相互に独立となることが十分条件。たとえば N=2 として、簡単に確認(証明)できます。もちろん、この分析例では、この条件は満たされません。
(2) どういう分析だったか、具体的な内容を既に忘れてしまっていますが、クロス集計表(のようなもの)からの因果関係の考察です。出張中に読んでいた本のなかに、たまたま、一般的な解答になりそうな記述を見つけたので、メモしておきます。 P(x|y) を、y が起きた時に x が起きる確率とします。 P(x|~y) を、y が起きなかった時に x が起きる確率とします。 P(x|y) > P(x|~y) ならば、y から x への因果が存在するといえるでしょうか。
言えません。 P(x|y) > P(x|~y) は P(y|x) > P(y|~x) と同値だからです。ベイズの定理を用いて、こちらも簡単に確認できます。
ps. またまた蛇足ながら、地方の三流シンクタンクあたりでは、こんな操作を平気でやりそうな気がします(うちの院生のほうがしっかりしてるかもね~^^)。