標本数1500、いぢわる

年末から、あるデータの解析をしてる。標本数1500、変数はすべて質的(カテゴリカル)データ。計量経済学では、こういうデータには順序ロジットなどの推計手法を使う。が、どうもうまくいかない。暮れから正月にかけて悶々としてた。で、原稿締切まであと3日にせまった昨晩、フト思いついて、伝統的な多変量解析の手法(数量化二類)を使ってみることにした。これがアタリだったか、それらしい計算結果が出てきた(ようだ)。量的な潜在スコアを予測する方程式を推計するという基本着想は、順序ロジットも数量化二類も、同じ。前者は方程式を最尤推計するが、後者は相関比(群間変動/全変動)を最大にする。もちろん同じではない。でもそれ以前に、1500という標本数はどうよ。異常値やノイズも多く含まれるんだろうけれど、1500の標本に推測統計の手法を用いても・・・(でもまぁ、細部を検討している時間はないので、今回は、「記述的にまとめる」ということで^^)。

ところで、これらの分析プログラムを探していて(まぁ今回は時間がせまっていたので)、意地悪なトリック?を発見した。あるフリー版のプログラムなんだけど、ダウンロードしてきても、そのままでは動かないんだな。なぜなら、そのままでは動かないように、わざと、プログラムの一部を書き換えてあるから^^。エラーが出たのでコードを追ってみたらすぐにそれと見抜けたけれど、そういえば、昔はこういうのがよくあった気がする。こういうトリックを仕組みたくなる気持ちはわかる気がする。もちろん意地悪でもなんでもない。こんなトリックも見抜けない人には安直に使ってほしくないということかな。。だからやっぱり、プログラミングの素養は必要なんだよ。

このブログ記事について

このページは、eiichiが2010年1月 4日 01:18に書いたブログ記事です。

ひとつ前のブログ記事は「晴朗の朝雲」です。

次のブログ記事は「Pages での数式入力」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja