社会科学とコンピュータ

「スパコンがアラブの春を予測した」そうだ(元記事はこちらなど)。

研究内容の原文を追っているヒマはボクにはない。が・・・記事内容から推測するに、予測手法はテキスト・マイニング(某大な文字データの山から「宝を掘り当てる」分析手法の総称)で、ニューヨーク・タイムスの1945年から現在までの新聞記事(1億件超)をいくつかのグループに分類したようだ。伝統的なクラスター分析のようなものを想像すると、似通ったものどうしをグループにまとめるわけだからサンプル間の類似性を測らねばならない。全ペアの組み合わせをとりだして類似性を検討するなら、サンプル数が10個のとき109/2=45回の反復計算、100個なら10099/2=495回、1000個なら499500回・・・1億件超の新聞記事についてやるとしたら5000兆回の反復計算が必要となる。なるほどスパコンは必要なのかもしれない(1回の計算時間を1マイクロ秒=10-6=0.000001秒とすると5000兆回の反復には159年もかかる、1ナノ秒=10-9秒なら58日、1ピコ秒=10-12秒でも1.4時間ほど。ちなみに現在の最速PCでは100GFLOPS、つまり1ナノ秒に100ステップの演算速度だから、数十日以上はかかるというところだろうか)。で、分析結果は・・・歴史的な大事件が起こる直前には、あるグループ(「悲惨」などのキーワードを含む「否定的論調」の記事グループ)の記事の数が増える傾向にあることがわかったそうだ。よって、このグループの記事数の増加は歴史的大事件が生じる前兆である、ということらしい。

たしか、NY Times 日本支局は東京の朝日新聞本社内にあるそうだから、朝日新聞を読んでいれば、日本の重大事件は予知できるということか。そういえば、むかし、競馬に凝った友人が、前日のスポーツ紙の記事を分析すれば勝馬が確実に予測できるというような話をしていたが・・・。この研究に対して「すばらしい」という感想コメントを寄せている人がいることに驚きを禁じ得ない。やはり、社会科学を学ぶことは情報リテラシーの涵養に必須である。コンピュータを活用した経済分析、(超不人気科目の)計量経済学も、まだまだ存在意義はあるということなのだろう。

電線スズメ工場空地犬カップル(拙宅前のいつもの風景)

この気晴らしは、Pen + m.Zuiko 45mm F1.8 で。Pen E-P3 にキットでついてきた標準ズームレンズがいまひとつなので、単焦点を2本(↓25mmF1.4と↑これを)買い足したのです。いずれもこの夏の新製品、安価でよく写り抜群のコストパフォーマンスと海外の中立サイトで絶賛(たとえばLensTip.com)。あぁ写真を撮りに行きたいな~。

このブログ記事について

このページは、eiichiが2011年9月16日 03:02に書いたブログ記事です。

ひとつ前のブログ記事は「あせり、気晴らし」です。

次のブログ記事は「東京の風景」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja