sed,awkして船山登る

京都のD大学で開催されている統計学会へ。グラウンドだった所に立派な建物ができていて、そこが会場。なかに入ると、広大なラーニング・コモンズやらPBL支援センターやら、近年耳にするようになった新しいアイデアがすでに実現されているのを目のあたりにする。しかし、あたりを散歩してみると、まぁやはり、非常勤で出張講義をしていた頃とそんなに変わらない。

ビッグデータのセッションでは、あいかわらず「データサイエンティスト」の評判が芳しくなく・・・^^。米大統領選で230万人のサンプルを集めた新聞社の予測が外れた話(3000人のサンプルでの予測は的中した、リテラリー・ダイジェストの話)とか、200万ものビッグデータがあるのなら200万人に1人しかかからない病気の分析でもすればよかろうにという質問に、いや200万人のうちのたった1人の顧客を掘り当てようというのがロングテールなんだとか、比較的にとっつきやすい話が多くて面白かった。しかし、Rは実はビッグデータには使い物にならない(商用Rを使いなさい)という話はほんとうだろうか。データの「前処理」との関係でDOS窓やUnixコマンドの「重要性」が強調され(だから、ボクは20年前に私情協ジャーナルに「どんなデータにも対応できるという意味でプログラミング能力はデータ分析には必須」と書いたのだ^^)、標題のパロディをはじめて聞いた。講演者によると、DOSコマンドを知るか知らないかの境目は40歳とのことだったが、debug(デバッガ)やmasm(8086マクロ・アセンブラ)まで知っているのはもうすこし上だね。

このブログ記事について

このページは、eiichiが2014年3月 9日 00:04に書いたブログ記事です。

ひとつ前のブログ記事は「レイルウェイ」です。

次のブログ記事は「「兼八」全種制覇」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja