この春学期は週6.25コマ。昨年度までの過密スケジュールからすれば天国のようで、余裕をもって講義の準備ができる。というわけで、来週の講義(お題は「楽しいプログラミング」^^)に備えて、デモンストレーションのネタを物色中。
かの「Rによるデータサイエンスシリーズ」第12巻『統計データの視覚化』から第10章「位置情報を伴うデータの可視化」あたりをパラパラとめくっていたんだけれど・・・初っ端から、掲載プログラムが動かず、あきらかなタイプミスが残存していた。
ESRI社のGISファイルには、日本の市区町村名等がシフトJISコードで格納されているので、最初に漢字コードを変換してやる必要があるのに、掲載プログラムにはこれがぽっかり抜け落ちている(せめて脚注にでも書いておくべきだ、著者は Windows しか知らんのか?)。また、ポリゴンの重心を求めるのに、掲載プログラムの関数ではエラーが出る(おまけに引数の一部がタイプミス)。ネットでちょっと調べれば、適切な関数はすぐに見つかるとはいえ・・・。
そういえばこの本は R のかなり古いバージョンで書かれているからかもしれないと思い直して、本の序文に堂々と紹介されているサポートページをおとずれてみたが・・・更新されている様子はなく、正誤表は空っぽのまま。なんちゅうこっちゃ。
というわけで、来週のデモは、H.Rothling+Gapminder流のアニメーションを「つかみ」に使うことにした。Google API+World Bankのオープンデータ、Rからはたった数行で見事なグラフが描ける(こちら)。二年前の講義では Javascript で相当に冗長なプログラムを書く演習をしたものだが、飛躍的にカンタンになっている^^。
当の講義というのは、二回生全員を対象にしたデータ分析の入門講座(1回きり90分間)。昨年までは日本経済のハナシを中心にしていたのだけれど、今年はガラリと内容も変えて「楽しいプログラミング」という副題をつけた。流れは以下のような感じ。
ICTの高度化は、社会経済データの分析にも大きな恩恵を与え続けている。オープンデータの広がりや、WebAPIをふくむライブラリ(道具箱)の充実ぶり。これを利用しない手はない(Rなら誰にでもすぐに使える!)。ここまでは OK(たぶんウケるはず^^)。
で、このあと、あみだくじの必勝法(シミュレーション)、プロ野球のデータ分析(相関と回帰)、貿易立国崩壊のハナシ(経済予測)と続くが、たぶん、プロ野球の途中くらいで半分の受講者は熟睡に入るだろう^^。