統計データの視覚化

この春学期は週6.25コマ。昨年度までの過密スケジュールからすれば天国のようで、余裕をもって講義の準備ができる。というわけで、来週の講義(お題は「楽しいプログラミング」^^)に備えて、デモンストレーションのネタを物色中。

かの「Rによるデータサイエンスシリーズ」第12巻『統計データの視覚化』から第10章「位置情報を伴うデータの可視化」あたりをパラパラとめくっていたんだけれど・・・初っ端から、掲載プログラムが動かず、あきらかなタイプミスが残存していた。
ESRI社のGISファイルには、日本の市区町村名等がシフトJISコードで格納されているので、最初に漢字コードを変換してやる必要があるのに、掲載プログラムにはこれがぽっかり抜け落ちている(せめて脚注にでも書いておくべきだ、著者は Windows しか知らんのか?)。また、ポリゴンの重心を求めるのに、掲載プログラムの関数ではエラーが出る(おまけに引数の一部がタイプミス)。ネットでちょっと調べれば、適切な関数はすぐに見つかるとはいえ・・・。
そういえばこの本は R のかなり古いバージョンで書かれているからかもしれないと思い直して、本の序文に堂々と紹介されているサポートページをおとずれてみたが・・・更新されている様子はなく、正誤表は空っぽのまま。なんちゅうこっちゃ。

というわけで、来週のデモは、H.Rothling+Gapminder流のアニメーションを「つかみ」に使うことにした。Google API+World Bankのオープンデータ、Rからはたった数行で見事なグラフが描ける(こちら)。二年前の講義では Javascript で相当に冗長なプログラムを書く演習をしたものだが、飛躍的にカンタンになっている^^。

当の講義というのは、二回生全員を対象にしたデータ分析の入門講座(1回きり90分間)。昨年までは日本経済のハナシを中心にしていたのだけれど、今年はガラリと内容も変えて「楽しいプログラミング」という副題をつけた。流れは以下のような感じ。
ICTの高度化は、社会経済データの分析にも大きな恩恵を与え続けている。オープンデータの広がりや、WebAPIをふくむライブラリ(道具箱)の充実ぶり。これを利用しない手はない(Rなら誰にでもすぐに使える!)。ここまでは OK(たぶんウケるはず^^)。
で、このあと、あみだくじの必勝法(シミュレーション)、プロ野球のデータ分析(相関と回帰)、貿易立国崩壊のハナシ(経済予測)と続くが、たぶん、プロ野球の途中くらいで半分の受講者は熟睡に入るだろう^^。

このブログ記事について

このページは、eiichiが2015年4月11日 12:47に書いたブログ記事です。

ひとつ前のブログ記事は「データサイエンス」です。

次のブログ記事は「「やる気」、偏差値、GPA」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja