2015年4月アーカイブ

いろいろ

↓先のレポート、この4月から他大学へ転出した(元)同僚に送信したところ、速攻で「さっそく読んだ・興味深い」とのコメントが返ってきた。他からの反応があまりなくて、このようなものを「論文」にしてよいものかどうかと一抹の不安にかられていたところに、こういう返信は本当にうれしい。

それにしても、例によって、印刷屋とのやりとりには疲れる。TeXでの入稿を受け付けろとまでは言わないが、コピペ自由なpdfファイルで渡しているのに、Wordで全文を作り直せとはどういうことだろうか(まぁ、毎回そうせざるをえないのだが・・・)。今日は、pdfファイルに掲載された表では「均等縮小」しかできない?ので原版の表を送れといってきた。表はいくらでも拡大表示に耐えるんだけどなぁ・・・まぁ、すべてこちらで300%に拡大してtiffファイルにしたものを送っておいた。わけがわからんが、まぁ・・・。

ときどき時間が空くと、思い出したように、CDを大人買いする。ここしばらくは、ブルッフの「スコットランド幻想曲」。チョン・キョンファという韓国人バイオリニストのものを昔から愛聴していたが、さいきん、「名盤」と誉れの高いヤッシャ・ハイフェッツのものを二枚買い足した。1947年モノラル録音盤がいちばん美しく切ない^^。今日、グリュミュオーとパールマンのものを追加注文。オイストラフのものは絶版で中古が4800円・・・これはやめておこう(そこまで深い趣味ではない^^)。

商用統計ソフト Stata がバージョン14に。もう不要とは思いつつ、やっぱりアップデート。研究費のあるうちは、この手のものの進化の様子を追いかけるのも自分の仕事(もとい、好きでやっていること)の一つかと・・・^^。

The Independent 紙でたまたま見つけたこの記事によると、Google の検索窓に "How much does a * cost in Japan"(Japanの部分は任意の国名を指定可能)と入力すると、Google の auto complete 機能が働いて、ワイルドカード * の部分を「(その国/地域で)最も頻繁に検索されている用語(値段がいくらかを検索されている商品)」で自動補完してくれる。あるアメリカ企業が、この機能を利用して、世界各国でどんな商品の値段が最も頻繁に検索されているかを調査したそうだ。
調査によると、アフリカでは「牛」「ラクダ」「奴隷」の価格、中国では「電子機器」、韓国では「鼻の整形」費用、アラブのお金持ちは「ランボルギーニ」や「フェラーリ」、日本では「メロン」、イランでは「腎臓」、ブラジル・香港・タイ・カンボジア・ウクライナ等では「売春婦」などなど。
デタラメな調査であることは明白だが、拙宅(日本の大阪)から同じ検索を試みてみたところ・・・UK(英国)とすると「遺言」「葬式」が自動補完された(英国人は終活にご執心なのか、あるいは、たまたま大阪在住の高齢の英国人が本国で最期を送ろうと検索しただけだろうか)。Amsterdamでやってみると、joints(麻薬、これは衆目の一致するところ^^)。

「やる気」、偏差値、GPA

さいきん、元・大学院ゼミ生との共著で、論文(というか、レポート)を一本書いた。学生アンケート調査の結果と、出身高校偏差値やGPA(学業成績)などの学内データを組み合わせて、いくつかの分析を試みたもの(文章の全体は こちら)。

分析は、もともとは、昨年度に「情報系資格取得プログラム」の補助金を申請するために(ちょっと強引に^^)結論を引き出したもので、要するに、(1) 資格取得意欲と学業全般への意欲はプラスに相関している。経済情報系の学習などでは、資格取得のための短期集中学習を梃子にして、より深い学びへの誘導が可能(かもしれない)、(2) 資格取得意欲と学業全般への意欲は、出身高校偏差値やGPAとはまったく独立に分布している。だから、高いGPAを達成した「ご褒美」として資格講座受講の補助金を与えるような既存制度には限界がある。じっさい、高いGPA値を達成した学生が学業への意欲をまったく示さず、低いGPA値の学生が情報系資格の取得を強く希望するといった例は少なくない。

それはともかく、この分析を進めているなかで、奇妙な?事実に気づいた。すくなくともここ数年のデータをみるかぎり、出身高校偏差値とGPA(大学での成績)には、相関がまったくないのである。なぜだろう? うちの学部の場合、偏差値70をこえる超進学校からも学生は来るし、偏差値40の高校からも学生は来る(主力は偏差値50近辺、平均は48.4)。図の横軸が出身高校の偏差値、縦軸がGPA(大学での成績)、相関係数は 0.0067 ^^。元ゼミ生とあれやこれや議論してみたんだけれど、どうもすっきりとまとまらないので、今回の論文ではスルーした(原因やメリット・デメリットについて、まぁいくつかの仮説は思いつくんだけれど・・・^^)。

 

ps. なんの脈絡もないけれど、すごい動画を見た(Toyota G's Baseball Party稲村亜美の神スイング)。今夜は、バッセンへ行こう^^(梅田バッティングドームはまだ営業してるかな)。

統計データの視覚化

この春学期は週6.25コマ。昨年度までの過密スケジュールからすれば天国のようで、余裕をもって講義の準備ができる。というわけで、来週の講義(お題は「楽しいプログラミング」^^)に備えて、デモンストレーションのネタを物色中。

かの「Rによるデータサイエンスシリーズ」第12巻『統計データの視覚化』から第10章「位置情報を伴うデータの可視化」あたりをパラパラとめくっていたんだけれど・・・初っ端から、掲載プログラムが動かず、あきらかなタイプミスが残存していた。
ESRI社のGISファイルには、日本の市区町村名等がシフトJISコードで格納されているので、最初に漢字コードを変換してやる必要があるのに、掲載プログラムにはこれがぽっかり抜け落ちている(せめて脚注にでも書いておくべきだ、著者は Windows しか知らんのか?)。また、ポリゴンの重心を求めるのに、掲載プログラムの関数ではエラーが出る(おまけに引数の一部がタイプミス)。ネットでちょっと調べれば、適切な関数はすぐに見つかるとはいえ・・・。
そういえばこの本は R のかなり古いバージョンで書かれているからかもしれないと思い直して、本の序文に堂々と紹介されているサポートページをおとずれてみたが・・・更新されている様子はなく、正誤表は空っぽのまま。なんちゅうこっちゃ。

というわけで、来週のデモは、H.Rothling+Gapminder流のアニメーションを「つかみ」に使うことにした。Google API+World Bankのオープンデータ、Rからはたった数行で見事なグラフが描ける(こちら)。二年前の講義では Javascript で相当に冗長なプログラムを書く演習をしたものだが、飛躍的にカンタンになっている^^。

当の講義というのは、二回生全員を対象にしたデータ分析の入門講座(1回きり90分間)。昨年までは日本経済のハナシを中心にしていたのだけれど、今年はガラリと内容も変えて「楽しいプログラミング」という副題をつけた。流れは以下のような感じ。
ICTの高度化は、社会経済データの分析にも大きな恩恵を与え続けている。オープンデータの広がりや、WebAPIをふくむライブラリ(道具箱)の充実ぶり。これを利用しない手はない(Rなら誰にでもすぐに使える!)。ここまでは OK(たぶんウケるはず^^)。
で、このあと、あみだくじの必勝法(シミュレーション)、プロ野球のデータ分析(相関と回帰)、貿易立国崩壊のハナシ(経済予測)と続くが、たぶん、プロ野球の途中くらいで半分の受講者は熟睡に入るだろう^^。

このアーカイブについて

このページには、2015年4月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2015年3月です。

次のアーカイブは2015年5月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja