深夜に、家族の一人がいないことに気づく^^。探しに出たが見つからないので、交番に駆け込んだ。やさしいおまわりさんばかりで、本署にまで手配してくれて、なおかつ若い一人がすぐに飛び出して、一緒に探してくれた。ありがとう、日本の警察。警察と消防のありがたみが心にしみる今日この頃です^^。
ところで、日進月歩で進化する商品の値動きはすさまじい。たとえば↓に記したニコンのデジタル一眼レフ(D300)の場合、価格.comの記録をたどると、228,000円(2007年8月24日)→ 184500円(2008年1月1日)→ 159800円(2008年7月1日)→ 134000円(2008年12月24日)。D700もおなじ道を歩んでほしいと願う私です^^。
価格.com では、各商品の価格(最安値)を過去にさかのぼって調べることができる。こんな風に、前日から一年以上前までの毎日の値動きを表示してくれる。ただし、1ページ(Webページ)に数日分の表示しかしてくれないので、調べるのが面倒。たとえば D300 の場合には、昨年の発売開始から今年の年末まで、77ページにもわたって、値動きのデータがおさめられている。そこで・・・
これら 77ページにアクセスして、各ページに含まれる全ての日付と価格データを取り出し、ひとつの CSV ファイルにまとめよというのは、プログラミング(シェルスクリプト)の練習問題になるかしらん^^。while ループで 1 ページずつ反復処理。1ページ分を丸ごとダウンロード(wget)した後に、正規表現で日付を含む行を取り出し(grep)、html タグの <> を適当な区切り子に置換するなどしてから(sed)、日付の部分だけを切り出す(cut)。同様にして、価格情報が記述された行から価格の数値だけを切り出す、という感じかな。
って、誰に向けて書いてるんだ>私^^。データ分析の前段の「経済情報処理」というのは、こういう地味な作業を指します。誰かが既に準備してくれたデータファイルを、誰かが作ってくれたソフトで加工する作業は、「経済情報処理」とは言いません。