価格崩落現象のデータ

深夜に、家族の一人がいないことに気づく^^。探しに出たが見つからないので、交番に駆け込んだ。やさしいおまわりさんばかりで、本署にまで手配してくれて、なおかつ若い一人がすぐに飛び出して、一緒に探してくれた。ありがとう、日本の警察。警察と消防のありがたみが心にしみる今日この頃です^^。

ところで、日進月歩で進化する商品の値動きはすさまじい。たとえば↓に記したニコンのデジタル一眼レフ(D300)の場合、価格.comの記録をたどると、228,000円(2007年8月24日)→ 184500円(2008年1月1日)→ 159800円(2008年7月1日)→ 134000円(2008年12月24日)。D700もおなじ道を歩んでほしいと願う私です^^。

価格.com では、各商品の価格(最安値)を過去にさかのぼって調べることができる。こんな風に、前日から一年以上前までの毎日の値動きを表示してくれる。ただし、1ページ(Webページ)に数日分の表示しかしてくれないので、調べるのが面倒。たとえば D300 の場合には、昨年の発売開始から今年の年末まで、77ページにもわたって、値動きのデータがおさめられている。そこで・・・

これら 77ページにアクセスして、各ページに含まれる全ての日付と価格データを取り出し、ひとつの CSV ファイルにまとめよ
というのは、プログラミング(シェルスクリプト)の練習問題になるかしらん^^。while ループで 1 ページずつ反復処理。1ページ分を丸ごとダウンロード(wget)した後に、正規表現で日付を含む行を取り出し(grep)、html タグの <> を適当な区切り子に置換するなどしてから(sed)、日付の部分だけを切り出す(cut)。同様にして、価格情報が記述された行から価格の数値だけを切り出す、という感じかな。

って、誰に向けて書いてるんだ>私^^。データ分析の前段の「経済情報処理」というのは、こういう地味な作業を指します。誰かが既に準備してくれたデータファイルを、誰かが作ってくれたソフトで加工する作業は、「経済情報処理」とは言いません。

このブログ記事について

このページは、eiichiが2008年12月25日 02:02に書いたブログ記事です。

ひとつ前のブログ記事は「クリスマスの買い物」です。

次のブログ記事は「年の瀬に、消費税」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja