Unixコマンドでデータ処理(対韓貿易収支)

原稿をしあげるために^^隠遁生活に突入・・・のつもりだったが、やっぱり世間の動きが気になってテレビやネットから逃れられない(【尖閣上陸「違法」逮捕で日本政府へ賠償請求】に腹をかかえて大爆笑、【韓日スワップ中断でも我が国には影響なし】ホントならそれでいいじゃん、とか^^)。気が散って一向に捗らないので、気晴らしに、以前から気になっていた日韓貿易収支のデータを調べてみた。

対韓貿易収支は、総額では2〜3兆円の「慢性的な」黒字だが、2011年中に輸出超(黒字)と輸入超(赤字)の額がめぼしい業種(大分類)をとりだしてみた(縦軸の単位は10億円、2011年の貿易収支トータルは2.2兆円の黒字)。数十年来の「トライアングル構造」(なつかしい響き^^)が見えてくる。つまり、日本製の機械や部品や素材を使って、韓国は最終財を作り、諸外国に売りさばく。

* 韓国から世界への輸出が1%増えると、韓国の日本からの輸入は0.99%増えるという単純推計もある(日韓経済関係の基礎資料(ジェトロ)、自分で確認してみるほどヒマではないが・・・)。まぁ、韓国は相変わらずの「お客さん」と言えるのかな。ちなみに、所得収支も1724億円の黒字だが、サービス収支だけはトータルで3634億円の赤字(財務省地域別国際収支)。韓流サービスはたしかに日本で稼いでいる。サービス収支の内訳は財務省統計ではいまひとつ不明だが、旅行収支が1100億円の赤字、「文化・興行」はこれより大きい赤字だろう。ただし、特許使用料収入等は600億円ほどの黒字であり、ジェトロの資料でも技術貿易は日本の600億円ほどの黒字(※2006年)となっている。

なお、このグラフの元データは、財務省貿易統計サイトの国別概況品別表である。こちらから入って、2011年12月分の輸出表と輸入表、それぞれのcsvファイルをダウンロードする。少々煩雑そうにみえるcsvファイルだが、以下のようなコマンドでカンタンに処理できる。

awk '{if($4==103) print $1,$3,$7;}' export.csv > ex.csv
!!:gs/ex/im
cat ex.csv im.csv | sort -k2,2 > t.csv
awk '{if(substr($2,2,1)==" ") print $1,$2,$3}' t.csv | paste -d , - - | awk '{print $2,$3-$6}' > t1.csv

財務省のサイトからダウンロードしてきた元のファイルは export.csv と import.csv のふたつ。これらから対韓国分(国コード103)だけをぬきだし(1行目と2行目)、ふたつのファイルを連結して品目コード別にレコードを並べ替え(3行目)、コード番号1桁の大分類品目のみぬきだして同一品目の輸出額と輸入額を1行にまとめた上で、品目ごとの貿易収支を計算して書き出す(4行目)。

最近は官庁統計もずいぶんと整備されてきたが、こうした技法はいぜん(ますます)有用だ。たとえば、韓国だけなら手作業でなんとかできても、世界の他のいろんな国についても同様のグラフを描きたいという場合を想像すればよい。上のスクリプトなら、国コード番号をかえて繰り返し適用するだけで済む。官庁統計にかぎらず、ネットにあふれるさまざまなデータを効率的に処理するために欠かせない道具だと思う(んだけど、なかなか講義などではね・・・)。

このブログ記事について

このページは、eiichiが2012年8月18日 19:13に書いたブログ記事です。

ひとつ前のブログ記事は「反日有理愛国無罪?」です。

次のブログ記事は「波及効果のまやかし(2)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

月別 アーカイブ

ウェブページ

Powered by Movable Type 5.13-ja