卒研メモ:情報学研究データリポジトリ

 ビッグデータ解析というbuzz wordを良く見かけるようになりましたが,肝要なのはデータ解析のための一次データの存在です。ある程度のサンプル数が集まらないとどんな結論でも導くことができる,という事実は統計学の初歩の初歩。更に,個人のデータとなればプライバシーにも配慮する必要がありますから,個人が特定されないようにフィルタを通した統計データが必要になる訳です。一般に「オープンデータ」と呼ばれている公開統計データはこのような処理がされたものを指します。
 県内ではふじのくにオープンデータカタログシズオカオープンデータポータルがありますが,全国規模のオープンデータとしては,国立情報学研究所(NII)が提供する情報学データリポジトリ(IDR)が良いのではないでしょうか。

 ということで,卒研のネタとして,こういうオープンデータを一日一回アクセスして更新を確認し,それを自動的に反映するWebサービスなんてのは如何でしょうか? データを取得する仕組みはWebサーバに備わっているcron(クーロン)が使えますので,ある程度実行テストが進んだ段階で利用を申請して下さい。