非営利ニュースルームであるProPubliaがデータストアをオープンしました。ProPublicaはデータジャーナリズムを追及するニュース配信組織であり、オープンデータを利用した徹底的な調査報道を得意としています。
今回オープンしたデータストアでは、ProPublicaが自分たちの調査報道のために利用したデータセットを購入することができます。ProPublicaが使っているデータの多くはオープンデータであり、無償で入手できるものです。しかしオープンデータの多くは扱いにくく、不完全であり、ニュース制作にそのまま使うことができません。
そこでProPublicaはそれらのオープンデータを洗浄し、加工し、補完して、ニュース制作に利用できるレベルにまでデータを作り直しました。ProPublicaが行った作業の中には、WebやPDFからスクレイピングするなども含まれています。
ProPublicaのデータストアでは、ProPublicaがオープンデータをもとに作り直したデータセットが売られています。ProPublicaはデータストアの収益によってデータ加工のコストをカバーしたいと考えています。またデータストアでは、ProPublicaがおおもとのデータ源として使ったオープンデータへのリンクも掲載されており、こちらは無償で入手することができます。
ProPublicaのデータストアで、特に面白いのはその価格設定ポリシーです。例えば、上記のデータセットはジャーナリストであれば200ドルで買えますが、学術研究者は2000ドル支払わなければなりません。学術研究者よりもジャーナリストを優遇している点に、ProPublicaのデータジャーナリズムに対する思いの強さを感じます。
民間企業もProPublicaからデータセットを買うことができます。購入(PURCHASE)をクリックすると民間企業向けの価格問合せフォームが出てきますが、学術研究者よりも安いということはないでしょう。
(東 富彦)
コメントをお書きください