米Yahoo!傘下のFlickrと米Internet Archiveは8月29日(現地時間)、Internet Archiveがデジタル化した書籍から抽出した画像1400万点以上をカタログ化するプロジェクトを発表した。既に約260万点のパブリックドメインの画像をFlickrのInternet Archive Book Imagesで閲覧できる。
Internet Archiveは、誰もが無料で自由に利用できるインターネット図書館構築を目指す非営利団体で、これまでに過去500年以上にわたって出版された著作権の切れた書籍6億ページ以上(容量にして約19ペタバイト)をOCRでPDF化し、Archive.orgで無料で公開している。
Flickrとのプロジェクトでは、この膨大なデータから高精細の画像を抽出し、タグを付けてFlickr上で検索できるようにした。例えば「birds」の検索結果は以下の通り。
画像をクリックすると、その拡大画像とともに、書籍の詳細が表示される。画像の前後500ワード分がその場で読める他、タイトルをクリックすればArchive.orgで書籍を最初から読むことも可能だ。
Flickrは、ビッグデータ解析により、既にデジタル化されていた膨大なデータから世界でも有数の新たな画像ライブラリを構築できたことは注目に値すると説明している。
Internet Archiveは、誰もが無料で自由に利用できるインターネット図書館構築を目指す非営利団体で、これまでに過去500年以上にわたって出版された著作権の切れた書籍6億ページ以上(容量にして約19ペタバイト)をOCRでPDF化し、Archive.orgで無料で公開している。
Flickrとのプロジェクトでは、この膨大なデータから高精細の画像を抽出し、タグを付けてFlickr上で検索できるようにした。例えば「birds」の検索結果は以下の通り。
画像をクリックすると、その拡大画像とともに、書籍の詳細が表示される。画像の前後500ワード分がその場で読める他、タイトルをクリックすればArchive.orgで書籍を最初から読むことも可能だ。
Flickrは、ビッグデータ解析により、既にデジタル化されていた膨大なデータから世界でも有数の新たな画像ライブラリを構築できたことは注目に値すると説明している。
0 comments:
コメントを投稿