1867年11月9日、江戸時代の終わりを象徴する「大政奉還」から、歴史は大きく動きました。あれから150年が経過した2017年。江戸時代260年に関するオープンデータが公開されつつあるいま、人工知能(AI)の最新技術なども活用しながら、かつての江戸の情報空間を現代によみがえらせるプロジェクトを始めます。
歴史的典籍NW事業においてデジタル化された古典籍のうち、主に国文研所蔵本を対象に、画像データと書誌データをセットで公開しています。さらに一部の古典籍には作品紹介や翻刻テキストデータ、タグ情報なども付与しています。
日本古典籍データセットで公開するデジタル化された古典籍を対象に、翻刻テキストの制作過程で生まれるくずし字の切り出された字形と座標情報などを、機械や人間を賢くするための学習データとして提供します。
江戸時代の古典籍はくずし字で書かれていますが、ほとんどの現代の日本人はくずし字が読めません。では人工知能(AI)はくずし字を読めるようになるでしょうか?くずし字に関する大規模な機械学習データセット「日本古典籍くずし字データセット」を広く世界に公開し、AIによるくずし字認識(OCR)の研究開発を促進することで、1000年に及ぶ日本の文字文化を解読するというグランドチャレンジに挑みます。
江戸マップβ版は、国立国会図書館が公開する古地図「江戸切絵図」から地名を抽出して地名データベース化するとともに、現代の地図や情報とも統合することで、歴史ビッグデータや歴史GISの研究や江戸都市空間の地理情報基盤の構築に活用します。
江戸買物案内は、江戸時代に出版された『江戸買物独案内』から広告版面を切り抜くとともに、商人名や職種、居所(住所)、屋号紋などを抽出することで、江戸を中心とする商人に関するビジュアルな商業広告データベースとして構築したものです。
江戸観光案内は、江戸時代に出版された観光ガイドブックから挿絵を収集するとともに、名称やキーワードを付与することで、江戸を中心とする観光に関するビジュアルな名所挿絵データベースとして構築したものです。
江戸時代の200年続いたベストセラーである『武鑑』を網羅的に解析し、江戸時代の大名家や幕府役人に関する人物・地理情報などの中核的情報プラットフォームを構築します。
日本古典籍データセットに含まれる江戸の料理本を対象に、江戸の料理文化に関するデータとして、翻刻・現代語訳・レシピ化という作業を加えたレシピデータを提供します。またこのレシピデータを「クックパッド」にも投稿することで、つくれぽなどを通じた料理創作の輪を広げ、江戸の文化を現代に取り込むきっかけとします。
edomiは江戸に関するデータポータルです。カテゴリごとに様々なデータを公開する予定です。江戸をみせたい人がデータを公開し、江戸をみたい人がデータを活用する。新しいタイプのデータポータルとしてご利用下さい。