『画本虫撰』日本古典籍データセット(国文研所蔵)

『画本虫撰』日本古典籍データセット(国文研所蔵)

人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)は、情報学・統計学の最新技術を用いて人文学データへのアクセスを改善する研究開発を進めるとともに、オープンサイエンスの考え方に基づき多くの人々が参加できるデータプラットフォームを構築することで、データ駆動型の人文学研究や超学際的な人文学研究など、情報技術を用いた新しい人文学の方法論を開拓します。[もっと詳しく..]

お知らせ

研究員を募集しています!

JADH2018 / TEI2018は、一橋講堂(国立情報学研究所)で開催します。詳細は後日、公開します。

データセット一覧

日本古典籍データセット

歴史的典籍NW事業においてデジタル化された古典籍のうち、主に国文研所蔵本を対象に、画像データと書誌データをセットで公開しています。さらに一部の古典籍には作品紹介や翻刻テキストデータ、タグ情報なども付与しています。

日本古典籍字形データセット

日本古典籍データセットで公開するデジタル化された古典籍を対象に、翻刻テキストの制作過程で生まれるくずし字の切り出された字形と座標情報などを、機械や人間を賢くするための学習データとして提供します。

江戸料理レシピデータセット

日本古典籍データセットに含まれる江戸の料理本を対象に、江戸の料理文化に関するデータとして、翻刻・現代語訳・レシピ化という作業を加えたレシピデータを提供します。

近代雑誌データセット

近代の雑誌を撮影した画像データセットを公開します。n2iプロジェクトでは近代文書を対象としたOCRの研究を進める一環として、近代文書の画像データセットを構築しています。

プロジェクト一覧

ディジタル・シルクロード

情報学と人文学の協働に基づき文化遺産のデジタルアーカイブを構築する、人文情報学(デジタル・ヒューマニティーズ)のプロジェクトです。

華北交通アーカイブ

華北交通の弘報用ストックフォト(華北交通写真)を華北交通が事業を行っていた交通網とリンクさせ、写真のテーマや撮影場所から華北交通の活動を明らかにする研究データベースのプロトタイプ版です。

GeoNLP

文章を自動的に地図化するジオタギングシステムを構築する、地理情報処理(GIS)と自然言語処理(NLP)とを統合したプロジェクトです。

Geoshape

Geoshapeリポジトリは、地物の幾何形状データを公開するデータリポジトリです。1920年以降の市区町村境界の歴史的変遷をウェブ地図上に表示できるデータセットである「歴史的行政区域データセットβ版」などを公開しています。

ソフトウェア一覧

IIIFを用いた画像公開と利用事例

IIIF (International Image Interoperability Framework)を用いた画像の公開と利用について、人文科学から自然科学までの大規模画像データベースを視野に入れた、国際的なコミュニティ活動を推進します。

IIIF Curation Viewer

IIIF Image APIおよびIIIF Presentation APIの機能を活用し、さらにCuration API、Timeline API、Cursor APIという新しい規格を提案、実装したオープンソース(MIT License)の画像ビューアーです。