『画本虫撰』日本古典籍データセット(国文研所蔵)

『画本虫撰』日本古典籍データセット(国文研所蔵)

人文学オープンデータ共同利用センター(Center for Open Data in the Humanities / CODH)は、情報学・統計学の最新技術を用いて人文学データへのアクセスを改善する研究開発を進めるとともに、オープンサイエンスの考え方に基づき多くの人々が参加できるデータプラットフォームを構築することで、データ駆動型の人文学研究や超学際的な人文学研究など、情報技術を用いた新しい人文学の方法論を開拓します。[もっと詳しく..]

お知らせ

2018-06-18〜23 NIIウィーク期間中に、JAPAN OPEN SCIENCE SUMMIT 2018 - 人文学研究のデジタル化とオープン化およびNIIオープンハウス2018を開催します。

2018-05-23 キュレーションを活用したIIIF検索エンジンのプロトタイプとなるIIIF Curation PlatformおよびIIIF Curation Finderを公開しました。またこのプラットフォームを美術史研究に利用するための顔貌コレクション(顔コレ)も公開しました。

2018-04-27 「武鑑全集」に「紋・道具」を加えました(詳しい説明)。

2018-04-16 カラーヌワット・タリンさんがCODHのメンバーに加わりました。

JADH2018 / TEI2018は、一橋講堂(国立情報学研究所)で開催します。詳細は後日、公開します。

データセット一覧

日本古典籍データセット

歴史的典籍NW事業においてデジタル化された古典籍のうち、主に国文研所蔵本を対象に、画像データと書誌データをセットで公開しています。さらに一部の古典籍には作品紹介や翻刻テキストデータ、タグ情報なども付与しています。

日本古典籍字形データセット

日本古典籍データセットで公開するデジタル化された古典籍を対象に、翻刻テキストの制作過程で生まれるくずし字の切り出された字形と座標情報などを、機械や人間を賢くするための学習データとして提供します。

江戸料理レシピデータセット

日本古典籍データセットに含まれる江戸の料理本を対象に、江戸の料理文化に関するデータとして、翻刻・現代語訳・レシピ化という作業を加えたレシピデータを提供します。

武鑑全集

江戸時代の200年続いたベストセラーである『武鑑』を網羅的に解析し、江戸時代の大名家や幕府役人に関する人物・地理情報などの中核的情報プラットフォームを構築するプロジェクトです。

顔貌コレクション

日本の絵巻物を中心として古今東西の美術作品から顔貌を切り取って収集し、顔の描き方を比較検討する、美術史研究(特に様式研究)のための研究基盤を構築するプロジェクトです。

近代雑誌データセット

近代の雑誌を撮影した画像データセットを公開します。n2iプロジェクトでは近代文書を対象としたOCRの研究を進める一環として、近代文書の画像データセットを構築しています。

プロジェクト一覧

ディジタル・シルクロード

情報学と人文学の協働に基づき文化遺産のデジタルアーカイブを構築する、人文情報学(デジタル・ヒューマニティーズ)のプロジェクトです。

Edo+150プロジェクト

1867年11月9日、江戸時代の終わりを象徴する「大政奉還」から、歴史は大きく動きました。あれから150年が経過した2017年。江戸時代260年に関するオープンデータが公開されつつあるいま、人工知能(AI)の最新技術なども活用しながら、かつての江戸の情報空間を現代によみがえらせるプロジェクトを始めます。

くずし字チャレンジ!

江戸時代の古典籍はくずし字で書かれており、現代の日本人でそれをすらすら読める人は限られています。では人工知能(AI)を学習させれば、くずし字を読めるようになるのでしょうか?くずし字の大規模な学習データセット「日本古典籍字形データセット」を広く世界に公開し、みんなの力で「くずし字×AI」というグランドチャレンジに挑みます。

華北交通アーカイブ

華北交通の弘報用ストックフォト(華北交通写真)を華北交通が事業を行っていた交通網とリンクさせ、写真のテーマや撮影場所から華北交通の活動を明らかにする研究データベースのプロトタイプ版です。

GeoNLP

文章を自動的に地図化するジオタギングシステムを構築する、地理情報処理(GIS)と自然言語処理(NLP)とを統合したプロジェクトです。

Geoshape

Geoshapeリポジトリは、地物の幾何形状データを公開するデータリポジトリです。1920年以降の市区町村境界の歴史的変遷をウェブ地図上に表示できるデータセットである「歴史的行政区域データセットβ版」などを公開しています。

ソフトウェア一覧

IIIFを用いた画像公開と利用事例

IIIF (International Image Interoperability Framework)を用いた画像の公開と利用について、人文科学から自然科学までの大規模画像データベースを視野に入れた、国際的なコミュニティ活動を推進します。

IIIF Curation Viewer

IIIF Image APIおよびIIIF Presentation APIの機能を活用し、さらにCuration API、Timeline API、Cursor APIという新しい仕様を提案・実装した、オープンソースのIIIF画像ビューアーです。

IIIF Curation Finder

IIIF Curation Viewerなどで作成したキュレーションを検索するとともに、新たなキュレーションを再編集して公開できる、オープンソースのIIIF画像検索ツールです。

JSONkeeper

A flask web application for storing JSON documents; with some special functions for JSON-LD.

Canvas Indexer

A flask web application that crawls Activity Streams for IIIF Canvases and offers a search API.