浮世絵顔データセット

浮世絵研究に機械学習やデータサイエンスの方法論を適用し、日本文化に関する新しいデジタル研究基盤を構築します。

ARC浮世絵顔データセット

ARC浮世絵顔データセットは、機械学習を用いて浮世絵から顔領域を自動抽出し作成した、顔に関するデータセットです。立命館大学アート・リサーチセンター(ARC)が国立情報学研究所の情報学研究データリポジトリ(IDR)で公開する「立命館ARC所蔵浮世絵データベース」を対象に、共同研究グループがデータセットを作成しました。以下のGitHubリポジトリ(英語)では、顔のデータセットに加え、画像などのデータをダウンロードし分析するためのスクリプトもあわせて提供します。

GitHub: rois-codh/arc-ukiyoe-faces: ARC Ukiyo-e Faces Dataset

図:データセット中で浮世絵の画像が最も多い10人の作者

2021年6月現在、最新バージョン(v1.0)のデータセットは、 9,203件の浮世絵画像から抽出した16,653件の浮世絵顔データを提供します。

ARC浮世絵顔データセットを活用した研究成果を発表する際には、以下の論文の引用をご検討下さい。

Yingtao Tian, Tarin Clanuwat, Chikahiko Suzuki, Asanobu Kitamoto, "Ukiyo-e Analysis and Creativity with Attribute and Geometry Annotation", arXiv:2106.02267, 2021.

またデータセットをご利用の際には、ライセンス/引用利用ガイドラインなどもご確認ください。

データセットの概要

ARC浮世絵顔データセットは、以下の2種類のデータから構成されています。

メタデータ ARCが、抽出元の画像に対して、書誌情報(作品名,役者,版元,絵師,上演年等)などを含むメタデータを付与したものです。
アノテーションデータ 共同研究グループが、顔領域および顔を構成する部品(目、口、鼻など)の座標データを、機械学習で自動抽出した結果をまとめたものです。

データセットに関わる作成者・貢献者一覧

作成者

共同研究グループ
  • Yingtao Tian (Google Brain Tokyo)
  • Tarin Clanuwat (ROIS-DS Center for Open Data in the Humanities / NII)
  • Chikahiko Suzuki (ROIS-DS Center for Open Data in the Humanities / NII)
  • Asanobu Kitamoto (ROIS-DS Center for Open Data in the Humanities / NII)

貢献者

メタデータおよび画像提供
メタデータ配布

ライセンス/引用

クリエイティブ・コモンズ・ライセンス
ARC浮世絵顔データセット』(Yingtao Tian、ROIS-DS CODH作成、ARCから収集)はクリエイティブ・コモンズ 表示 4.0 国際 ライセンス(CC BY)の下に提供されています。

本データセットを利用した著作物(論文等)には、CC BYライセンスの「表示」として、以下を引用してください。

アノテーションデータを利用する場合

以下を引用してください。

『ARC浮世絵顔データセット』(Yingtao Tian、ROIS-DS CODH作成、ARCから収集), https://doi.org/10.20676/00000394

メタデータや画像を利用する場合

上記に加えて、以下を引用してください。

立命館大学アート・リサーチセンター (2020): ARC所蔵浮世絵データベース. 国立情報学研究所情報学研究データリポジトリ. (データセット). https://doi.org/10.32130/rdata.2.1

なおメタデータは、立命館大学アート・リサーチセンターの許諾に基づき、ARC浮世絵顔データセットに同梱されています。

データセットに関する研究内容を参照する場合

上記に加えて、以下を引用してください。

Yingtao Tian, Tarin Clanuwat, Chikahiko Suzuki, Asanobu Kitamoto, "Ukiyo-e Analysis and Creativity with Attribute and Geometry Annotation", arXiv:2106.02267, 2021.

このデータセットを引用した論文

利用ガイドライン

ARC浮世絵顔データセット(以下、当データセット)は、立命館大学アートリサーチセンターが公開する浮世絵から切り取った顔貌に関するデータを収集し提供するものです。このガイドラインに則った利用をお願いいたします。

  1. 当データセットには、宗教や思想信条、その他の理由で敬意を払われている対象が含まれる場合があります。利用に際しては、多様な価値観を尊重し、敬意を払われている対象を貶めることのないよう注意してください。
  2. 当データセットの原典や原典制作者、原典画像公開者に敬意を払って利用してください。原典制作者や原典画像公開者の貢献を明示することは、画像のオープン化を後押しするにも欠かせないと考えています。
  3. 過去の作品の利用については、Public Domain Usage Guidelines - Europeana Collectionsなども参考にして下さい。

本ガイドラインは善意に基づくものであり、法的なものではありません。

更新情報

2021-06-14

立命館大学アートリサーチセンターから、「ARC浮世絵顔データセット」が人文学オープンデータ共同利用センターより公開されました。という記事が公開されました。

2021-06-07

ARC浮世絵顔データセットを公開しました。