ニュース

2024年 | 2023年 | 2022年 | 2021年 | 2020年 | 2019年 | 2018年 | 2017年 | 2016年

2024年

2024-01-24

加藤幹治特任研究員が、iOSアプリ「GuiKey」をリリースしました。グイ語・ガナ語キーボードをiPhoneにインストールするためのアプリケーションです。

グイ語とガナ語(コエ・クワディ語族)はボツワナで話される言語です。四種類の舌打ち音(吸着音)と声調を持っており、音の体系が複雑です。これらの言語は長い間文字を持ちませんでしたが、JSPS科研費 JP22K18249 カラハリ狩猟採集民の持続可能な識字活動の基盤プロジェクトではこれらの言語の正書法を考案し、Unicodeに収録されている文字で母語話者が自らの言語を綴れるようにしました。GuiKeyはそのプロジェクトの一環として開発され、iPhoneでグイ語・ガナ語を入力できるようになりました。

2024-01-04

本センターに関する研究内容がメディアで紹介されました。

  1. 古文書解読をAIが支援、人文学研究のDXが生み出すモノ, ニュースイッチ, 日刊工業新聞, 2024-01-04

2023年

2023-12-30

小川潤特任研究員が、人文科学とコンピュータシンポジウム じんもんこん2023のベストインタラクティブ発表賞を受賞しました。

歴史マイクロナレッジの提唱とHIMIKO(Historical Micro Knowledge and Ontology)システムの実装
小川 潤(ROIS-DS人文学オープンデータ共同利用センター), 北本 朝展(ROIS-DS人文学オープンデータ共同利用センター), 大向 一輝(東京大学)

関連する研究成果は、第1回 ヒストリーテック勉強会でも報告しています。

2023-12-26

メモリーグラフのAndroid版とiOS版のアプリをバージョン1.3に更新しました。またメモグラ・マネージャおよびメモグラ・ビューアを公開しました(ニュース | メモリーグラフ)。

2023-12-06

そあん(soan)を更新しました。まず、そあん(soan)ライブラリをバージョン1.1に更新し、料紙選択機能の追加や連綿活字の選択ロジックの改善、変体仮名の使い分けロジックの改善などを行いました。また、専門家の高度なニーズに応えるために、そあん(soan)プロフェッショナル版(@2SC1815J氏作成)を公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、現代日本語を古活字(くずし字)に変換するサービス「そあん(soan)プロフェッショナル版」を公開, カレントアウェアネス, 2023-12-13

2023-11-14

近代建築WEEK2023 三条通の近代洋風建築群 -デジタル技術に触れて楽しむ-にて、メモリーグラフを活用したイベント「スマホで三条 まちなみの変遷発見ラリー」を開催します。 このイベントはDS公募型共同研究の一環として開催するものです。

2023-11-02

歴史×技術の出会いの場として、第1回ヒストリーテック勉強会を11月22日にオンラインで開催します。参加無料です。

2023-10-18

平凡社地図出版との協働に基づき、Geoshapeリポジトリにて、以下のデータセットを公開しました。

  1. 『日本歴史地名大系』地名項目データセット
  2. 『日本歴史地名大系』行政地名変遷データセット

また、これに合わせて歴史的行政区域データセットβ版を更新するとともに、歴史地名に関する情報を集約したれきちめ:日本歴史地名統合データベースを公開しました。

詳しい内容につきましては、以下のプレスリリースをご覧ください。

  1. 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~, 国立情報学研究所
  2. 【プレスリリース】歴史的地名の「行政区画変遷」を大規模オープンデータ化(CODH), 情報・システム研究機構 データサイエンス共同利用基盤施設

また以下のメディアで紹介されました。

  1. 歴史的地名の「行政区画変遷」をオープンデータとして公開~ROIS-DSと平凡社地図出版 「日本歴史地名体系」の機械可読データ化に向けた協働を推進, INTERNET Watch, 2023-10-19
  2. 人文学オープンデータ共同利用センター(CODH)と平凡社地図出版、歴史的地名の行政区画変遷に関するオープンデータを公開:『日本歴史地名大系』の機械可読データ化に向けた取組の一環として, カレントアウェアネス, 2023-10-19
  3. 古い地名を地図にまとめた「日本歴史地名大系」がお披露目 ~自由に使えるオープンデータ 平凡社の協力で79,502件ものデータを提供中。地名分布で当時の状況がうかがえる, やじうまの杜 - 窓の杜, 2023-10-20
  4. 歴史的地名の「行政区画変遷」を大規模オープンデータ化, 科学新聞, 2面, 2023-10-27
  5. 江戸時代のビッグデータで災害分析/北本朝展 人文学オープンデータ共同利用センター長, 建設通信新聞Digital, 2023-12-12
  6. 【江戸時代のビッグデータで災害分析】北本朝展 人文学オープンデータ共同利用センター長, 建設通信新聞Digital, 2024-03-01

2023-10-03

古活字プロジェクトの成果として、『古活字データセット』を公開しました。

2023-09-29

武鑑全集の藩 経時データに、津山、川越、会津、飯野、宇和島、熊本、谷田部の7家のデータを追加し、合計18家となりました。またこれまで「大名家」という表現を用いていたページについて、「藩」の方が適切なページは表現の変更を行いました。

2023-09-01

関東大震災100年を機に、江戸・東京の過去の大災害「1855年安政江戸地震」などの災害記録を収集した江戸・安政災害キュレーションを公開しました。また災害記録を江戸マップβ版と対応付け、現代地図上にマッピングしたedomi 災害も公開しました。

2023-08-07

そあん(soan):現代日本語を古活字(くずし字)に変換するサービスおよびそあん(soan):現代日本語を古活字(くずし字)で描画するライブラリを公開しました。また「そあん」の応用例として、edomi ニュースおよびedomi 学びを公開しました。

  1. テキストを古活字(くずし字)に変換できる「そあん(soan)」が登場したので現代の文章を趣深い見た目に変換してみた, GIGAZINE, 2023-08-08
  2. 現代日本語を江戸のくずし字に変換する「そあん(soan)」公開, ケータイ Watch, 2023-08-11
  3. 文章を古活字(くずし字)に変換できる生成ツール「そあん(soan)」に注目、日本の美しいくずし字を再現!, MdN, 2023-08-14
  4. 人文学オープンデータ共同利用センター(CODH)、現代日本語を古活字(くずし字)に変換するサービス「そあん(soan)」を公開, カレントアウェアネス, 2023-08-14
  5. ROIS-DS人文学オープンデータ共同利用センターから、現代日本語を古活字(くずし字)に変換するサービス「そあん(soan)」が公開されました。, 国文学研究資料館, 2023-08-17
  6. Generating Kuzushiji Images with Soan, The Digital Orientalist, 2023-09-19
  7. 国文研 千年の旅 素庵の書体へ 憧れ今も, 読売新聞, 朝刊28面, 2023-09-27

2023-07-15

レ アィン ドゥック特任助教が本日付でCODHを退職しました。8月からはFJP株式会社のSenior Data Scientistとなります。2018年7月から5年間、ありがとうございました。

2023-07-13

Kindai-OCRをバージョン2に更新し、ディープラーニング(Transformer)の導入により認識精度が向上しました。またKindai-OCRやその他の機械学習に利用できる近代雑誌OCR学習用データセットも公開しました。4,935文字種、1,472,004文字のテキストを含む、画像データ1,985コマから切り出した59,465行のデータセットです。

  1. 人文学オープンデータ共同利用センター(CODH)、近代雑誌OCR学習用データセットを公開:Kindai OCRはバージョン2に更新, カレントアウェアネス, 2023-07-31

2023-07-03

「つくし」プロジェクトのページを公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「つくし」プロジェクトのページを公開:くずし字資料の自動テキスト化、現代文・英語翻訳などの可能性を探る, カレントアウェアネス, 2023-07-12
  2. 生成AIを用いて古典資料を現代語訳、難関の「くずし字」を解読する鍵は?, 日経クロステック, 2023-09-01

2023-07-01

加藤幹治特任研究員が、沖縄言語文化研究センターの2023年度仲宗根政善記念研究奨励賞を受賞しました。 受賞対象の論文は、 「Sketch grammar of the Isen dialect of Tokunoshima, Amami」、 「奄美語徳之島伊仙町方言のモノローグ談話資料:クガニナラシ(黄金生らし)」などです。

  1. 加藤 幹治 特任研究員(データサイエンス共同利用基盤施設人文学オープンデータ共同利用センター)が2023年度仲宗根政善記念研究奨励賞を受賞
  2. 【受賞のお知らせ】2023年度仲宗根政善記念研究奨励賞を受賞(CODH)

2023-06-28

メモリーグラフ - 同一構図撮影を支援するカメラアプリをバージョン1.1に更新しました。

2023-04-19

武鑑全集の大名家経時データに、佐賀、広島、福岡、彦根、仙台、松江、高松の7家のデータを追加し、合計11家となりました。

2023-03-30

歴史的行政区域データセットβ版などを大規模に更新しました。詳しくはGeoshapeニュースをご覧ください。

2023-03-14

メモリーグラフ - 同一構図撮影を支援するカメラアプリを正式公開しました。アプリの利用は無料です。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。

2023-03-10

篆書字体データセットがメディアで紹介されました。

  1.  銀シャリ橋本の〇〇WORLD(まるまる わーるど), eo光チャンネル, 2023-03-06

2023-02-14

みを(miwo):AIくずし字認識アプリに関する記事が公開されました。

  1. 無料AIアプリ「みを」でくずし字を読もう!使い方と注意点, 今日から江戸日和, 2023-02-14
  2. 大学アプリレビューvol.24 撮影するだけ!いつでもどこでもくずし字を認識してくれるAIアプリ「みを(miwo)」, ほとんど0円大学, 2023-03-14

2023-02-01

王小醒さんが特任研究員としてCODHのメンバーに加わりました。

2023-01-21

vdiff.jsを活用したアプリとして、差読のための画像照合サービス(ブック版)ビフォーアフター比較(今昔写真)のための画像照合サービスを公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「差読のための画像照合サービス(ブック版)」と「ビフォーアフター比較(今昔写真)のための画像照合サービス」を公開, カレントアウェアネス, 2023-02-02

2022年

2022-12-31

みを(miwo):AIくずし字認識アプリに関する記事が公開されました。

  1. 刀の鐔に書かれた文字を解読できる!くずし字認識アプリ「miwo」が話題, オトナライフ, 2022-12-31
  2. “刀剣のつば”に書かれた崩し字をスマホアプリで解読 「武士の思い」までスキャンしたツイートが話題に, ねとらぼ, 2023-01-13

2022-12-20

カラーヌワット・タリン元CODH特任助教が、文部科学省科学技術・学術政策研究所「ナイスステップな研究者」に選定されました。

科学技術イノベーションの様々な分野において活躍し、日本に元気を与えてくれる研究として、「AIによるくずし字認識技術の開発と社会への展開」が評価されました。

  1. 「科学技術への顕著な貢献2022(ナイスステップな研究者)」の選定について
  2. カラーヌワット・タリン元NII特任研究員が文部科学省科学技術・学術政策研究所の「ナイスステップな研究者」に選定
  3. 「みを:AIくずし字認識アプリ」に関するプレスリリース

2022-11-28

みを(miwo):AIくずし字認識アプリに関する記事が公開されました。

  1. 崩し字読み解いて達成感 博物館や寺社、掛け軸の書, 伊勢新聞, 6面, 2022-11-24
  2. 崩し字読解 楽しもう 活字変換するアプリも, 秋田魁新報, 7面, 2022-11-28
  3. 崩し字読み解き達成感 入門書やAIアプリ開発も, 福島民報, 7面, 2022-11-28
  4. 崩し字読み解いて達成感 入門書やアプリ無料公開も, 高知新聞, 16面, 2022-12-01
  5. 崩し字読み解き達成感 掛け軸なんて書いてある? 奥深い世界パズル感覚で, 宮崎日日新聞, 8面, 2022-12-05
  6. 崩し字読み解き達成感 筆書きの掛け軸などの書 無料公開の認識アプリも, 埼玉新聞, 13面, 2022-12-05
  7. 崩し字読み解き挑戦しよう 博物館の掛け軸、古文書、意味が分かれば 入門書や変換アプリも活用を, 神戸新聞, 16面, 2022-12-09
  8. 崩し字を読み解く 1文字でも読めたら達成感 AIアプリ開発、無料で公開, 京都新聞, 夕刊2面, 2022-12-12
  9. 崩し字 楽しく読み解く 基の漢字突き止め/AI認識アプリも, 北海道新聞, 14面, 2022-12-13
  10. 崩し字 読み解く楽しみ 筆書きの多様な字体奥深い世界 入門書やアプリ使い「達成感を」, 信濃毎日新聞, 15面, 2022-12-13
  11. 崩し字読んで達成感 日本語の文字の歴史 同じ漢字でも多様な字体, 茨城新聞, 14面, 2022-12-14
  12. 「崩し字」読む楽しさ 掛け軸や古文に親しむ 活字に変換してくれるアプリも, 日本海新聞, 7面, 2022-12-16
  13. 「崩し字」読む楽しさ 掛け軸や古文に親しむ 活字に変換してくれるアプリも, 大阪日日新聞, 2022-12-16
  14. 崩し字読み解く楽しみ 入門書でこつ習得/翻訳にAIアプリ, 山梨日日新聞, 11面, 2022-12-19
  15. 崩し字読めたらいいな 入門書・AIアプリがお助け, 中國新聞, 17面, 2022-12-22
  16. 「崩し字」読み解いて達成感 書き込んで理解、AIアプリで手早く, 大分合同新聞, 2022-12-22
  17. 崩し字読み解く楽しみを 日本語の歴史思い致して 本やAIアプリ利用, 山陽新聞, 13面, 2022-12-27
  18. 崩し字読み解き達成感 博物館や寺社、掛け軸の書 AIアプリも開発, 山陰中央新報, 8面, 2022-12-30
  19. 崩し字 解く楽しみを 博物館の掛け軸 入門書やアプリ手助け, 岩手日報, 10面, 2023-01-05
  20. 崩し字読み解く達成感 「変体仮名」解説本やAIアプリ, 東奥日報, 9面, 2023-01-09
  21. 崩し字読み世界広げる 筆書きの古文書や掛け軸 入門書で第一歩AIアプリ登場, 上毛新聞, 11面, 2023-01-09

2022-11-25

デジタルアーカイブ学会第4回学会賞が発表されました。CODHの研究成果として、「IIIF Curation Platform」と「みを(miwo):AIくずし字認識アプリ」の2件が、学術賞(基盤・システム)を受賞しました。それぞれの授賞理由につきましては、「IIIF Curation Platform」と「みを(miwo):AIくずし字認識アプリ」をご覧下さい。

  1. 北本 朝展教授(コンテンツ科学研究系)らの研究成果「みを(miwo):AIくずし字認識アプリ」がデジタルアーカイブ学会第4回学会賞の学術賞(基盤・システム)を受賞
  2. 北本 朝展教授(コンテンツ科学研究系)らの研究成果「IIIF Curation Platform」がデジタルアーカイブ学会第4回学会賞の学術賞(基盤・システム)を受賞

2022-10-31

DS施設公募型共同研究の成果として、シルクロード遺跡データベースのシステムとデータを更新しました。従来から運用していたマッピニングを遺跡データベースに統合するとともに、シルクロード地名集も内容を大幅に修正して地名数が24,139件となりました。

2022-10-30

AIくずし字OCRサービスに関する記事が公開されました。

  1. Kuzushiji: Wie eine KI die japanischen Literaturarchive entschlüsselt, Süddeutsche Zeitung, 2022-10-30

2022-10-28

近代雑誌データセットで、『国民之友(第141号-第254号)』の画像を公開しました。

2022-10-26

みを:AIくずし字認識アプリに関するプレスリリースを発行しました。詳細:くずし字チャレンジ!

  1. 【プレスリリース】世界初のAIくずし字認識アプリ「みを(miwo)」が2022年度グッドデザイン賞を受賞(CODH), 情報・システム研究機構 データサイエンス共同利用基盤施設
  2. 世界初のAIくずし字認識アプリ「みを(miwo)」が2022年度グッドデザイン賞を受賞~くずし字教育や古文書による地域史料調査などにも貢献~, 国立情報学研究所
  3. 世界初のAIくずし字認識アプリ「みを(miwo)」が2022年度グッドデザイン賞を受賞 くずし字教育や古文書による地域史料調査などにも貢献, PR TIMES

また以下のメディアで紹介されました。

  1. 「くずし字」をすぐに現代日本語の文字に変換する AIくずし字認識アプリ「みを(miwo)」, Webマガジン「AXIS」, 2022-10-28
  2. 【情報シス機構】AIくずし字認定アプリがグッドデザイン賞受賞, 官庁通信社, 2022-10-31
  3. 利用広がる世界初のAIくずし字認識アプリ, 科学新聞 2面, 2022-11-11

2022-10-20

れきすけ」が、以下のブログ記事に取り上げられました。

  1. いつか無くなってしまうかもしれない ―歴史資料に関する知識と経験の共有システム「れきすけ」に思うこと―, 日本科学未来館 科学コミュニケーターブログ, 2022-10-20

2022-10-10

武鑑全集では、経時的差分翻刻による江戸200年参勤交代データセットの構築を進めています。

  1. 人文学オープンデータ共同利用センター(CODH)、「武鑑全集」の「大名家経時データ」を公開, カレントアウェアネス, 2022-10-17

2022-10-07

みを:AIくずし字認識アプリが、2022年度グッドデザイン賞を受賞しました。

  1. 2022年度グッドデザイン賞発表:図書館・博物館・美術館も受賞, カレントアウェアネス, 2022-10-12

2022-10-05

DS施設公募型共同研究や科学研究費の支援を受け、CODHの歴史ビッグデータの一部として構築を進めている、デジタル台風:地上気象観測原簿アーカイブの公開範囲を大幅に拡大しました。現在の画像枚数は4,890,691枚です。

2022-10-02

IIIF Curation Viewerのバージョン1.14を公開しました。

2022-10-01

加藤幹治さんが特任研究員としてCODHのメンバーに加わりました。

2022-09-02

特任研究員募集を開始しました。

2022-08-11

篆書字体データセットについて、176文字分の画像データが正しく処理できていなかった問題を修正しました。その他の問題も修正した結果、文字数は181,084となりました。

2022-08-10

AI顔貌検出サービスを公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「AI顔貌検出サービス」を公開, カレントアウェアネス, 2022-08-16

2022-07-18

edomiのコンテンツとして、新たに経路を追加しました。人々の移動経路を記録した資料から、日時と地名を抽出して構造化データを作成し、地図上に移動経路を可視化できます。またマップについても、地名の種類に基づく絞り込みを可能としました。

2022-07-14

IIIF Curation Viewerのバージョン1.12を公開しました。

2022-07-11

IIIF Curation Viewer Embeddedのバージョン1.3を公開しました。

2022-06-22

本センターに関する研究内容がメディアで紹介されました。

  1. くずし字認識アプリ『みを』で江戸時代の数学書『塵劫記』を読む, デイリーポータルZ, 2022-06-22
  2. Kuzushiji recognition with AI, Fontstand News, 2022-06-28
  3. 江戸時代の国語辞典には人相占いがある, デイリーポータルZ, 2022-07-13
  4. 新潟県村上市あらかわ地区まちづくり広報誌「あらかわらばん」第57号, 2022年7月号

2022-06-21

DH 2022東京 記念レクチャーシリーズ/第17回CODHセミナー - 歴史ビッグデータ - THE DARK MATTER OF HISTORYの参加登録を開始しました。

2022-05-13

本センターに関する研究内容がメディアで紹介されました。

  1. AIくずし字認識アプリ「みを」が拓く未来, 歴史研究, 78-85ページ, 第700号, 2022年5月

2022-05-10

篆書字体データセットのバージョン2を公開しました。国立国会図書館、京都大学人文科学研究所、早稲田大学図書館が所蔵する5点の資料を追加し、文字種は7,681→13,213に、文字数は106,448→180,898へと増えました。

2022-04-28

特任研究員募集を開始しました。

2022-04-27

vdiff-seq.jsのバージョン1.1を公開し、「比較結果の合わせ直し」および「関連情報」機能を追加しました。このバージョンは武鑑全集 差読(Differential Reading)プラットフォーム 同一板木追跡にも適用しています。

2022-04-22

AIくずし字認識アプリ「みを(miwo)」が、2021年度VLED勝手表彰 優秀賞を受賞しました。

  1. Code for Japan、2021年度のオープンデータ・ビッグデータに関する優れた取り組みの表彰を行う「勝手表彰」受賞者を発表, Code for Japan, 2022-04-22
  2. オープンデータ/ビッグデータの優れた取り組みを「勝手表彰」、Code for Japanが2021年度の受賞者発表, INTERNET Watch, 2022-04-25

2022-04-12

IIIF Curation Viewerのバージョン1.11を公開し、IIIFマニフェストURLのペーストに対応しました(参考:リリース一覧)。

2022-04-04

第16回CODHセミナー 「まち」や都市のデジタルアーカイブ - 歴史ビッグデータと実世界での利活用の講演資料と記録映像を公開しました。

2022-04-01

小川潤さんが特任研究員としてCODHのメンバーに加わりました。

2022-03-31

鈴木親彦特任助教が本日付でCODHを退職しました。4月からは群馬県立女子大学文学部総合教養学科の准教授となります。2017年4月から5年間、ありがとうございました。退職に関するツイート

2022-03-25

顔貌コレクション(顔コレ)のデータを更新し、作品数が99→108、顔貌数が8845→9675に増加しました。

2022-03-24

ウェブページ埋め込み型のシーケンス画像比較ツールvdiff-seq.jsを公開しました。またvdiff-seq.jsが用いているウェブページ埋め込み型の画像比較ツールvdiff.jsも改良しました。

2022-03-22

GeoLODをバージョンアップしました。新たに追加されたクラウド辞書構築機能は、GeoLOD上で地名語辞書を共同編集する機能です。その他にも地名検索機能の強化や表示方法の改善などを行いました。

2022-03-16

日本政府の公式SNS(ツイッター、フェイスブック)で、AIくずし字認識アプリ「みを」が紹介されました。

  1. The Gov't of Japan (@JapanGov)
  2. japan (@japan)
  3. Japan - The Government of Japan

2022-03-14

欧州特許庁(EPO)の「Patent Knowledge News」で、江戸料理レシピの黄身返し卵が紹介されました。

  1. EPO - Patenticulars, European Patent Office (EPO), 2022-03-14

2022-02-01

GeoNLPを更新し、GeoNLP v2.1をリリースしました。

2022-01-31

本センターに関する研究内容がメディアで紹介されました。

  1. 人文学のAI活用広がる くずし字解読、絵画資料分析も, 日本経済新聞, 2021-01-31

2022-01-28

シルクロード遺跡データベースに関する論文、カード単位の照合エビデンスを共有するシルクロード考古遺跡情報の統合データベースが、人文科学とコンピュータシンポジウム「じんもんこん」2021の最優秀論文賞を受賞しました。このデータベースは、IIIF Curation Platformvdiff.jsなど、CODHの研究成果も多数活用しています。

2022-01-04

顔貌コレクション(顔コレ)に関する研究内容がメディアで紹介されました。

  1. 絵巻物の「顔」大量収集 データ化で描き方分析 研究者の知恵集積へ, 福島民報, 12面, 2021-10-26
  2. 絵巻物の「顔」大量収集 描き方研究の手掛かりに データ共同利用センターが公開, 河北新報, 11面, 2021-10-30
  3. 近世絵巻物の「顔」データ化 大量の画像 美術史研究の手掛かりに AIで収集効率アップ ネットで公開, 北海道新聞, 夕刊2面, 2021-10-30
  4. 絵巻物の「顔」データ化 ネット公開 美術研究に活用, 山梨日日新聞, 18面, 2021-11-02
  5. 顔貌コレクション「顔コレ」 美術史研究に活用, 神戸新聞, 6面, 2021-11-06
  6. 絵巻物の「顔」大量収集 作品読み解くツールに, 中國新聞, 13面, 2021-11-07
  7. 絵巻物の「顔」大量収集 データ化で描き方研究 AIで作業効率向上も, 中部経済新聞, 7面, 2021-11-08
  8. 絵巻物の「顔」データ化 美術史研究 作品読み解くツールに 人文学センターネット公開, 熊本日日新聞, 15面, 2021-11-19
  9. 絵巻物の「顔」大量データ化 美術史研究へネット共有 AIで効率向上期待, 高知新聞, 20面, 2021-12-12

2021年

2021-12-27

歴史的行政区域データセットβ版を更新しました。詳しい内容はリンク先をご覧下さい。

2021-12-10

vdiff.jsのバージョン1.3を公開しました。Viewerの比較手法に「並列表示」を追加し、2枚の画像を左右に並べて比較できるようにしました。

この機能は、本日リリースしたシルクロード遺跡データベースディジタル・シルクロード・プロジェクト)でも活用しています。例えばMurtuk ruins M.C.I/烏江不拉克寺院の画像照合では、100年前の古写真と現代の写真との照合結果の表示に、vdiff.jsの並列表示を活用しています。

  1. 国立情報学研究所(NII)のディジタル・シルクロード・プロジェクト、新たな「シルクロード遺跡データベース」を公開, カレントアウェアネス, 2021-12-10

2021-11-19

特任研究員募集が始まりました。締切は2022年1月10日です。積極的なご応募をお待ちしております!

2021-11-19

CODHが公開するvdiff.jsを活用したサービスとして、東大総合図書館からデジタル源氏物語「挿絵画像の比較」が公開されました。同様の画像比較は差読(Differential Reading)のための画像照合サービスでも簡単に試せますので、どうぞご活用下さい。

2021-11-11

vdiff.jsをバージョン1.2に更新し、強調表示アルゴリズムを改善しました。

2021-11-08

差読(Differential Reading)のための画像照合サービスを公開しました。またこのサービスの基盤となるvdiff.jsをバージョン1.1に更新しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「差読のための画像照合サービス」を公開, カレントアウェアネス, 2021-11-09

2021-10-29

リニューアルしたInternational Image Interoperability Framework (IIIF)の公式サイトのデモページ(Contextualize with annotations)に、IIIF Curation Viewerを用いたKuroNetくずし字認識サービスが紹介されました。

2021-10-21

武鑑全集の献上品/拝領品/時献上 一覧を公開しました。これは江戸時代の各地の名産品のデータベースとしても使えます。より詳しくは献上品/拝領品/時献上一覧の公開をご覧下さい。

  1. 人文学オープンデータ共同利用センター(CODH)、「武鑑全集」の「献上品/拝領品/時献上 一覧」を公開, カレントアウェアネス, 2021-10-27

2021-10-07

本センターの研究内容がメディアで紹介されました。

  1. 源氏物語が好きすぎてAIくずし字認識に挑戦でグーグル入社 タイ出身女性が語る「前人未到の人生」, Ledge.ai, 2021-10-07
  2. 源氏物語も春画の文字も読めちゃう!AIくずし字認識アプリ「みを(miwo)」開発者インタビュー, 和樂web, 2021-10-19

2021-09-30

本センターの研究内容がメディアで紹介されました。

  1. KaoKore: Exploring the Intersection of Humanities and ML Research through a Japanese Art Dataset, Google People + AI Research, 2021-09-30

2021-08-31

カラーヌワット・タリン特任助教が本日付でCODHを退職しました。9月からはGoogle BrainのSenior Research Scientistとなります。2018年4月から3年4か月の間、ありがとうございました。退職に関するツイート

2021-08-30

みを(miwo) - AIくずし字認識アプリを公開しました。アプリの利用は無料です。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。なお、アプリのより詳しい情報につきましては、みを(miwo)とは?をご覧下さい。

  1. 人文学オープンデータ共同利用センター(CODH)、AIくずし字認識アプリ「みを(miwo)」を公開, カレントアウェアネス, 2021-08-30
  2. 機械学習で古文書のくずし字を読み取れるアプリ「みを」、正式公開, ケータイ Watch, 2021-08-31
  3. AIで古典のくずし字を現代の文字に1枚あたり数秒で変換する無料アプリ、開発者はタイ出身の研究者, ledge.ai, 2021-08-31
  4. AIで“くずし字”を解読するスマホアプリが無料公開 コンペ1位の認識モデル採用, ITmedia NEWS, 2021-08-31
  5. 江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開, TechCrunch Japan, 2021-08-31
  6. AIくずし字認識アプリ「みを(miwo)」を使ってみた, GIGAZINE, 2021-08-31
  7. 「家の掛け軸が読めた」「祖父の遺作を解読できそう」 くずし字を“読める形”に変換するAIアプリ「みを」に反響, ねとらぼ, 2021-09-02
  8. 「最新研究を生かしたアプリケーション」を試す ほか, INTERNET Watch, 2021-09-03
  9. 【情報システム機構】くずし字資料解読手助けアプリ『みを』リリース, 文教.com, 2021-09-06
  10. くずし字を読めるようにする「みを」。達筆な手紙にも使えるかも?, ケータイ Watch, 2021-09-10

2021-08-03

鈴木親彦特任助教が情報処理学会 2021年度 山下記念研究賞を受賞しました。対象となる論文は、じんもんこん2020シンポジウム(2020年12月12日)で発表した日本中世絵巻における性差の描き分け-IIIF Curation Platformを活用したGM法による『遊行上人縁起絵巻』の様式分析です。

なお関連する研究成果につきましては、以下のサイトをご覧下さい。

  1. 顔貌コレクション(顔コレ)
  2. IIIF Curation Boardのケーススタディ
  3. 第15回CODHセミナー - IIIFとAIで変わる美術史研究 - 大規模顔貌データの様式分析から読み解く日本中世絵巻
  1. 情報処理学会 山下記念研究賞を受賞(人文学オープンデータ共同利用センター)
  2. 鈴木 親彦特任研究員/ROIS特任助教(データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター)の論文が情報処理学会 2021年度 山下記念研究賞を受賞

2021-08-02

第15回CODHセミナー - IIIFとAIで変わる美術史研究 - 大規模顔貌データの様式分析から読み解く日本中世絵巻の発表資料および記録動画を公開しました。

2021-07-29

edomi - 江戸をみる/みせるデータポータルを公開しました。最初の公開として、トラベルとショッピングのカテゴリを中心にデータを掲載しています。

  1. 人文学オープンデータ共同利用センター(CODH)、「edomi - 江戸をみる/みせるデータポータル」を公開, カレントアウェアネス, 2021-07-30

2021-07-11

本センターの研究内容がメディアで紹介されました。

  1. [顔]難解?外国語なので当然…くずし字を解読するアプリを開発 カラーヌワット・タリンさん, 読売新聞, 2021-07-11

2021-07-09

DS施設公募型共同研究の成果として、歴史的市区町村境界WebGISが公開されました。詳しくは京都大学学術情報メディアセンターのリリース「歴史的市区町村境界WebGISの公開について」をご覧下さい。

2021-07-08

GeoNLP Version 2.0をリリースしました。またGeoNLPの地名辞書や歴史ビッグデータでも活用するGeoLODの運用を開始しました。

より詳しい情報はGeoNLP Version 2.0のリリースや、GeoNLPソフトウェア更新情報などをご覧下さい。

2021-07-01

Mahalo Buttonの公開に合わせて、CODHサイトにもMahalo Buttonを導入しました(詳細:Mahalo Buttonとは?)。以下のページにMahalo Buttonを試験的に導入しています。

  1. くずし字データセット
  2. KMNISTデータセット
  3. 篆書字体データセット
  4. 顔コレデータセット
  5. ARC浮世絵顔データセット
  1. データ作成者とデータ利用者を「感謝のネットワーク」でつなぐ“Mahalo Button”が公開, カレントアウェアネス, 2021-07-06

2021-06-25

武鑑全集の差読プラットフォームを公開しました。このプラットフォームに関するより詳しい情報は「差読プラットフォーム」の試験公開をご覧下さい。

また上記のプラットフォームでも活用している画像比較ツールvdiff.jsも公開しました。2枚の画像を重ね合わせる射影変換行列の外部指定および自動推定機能を備えた比較表示ビューア、および比較表示結果を修正する比較表示エディタを含んでおり、OpenCV.jsの活用によりウェブブラウザ上での高速表示を実現しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「武鑑全集」の「差読プラットフォーム」と画像比較ツール「vdiff.js」を公開, カレントアウェアネス, 2021-06-28

2021-06-07

ARC浮世絵顔データセットを公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「ARC浮世絵顔データセット」を公開, カレントアウェアネス, 2021-06-08
  2. 機械学習で浮世絵から顔を抽出した「ARC浮世絵顔データセット」が公開, Ledge.ai, 2021-06-09
  3. ARC Ukiyo-e Faces Dataset based on the ARC Ukiyo-e Portal Database has been published by the Center for Open Data in the Humanities (CODH), Activity Report, Art Research Center, Ritsumeikan University, 2021-06-14
  4. 浮世絵顔データセット:AI・機械学習のデータセット辞典, @IT, 2021-06-17

2021-05-14

IIIF Curation ViewerおよびIIIF Curation Viewer Embeddedを更新しました(参考:リリース一覧)。

2021-05-09

第14回CODHセミナー - IIIF Curation Platform利活用レシピ100連発の発表資料の英訳を公開しました。またこの資料を含め、IIIF Curation Platformチュートリアルの内容を充実させました。

2021-04-27

東京大学総合図書館などが中心となって構築したデジタル源氏物語(AI画像検索版)が公開されました。このサービスにはCODHのKuroNetくずし字認識サービスが利用されています。くずし字OCRによる認識結果を活用することで、複数の写本・版本を対象とした類似ページ検索が実現しました。

2021-04-19

慶應義塾ミュージアム・コモンズの展覧会プログラム「文字形—AIが開く くずし字の風景」に協力し、CODHの研究成果を出品します。

  1. KuroNetくずし字認識サービスを活用し、出展されているくずし字資料の認識を行いました。
  2. みを(miwo)」はKuroNetを活用したくずし字認識AIアプリです。現在はまだ開発中の段階にあり一般には公開していませんが、今回の展覧会では一般の方々が初めてアプリを体験できる機会を提供します。
  3. IIIF Curation Viewerのv1.10をリリースしました。今回の展覧会に合わせて機能を拡張し、ミュージアム展示等での活用を想定した機能を充実させました。

2021-04-14

江戸マップβ版について、これまでデータベースから漏れていた地名を追加するとともに、一部の地名を削除/統合した結果、地名数は8658ヶ所から8719ヶ所に増えました。また地名分類を変更かつ精査し、多数の地名の分類を付与しなおしました。

2021-03-31

篆書字体データセットを公開しました。データセットの規模は、7点の資料画像から切り取った篆書体7,681文字種の文字画像データ106,447文字です。

  1. 人文学オープンデータ共同利用センター(CODH)、「篆書字体データセット」を公開, カレントアウェアネス, 2021-04-19

2021-02-19

第14回CODHセミナー - IIIF Curation Platform利活用レシピ100連発の発表資料と動画を公開しました。

2021-01-27

IIIF Curation Finderをv1.1に更新しました。

2021-01-21

江戸観光案内に『俳優似顔東錦絵』の浮世絵62点を追加しました。またメタデータとして「江戸マップID」を追加しました。

さらにIIIF Curation Finderの機能を強化し、メタデータが識別子の場合は識別子のレゾルバへのリンクを表示可能としました。この機能を用いて、顔貌コレクション江戸観光案内江戸買物案内から、原典公開ページ(DOI)や江戸マップ歴史地名マップなどへのリンクを実現しました。

2021-01-20

国文学研究資料館のYouTubeチャンネルにて、ないじぇる芸術共創ラボ「古典籍の”面白い顔”が仮面になる!」が公開されました。顔貌コレクション(顔コレ)を用いた、梁亜旋さんワークショップの映像です。

2021-01-18

華北交通アーカイブに関して、京都大学、ドイツ・ボン大学と国際ワークショップInternationaler Workshop: Fotoarchiv der Nordchinesischen Verkehrs-AG und Konzeption einer Wanderausstellung in Deutschland(華北交通アーカイブとドイツ版巡回展覧会の構想)を開催しました。

2021-01-14

萩生田文科大臣がNIIを視察し、実際の古典籍を撮影しその場で現代の文字として認識表示するくずし字認識AIのデモを行いました。

2021-01-12

情報・システム研究機構のサイエンスリポートにて、034 デジタルな人文、データな社会 04 | サイエンスリポートが公開されました。国文学研究資料館のロバート キャンベル館長と、CODHセンター長の北本、ROIS-DS施設長の藤山が対談を行った記録です。

2020年

2020-12-07

「江戸」という都市を商業と観光の面から探るための新しいデータを公開しました。

  1. 江戸買物案内:江戸時代に出版された『江戸買物独案内』から、商人名や職種、居所(住所)、屋号紋などを抽出することで、江戸を中心とする商人に関するビジュアルな商業広告データベースとして構築したものです。
  2. 江戸観光案内:江戸観光案内は、江戸時代に出版された観光ガイドブックである「名所案内」「名所記」「名所図会」の中から各世紀2点ずつ計6点を選び、名称やキーワードを付与することで、江戸を中心とする観光に関するビジュアルな名所挿絵データベースとして構築したものです。

また商業と観光に関するデータを地理情報と連結して分析するための地名情報基盤を拡充/公開しました。

  1. 江戸マップβ版2019年11月5日に公開した後もデータの拡充を続けてきましたが、当初から目標としていた29枚の切絵図を対象とした地名データベース化が一段落し、地名数8658ヶ所のデータベースとなりました。また古地図と現代地図をジオレファレンスした「位置合わせ地図」を公開するとともに、尾張屋版地図の全体像に関する情報を追加しました。
  2. 歴史地名マップ:人間・文化研究機構などが公開する「歴史地名データ」にバイナリベクトルタイル技術を適用し、多数の歴史地名を同時に表示しつつズームイン/アウトする機能を実現しました。現在の地名数は298,914件です。

「江戸買物案内」や「江戸観光案内」などの史料を、「江戸マップβ版」や「歴史地名マップ」などの地名情報基盤(歴史GIS)と結合することで、歴史ビッグデータのアプローチを江戸という都市/時代に関する情報基盤構築に活用していく計画です。

  1. 人文学オープンデータ共同利用センター(CODH)、江戸の商業と観光に関する新たなデータ「江戸買物案内」「江戸観光案内」を公開, カレントアウェアネス, 2020-12-08

2020-11-27

東京大学の「総合図書館バーチャルミュージアム」にて、IIIF Curation Platformをコンテンツの登録に活用した、「セルフミュージアム」が公開されました。

  1. 【開催中】展示・総合図書館の130年を振り返る 1 創立から震災復興まで
  2. 総合図書館バーチャルミュージアム

2020-11-16

歴史ビッグデータの一つとして、デジタル台風:地上気象観測原簿アーカイブを公開しました。画像の閲覧にはIIIF Curation Viewerを活用しています。

2020-11-02

図書館情報学とAIの新展開 ーAI文字認識×クラウドソーシングで史料のテキスト化を加速【第2回 人工知能学会誌コラボ】 | AI専門ニュースメディア AINOWにて、AIくずし字OCRサービスが紹介されました。みんなで翻刻では、CODHのAIくずし字OCRサービスを翻刻支援に利用しています。その他、以下のページでもKuroNetが紹介されています。

  1. AI-OCRを使って千年の文字文化を復興する。, itok, 2020-10-05

2020-09-23

顔コレデータセットをv1.2に更新し、顔貌数が8,573→8,848件に増加しました。

2020-09-19

歴史的行政区域データセットβ版の一連の更新が終了し、行政区域件数=16,447件、行政区域境界データ件数=99,243件(うち統合境界データ件数=10,832件)のデータセットが完成しました。またベクトルタイル地図などの新しいプロダクトを追加するとともに、これらを活用したサービスを展開するなど、歴史的行政区域データセットβ版の多面的な活用を進めました。より詳しい更新情報は、ニュースをご覧下さい。

2020-09-17

IIIF Curation Boardを公開しました。IIIF Curation Viewerで作成したキュレーションを整理するホワイトボードツールで、画像整理や発想支援などに活用できます。またIIIF Curation Boardのケーススタディでは、このツールを活用して日本美術作品を分析した例を紹介しています。

なお、IIIF Curation BoardをはじめとするIIIF Curation Platformの発展につきましては、E2301 - オープンな画像の利活用を開拓するIIIF Curation Platform, カレントアウェアネス-E, No.398, 2020.09.17もご覧下さい。

  1. 人文学オープンデータ共同利用センター(CODH)、画像整理や発想支援に活用できるツール“IIIF Curation Board”を公開, カレントアウェアネス, 2020-09-18

2020-09-14

江戸マップβ版武鑑全集の間のリンクを強化するとともに、両サイトに存在したいくつもの誤りを修正しました。また武鑑全集では新しいページを追加しました。

2020-09-01

江戸マップβ版の地名について、個別地名ページを作成しました。また地図表示にIIIF Curation Viewer Embeddedを活用し、国立国会図書館の「江戸切絵図」を同一ページで確認できるようにしました。

  1. 人文学オープンデータ共同利用センター(CODH)、江戸マップβ版に機能追加を実施:個別地名ページの作成・IIIF Curation Viewer Embeddedの機能活用, カレントアウェアネス, 2020-09-10

2020-08-09

第12回CODHセミナー第11回CODHセミナー日本文化とAIシンポジウム2019の発表資料へのリンクを更新しました。第12回CODHセミナー以外については、人文学研究データリポジトリ上では以前から資料を公開しておりましたが、JAIRO CloudでのDOI付与の不具合解消を受けて、CODHページからのリンクを更新したものです。

2020-08-05

近代日本語文書向けのOCRシステムとして、Kindai-OCRを公開しました。

2020-08-04

江戸マップβ版のデータを拡充しました。江戸切絵図の枚数は22枚→28枚、地名数は6418ヶ所→8358ヶ所に増えました。また過去のデータについても一部見直しを行いました。

2020-07-31

デジタルアーカイブ推進コンソーシアム(DAPCON)の2020デジタルアーカイブ産業賞として、以下の研究が「技術賞」を受賞しました。

「KuroNetくずし字認識サービス/くずし字データセット」ROIS-DS人文学オープンデータ共同利用センター(北本 朝展、カラーヌワット タリン)、KuroNet共同研究チーム(Alex Lamb, Mikel Bober-Irizar)、国文学研究資料館 古典籍共同研究事業センター

研究内容につきましては、くずし字データセットKuroNetくずし字認識サービスなどをご覧下さい。

  1. 北本 朝展教授(コンテンツ科学研究系)、カラーヌワット・タリン特任研究員/ROIS特任助教(データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター)らの研究がデジタルアーカイブ推進コンソーシアム(DAPCON)2020デジタルアーカイブ産業賞 技術賞を受賞

2020-07-15

本センターの研究内容がメディアで紹介されました。

  1. Dataset Search:Googleによる「データセット検索」サイト:AI・機械学習のデータセット辞典, @IT, 2020-07-15

2020-06-11

Unicode変体仮名一覧を公開しました。 Unicodeに登録されている変体仮名285文字(U+1B002〜U+1B11E)を現代のひらがなごとにまとめ直し、ひらがなごとに字母を確認できるようにしました。

  1. 人文学オープンデータ共同利用センター(CODH)、「Unicode変体仮名一覧」を公開, カレントアウェアネス, 2020-06-12

2020-06-10

顔コレデータセットをv1.1に更新し、顔貌数が5,552→8,573件に増加しました。

2020-06-06

本センターの研究内容がメディアで紹介されました。

  1. くずし字解読AI駆使, 読売新聞夕刊, 2020-06-06

2020-05-29

IIIF Curation Viewerを更新しました。バージョン1.9の主な改良点は、「アノテーションビューモード」の文字マーカーで、フォントサイズの自動調整や背景色の自動調整などの新機能によって、画像に文字を重ねて表示する場合の可読性が大きく向上しました。

この機能を試してみるには、日本古典籍くずし字データセットから一冊の古典籍を選び、IIIF Curation Viewerの「文字表示」を選んでみてください(例えば『源氏物語』)。さらに画面の左下で「上書き」表示を選択すると、現代文字の背景が紙面に近い色で塗り潰され、可読性が向上します。不透明度スライダーを調整すれば、背景にある文字を改めて読むことも可能です。

  1. 人文学オープンデータ共同利用センター(CODH)、IIIF準拠の画像ビューワIIIF Curation Viewerのバージョン1.9を公開:「アノテーションビューモード」への新機能追加等, カレントアウェアネス, 2020-06-08

2020-05-25

顔貌コレクション(顔コレ)のデータを更新し、作品数が64→99、顔貌数が5834→8845に増加しました。新着顔貌には、『源氏物語絵巻』『前九年軍記』『後三年合戦絵』など、有名作品の写本も含まれています。

2020-05-10

NHKの「文字〜Character〜」 - COOL JAPAN〜発掘!かっこいいニッポン〜にて、カラーヌワット タリン特任助教のくずし字に関する様々な取り組みが紹介されました。

2020-04-25

武鑑全集にて、大名家の上屋敷と菩提寺に関する情報を追加しました。武鑑に掲載されている情報を翻刻するとともに、菩提寺に関しては駒澤学園(駒澤大学)が構築する寺院資料データベースとリンクすることで、現在の情報をたどれるようにしました。

また江戸マップβ版とリンクすることで、上屋敷と菩提寺の位置を江戸時代の地図でも位置を確認できるようにしました。また地名一覧ページに上屋敷や菩提寺の情報を列挙することで、地名に関する関連情報を入手できるようになりました。これらの機能は、江戸の都市空間と現在の東京の都市空間との空間的な比較を行うための情報基盤の一部となります。

2020-04-17

IIIF Curation Viewerプラグインの記述を更新しました。「JSONkeeperエクスポートプラグイン」の仕様を明確化し、「切り取り画像エクスポートプラグイン」のエクスポート項目に関する記述を追加しました。

2020-04-07

IIIF Consortiumの公式ページHow To Use IIIF Resources and Image Viewersにて、IIIF Curation Viewerが紹介されました。

2020-04-02

Curation Tracer検索を公開しました。Curation Tracerを用いて、IIIF Curationの「引用関係」を検索および可視化します。

2020-04-01

江戸マップβ版のデータを拡充しました。江戸切絵図の枚数は16枚→22枚、地名数は5084ヶ所→6418ヶ所に増えました。また過去のデータについても一部見直しを行いました。

2020-03-25

KuroNet Text Editorを公開しました。また、これと合わせてKuroNetくずし字認識サービスを改良し、自動テキスト化、手動テキスト化の機能を加えました。これにより、KuroNetくずし字OCRによる文字単位の認識結果を連結して文字列(テキスト)として出力し、コピーペーストして使えるようになりました。

文字の読み順を指定するツールは2種類あります。第一にKuroNet Text Editorは、複雑なレイアウトでも読み順を正確に手動で指定できます。第二に自動読み順推定アルゴリズムは、割書などを含まない単純な縦書きレイアウトであれば、読み順を瞬時に自動で推定できます。また、最初に自動読み順推定アルゴリズムを利用し、その結果をKuroNet Text Editorで修正する、という2段階の作業も可能です。レイアウトの複雑さに応じて、2つのツールを併用して下さい。

また、IIIF Curation Viewerについても、複数のプラグインの機能を拡張したバージョン1.8を公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、多文字くずし字OCR結果を編集するツール“KuroNet Text Editor”を公開, カレントアウェアネス, 2020-03-26

2020-03-17

デジタルアーカイブ学会第2回学会賞として、以下の論文が「学術賞(研究論文)」を受賞しました。

くずし字認識のためのKaggle機械学習コンペティションの経過と成果, 北本 朝展, カラーヌワット タリン, Alex Lamb, Mikel Bober-Irizar, じんもんこん2019論文集, 2019, 223-230

研究内容につきましては、受賞対象論文Kaggleコンペティション:くずし字認識くずし字チャレンジ!などをご覧下さい。

  1. 北本 朝展准教授(コンテンツ科学研究系)、カラーヌワット・タリン特任研究員/ROIS特任助教(データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター)らの論文がデジタルアーカイブ学会第2回学会賞の学術賞(研究論文)を受賞, 国立情報学研究所
  2. デジタルアーカイブ学会「学術賞(研究論文)」を受賞(人文学オープンデータ共同利用センター), 情報・システム研究機構 データサイエンス共同利用基盤施設

2020-03-07

本センターの研究内容がメディアで紹介されました。

  1. 古文書と災害(4)=くずし字の読解 難漢字 AIにおまかせ きっかけは源氏物語, 東京新聞, 朝刊4面, 2020-03-07
  2. 古文書と災害 (4)くずし字の読解 難漢字 AIにおまかせ, 中日新聞, 夕刊5面, 2020-03-17

2020-02-24

商工ジャーナル2020年3月号に、北本とタリンに対するインタビュー記事「未来技術の旗手たち AIが古文書の”くずし字”を読み、日本の文字文化の扉を開く」が掲載されました(商工ジャーナル 46(3), 54-57, 2020-03, 商工中金経済研究所

2020-02-22

Googleストーリーで、CODHのカラーヌワット・タリンさんが中心に進めるくずし字認識研究に関する記事が紹介されました。日本文化の保全に TensorFlow AI を活用する - Google

より詳細な情報につきましては、KuroNetKuroNetに関する論文(ICDAR)くずし字OCRなどをご覧下さい。

2020-02-21

顔コレデータセットおよび、顔コレデータセットに関する論文Yingtao Tian, Chikahiko Suzuki, Tarin Clanuwat, Mikel Bober-Irizar, Alex Lamb, Asanobu Kitamoto, "KaoKore: A Pre-modern Japanese Art Facial Expression Dataset", arXiv:2002.08595を公開しました。

これは、日本の絵巻物や絵本に登場する様々な顔貌画像「顔コレ(顔貌コレクション)」を、機械学習に利用しやすい形式で提供するデータセットです。未調査の資料に対する主題特定や様式分析を効率化するために顔貌を自動抽出したり、クリエイティブな活動のために顔貌を自動生成したりと、機械学習は研究や活動の新たな可能性を広げることが期待できます。

  1. KaoKore: New Facial Dataset from Japanese Scrolls for ML, Synced Review, 2020-03-03

2020-02-20

Geoshapeリポジトリにて、行政境界データ ベクトルタイル地図を公開しました。これはDS施設公募型共同研究の支援を受けて進められたものです。

2020-02-11

世界各地のデジタルヒューマニティーズのプロジェクトを紹介するAround DH 2020の第1回の記事として、KuroNetの紹介記事が掲載されました。

2020-02-09

2020年2月21日に開催する12th CODH Seminar - AI for Culture: From Japanese Art to Animeの参加申込を開始しました。→ 本セミナーは延期となりました。新しい日程は後日にアナウンスします。

2020-01-27

本センターの研究内容がメディアで紹介されました。

  1. AIがくずし字を読む時代がやってきた, ふみ第13号, 1-3ページ, 2020-01-15
  2. [とれんど]きっかけは「源氏物語」…論説委員 鳥山 忠志, 読売新聞, 2020-01-18
  3. KMNIST/Kuzushiji-MNIST:日本古典籍くずし字(手書き文字)データセット, AI・機械学習のデータセット辞典 - @IT, 2020-01-27
  4. ROIS-DS、国文研のニュースレターに「日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~」が紹介されたことを報告, STI Updates, 2020-01-28
  5. 【保存版】オープンデータ・データセット100選 -膨大なデータを活用しよう!, AINOW, 2020-03-02

2019年

2019-12-26

江戸マップβ版の地名検索を公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、江戸マップβ版に地名検索機能を追加, カレントアウェアネス, 2020-01-07

2019-12-15

本センターの研究内容がメディアで紹介されました。

  1. [天下财经]秒读古籍 日本AI快速辨识手写体文献, 中国中央电视台(CCTV-2), 2019-12-15
  2. 「美空ひばり」「ラーメン」「くずし字」…日本のAI技術の現状, Asagei Biz-アサ芸ビズ, 2019-12-21

2019-12-05

【イベント報告】「データ科学の世界へようこそ」を開催しました(12/1開催)が掲載されました。「江戸料理レシピデータセット」の『万宝料理秘密箱 卵百珍』を再現した現物そっくりの料理模型や、レシピの流れを表現したミニチュア工場など、来場者にも好評でした。なおこのイベントは、DS施設が企画し、CODHが協力したものです。

2019-11-22

カラーヌワット・タリン特任研究員/ROIS特任助教(データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター)の論文が情報処理学会 2019年度 山下記念研究賞を受賞しました。

  1. NIIニュース

2019-11-18

日本文化とAIシンポジウム2019〜AIがくずし字を読む時代がやってきた〜の発表資料とポスターを公開しました。また講演の模様はROIS-DS CODHのYouTubeチャネルでアーカイブを公開中ですので、こちらもご覧下さい。

  1. 「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」の発表資料とポスターが公開される, カレントアウェアネス, 2019-11-19

2019-11-17

本センターの研究内容がメディアで紹介されました。

  1. How Machine Learning Can Help Unlock the World of Ancient Japan, The Gradient, 2019-11-17
  2. 「日本語のくずし字をAIで活字に直す試み」の活発化に海外の研究者らも注目, GIGAZINE, 2019-11-19
  3. AIとOCR連携の可能--AIで“くずし字”を判別に挑む, ZDNet Japan, 2019-11-27
  4. 宝庫の鍵 ロバート キャンベル, 日本経済新聞 夕刊6面, 2019-11-27
  5. 日本古来の「くずし字」にAIで挑む 解読の競技大会は中国が優勝, 産経新聞, 2019-11-30
  6. 「くずし字」AIが解読 ラーメン判別法も応用!, NHK WEB特集, 2019-12-02
  7. ラーメン判別法も応用 古文書の「くずし字」AIが解読, Nらじセレクト, 2019-12-09
  8. 難解な「くずし字」がAIでサクサク読める!読まれないままの文献多く"予想外の事実"見つかる可能性も, MBSテレビ「ミント!」, 2019-12-10

2019-11-16

IIIF Curation Viewerの仕様を更新しました。特にアノテーションビューモードは、バージョン1.7から導入された新しい機能です。

2019-11-15

IIIF Curation Viewerの新機能を活用し、日本古典籍くずし字データセットの表示方法に、文字表示と四角表示を追加しました。四角表示では、アノテーション領域の表示色と線幅を公開者が設定する機能を活用しています。また、画像上の文字位置から文字一覧ページへ、遷移するためのリンクも設置しました。

2019-11-14

日本科学未来館に本日オープンする新しい常設展示「計算機と自然、計算機の自然」に、Kuzushiji-MNISTを提供しました。大量のくずし字画像で訓練した機械学習モデルが生成する新しい画像を、モニターに次々と表示する作品が展示されています。

2019-11-11

日本古典籍くずし字データセットに字形データを大幅に追加し、文字数が684,165→1,086,326と100万文字を越えました。またデータセット全体に対してクリーニングを丁寧に行い、その過程で一部の旧字を新字に統合したため、文字種は4,645→4,328に減少しました。

さらに、このデータセットを機械学習に活用したAIくずし字OCRサービスの一つとして、KuroNetくずし字認識サービスも同時に公開しました。

これらの公開は、同日に開催された日本文化とAIシンポジウム2019 〜AIがくずし字を読む時代がやってきた〜に合わせたものです。

  1. AIで“くずし字”の解読に挑む, NHK NEWS WEB, 2019-11-11
  2. 人文学オープンデータ共同利用センター(CODH)、日本古典籍くずし字データセットに字形データを大幅に追加:データセットを活用した無料のAIくずし字OCRサービスも公開, カレントアウェアネス, 2019-11-12
  3. くずし字解読 AIの実力は?|サイカルジャーナル|NHKオンライン, NHK, 2019-11-20

2019-11-05

IIIF Curation Viewer V1.7を公開しました。主要な新機能は以下の通りです。

  1. 新機能「アノテーションビューモード」により、IIIF画像上に場所や文字のマーカーが表示できるようになり、IIIF環境でも地図や翻刻が利用しやすくなります。また四角枠マーカーを表示すると、既存のIIIFビューアにおけるアノテーション風の表示が実現できます。さらにマーカーの表示位置や透明度などをユーザが変更できるようにしました。
  2. IIIFマニフェストに含まれるIIIF Image APIに非対応のリソース(例えばJPEG画像)などの表示にも対応しました。

さらに新機能を体験するために、2つの新サービスを本日リリースしました。

  1. 江戸マップβ版:古地図の上に画像マーカーを表示することで、IIIFビューアを地図アプリのように使えます。国立国会図書館などが公開する古地図「江戸切絵図」に対して、IIIF Curation Platformの仕組みにより様々な情報を統合し、歴史ビッグデータ歴史GISの研究に活用します。
  2. くずし字データセット閲覧ビューア:くずし字の翻字を文字マーカーとして表示することで、くずし字と現代の文字を左右に並べて表示し、IIIF画像上で翻刻を読みやすくしました。同様の方法を使えば、くずし字OCRサービスの認識結果をIIIF画像上に表示することも可能となります。

これらの新機能の一部は、2019年11月11日に開催する日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~でもご紹介します。

  1. 人文学オープンデータ共同利用センター(CODH)、IIIF Curation Viewerに新機能「アノテーションビューモード」を追加:新機能を体験できるサービス「江戸マップβ版」「くずし字データセット閲覧ビューア」も公開, カレントアウェアネス, 2019-11-06

2019-10-18

本センターの研究内容がメディアで紹介されました。

  1. AIで古文書を読む 埋もれた情報を発掘, 産経新聞, 2019-10-18
  2. 【関西(知)探 解】くずし字解読 AIにおまかせ、史料を眠らせない, 産経新聞 大阪 朝刊 21面, 2019-10-19
  3. [サイエンスReport]「くずし字」 AIが解読 68万字分を学習, 東京読売新聞 朝刊 34面, 2019-10-20
  4. サイエンス Report=「くずし字」 AIが解読 68万字分を学習 精度90%, 読売新聞 朝刊34面, 2019-10-20
  5. サイエンス Report=「くずし字」 AIが解読 68万字分を学習 精度90%, 読売新聞(大阪) 朝刊23面, 2019-10-20
  6. 古典のAI解読 埋もれた知を掘り起こしたい, 読売新聞 社説, 2019-10-25
  7. 難読古文書 一気に解読 筆書き崩し字活字に 市民参加型でたのしく AI開発コンペ実施, 徳島新聞 夕刊1面, 2019-11-06
  8. 古典・古文書の難読「くずし字」、AIが瞬時に解読…精度90%も, 読売新聞オンライン, 2019-11-11

2019-10-15

Kaggleコンペティション「くずし字認識」が無事に終了しました。入賞者などの情報につきましては、Kaggleコンペティション「くずし字認識」が終了の記事をご覧下さい。

2019-09-30

公開するデータセットの一部について、Google Dataset Searchでの検索に対応しました。例:「古典籍」で検索した結果

2019-09-27

ICPチュートリアルにICP Tutorial:第7回 ICPを利用してグループ作業を行うを追加しました。ICPを使った共同キュレーションにおけるユーザ管理(グループ管理)のベストプラクティスに対する質問が多かったため、チュートリアルに新たにこの項目を立てました。

2019-09-20

本センターの研究内容がメディアで紹介されました。

  1. 「崩し字」読解、AIで 古文書、専門家以外はハードル高く… 市民参加の翻刻プロジェクトも, 信濃毎日新聞, 夕刊6面, 2019-09-20
  2. 崩し字スピード”翻訳” 市民参加×AI活用 古文書解読に光, 新潟日報 夕刊11面, 2019-09-20
  3. 眠れる古文書 価値を今に 崩し字翻訳 ウェブの力で 市民の知結集プロジェクト, 毎日新聞(大阪) 夕刊3面, 2019-09-21
  4. 崩し字一気に解読へ 古文書翻訳 市民参加、AI開発進む, 山形新聞 朝刊25面, 2019-09-22
  5. 筆書きの崩し字 読めない古文書、一気に解読 市民参加やAI開発で活字に, 山口新聞 朝刊16面, 2019-09-22
  6. 古文書の「崩し字」解読 市民参加やAIで活字に, 千葉日報 朝刊15面, 2019-09-24
  7. 筆書きの崩し字、活字に 古文書、一気に解読へ 市民参加やAI開発も, 茨城新聞 朝刊21面, 2019-09-24
  8. 「崩し字」AIで活字に/市民参加企画も進む/古文書解読に勢い, 沖縄タイムス 朝刊23面, 2019-09-25
  9. 古文書の崩し字を一気に解読 市民参加プロジェクト、AI開発・・・ 現在の活字に置き換え, 熊本日日新聞 夕刊3面, 2019-09-25
  10. 読めない古文書一気に解読/筆書きの崩し字、活字に/市民参加やAI開発で推進, 中部経済新聞 15面, 2019-09-26
  11. 難解古文書 一気に解読 市民参加 助言し合い/AI開発 海外からも 崩し字翻刻, 中国新聞 朝刊5面, 2019-09-26
  12. 古文書解読 市民参加+AIで 崩し字を活字に「翻刻」 「眠る歴史」掘り起こせ, 東奥日報 夕刊3面, 2019-09-27
  13. 読めない古文書を解読 筆書きの崩し字、活字に, 下野新聞, 2019-09-29
  14. ?な古文書 一気に解読 筆書きの「崩し字」→活字に 市民参加やAI活用で, 神戸新聞 夕刊7面, 2019-09-30
  15. 難解古文書 みんなで解読 国立歴民博 市民参加プロジェクト AI開発も進む, 高知新聞 夕刊6面, 2019-10-03
  16. 古文書 一気に解読へ 崩し字翻刻計画進む 市民参加やAI開発も, 岩手日報朝刊 16面, 2019-10-04
  17. 市民参加 翻刻プロジェクト/古文書「崩し字」活字へ/一気に解読 AI開発も, 宮崎日日新聞 朝刊 12面, 2019-10-11

2019-09-13

2019年11月11日に開催する日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~の参加申込を開始しました。

  1. 【イベント】日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~(11/11・東京), カレントアウェアネス, 2019-09-17
  2. トピック くずし字を読み解くAIを紹介, 読売新聞, 夕刊7面, 2019-09-19
  3. シンポジウム「AIがくずし字を読む時代がやってきた」開催へ, 科学新聞 2面, 2019-09-19

2019-09-12

2019年9月25日に開催する第11回CODHセミナー - Text Mining for Analyzing Research Communities: Sociological Topics and Socio-Technical Imaginariesの参加申込を開始しました。

2019-09-09

本センターの研究内容がメディアで紹介されました。

  1. AIでくずし字を読む カラーヌワット・タリン, 文藝春秋, 90-91ページ, 2019年10月号
  2. Young Turks: Here's an accessibility app designed for the deaf or hard of hearing, CNBC-TV18, 2019-09-13

2019-08-08

歴史的行政区域データセットβ版を更新しました。(1) 2019年版データを追加、(2) 政令指定都市に関するデータの問題を修正、(3) 過去の行政区域と現在の行政区域の対応づけに関するデータを追加。

2019-07-27

本センターの研究内容がメディアで紹介されました。

  1. AIやビッグデータ、人文研究に変革 データ駆動型に, 日本経済新聞, 2019-07-27
  2. 機械の目が見たセカイ -コンピュータビジョンがつくるミライ(63) 機械学習で必要なデータセット(2), マイナビニュース, 2019-07-30

2019-07-23

IIIF Curation Platformを活用したキュレーソンの例として、東京大学文学部「絵巻ゼミ」キュレーソンを掲載しました。

2019-07-22

古文書史料の市民参加型翻刻プラットフォーム「みんなで翻刻」のリニューアル版に、「AIくずし字認識(一文字)」の機能が組み込まれました。

  1. 市民参加型翻刻プロジェクト「みんなで翻刻」が7月22日リニューアル公開!〜さらに多くの災害史料や「東寺百合文書」を市民参加で解読します〜, 国立歴史民俗博物館・京都大学・東京大学の共同プレスリリース, 2017-07-22
  2. AI活用した古文書解読プロジェクト「みんなで翻刻」がリニューアル, ICT教育ニュース, 2019-07-24
  3. 防災へ、みんなで古文書読み解く 東大地震研の史料500点、ネットで公開 5000人参加, 朝日新聞, 2019-07-25

2019-07-19

Kaggleコンペティション:くずし字認識が始まりました。10月14日まで。画期的なくずし字認識アルゴリズムが生まれることを期待しています。

2019-07-10

Kaggleコンペティション:くずし字認識に関するプレスリリースを行いました。

  1. 【プレスリリース】「くずし字」の認識に世界のAI研究者・技術者が挑戦(2019/07/10)(データサイエンス共同利用基盤施設)
  2. 「くずし字」の認識に世界のAI研究者・技術者が挑戦―全世界的コンペティションをKaggleで7月から開催―(国立情報学研究所)

また以下のメディアで紹介されました。

  1. 日本古来の「くずし字」、AIでどう読み取る? 世界的なコンペティションが7月中旬から開催決定, やじうまWatch, 2019-07-10
  2. くずし字認識に関する全世界的なコンペティションが機械学習コンペプラットフォームKaggleで開催, カレントアウェアネス, 2019-07-12
  3. くずし字認識のKaggleコンペ開催:人文系データ対象は今回が初, Marvin(マーヴィン)人工知能・AIと機械学習の事例メディア, 2019-07-18
  4. 『くずし字』の認識にAI活用へ世界規模コンペ, 科学新聞, 2面, 2019-07-19

2019-07-10

Googleが主催するイベント「Solve with AI」で、カラーヌワット・タリン特任研究員が、「Making millions of Japanese historical documents more accessible with AI」と題する講演を行いました。

  1. 医療に災害対策、古文書の読み取りまで――AIによる社会課題の解決を目指すGoogle, ケータイ Watch, 2019-07-10
  2. Googleが日本でAI人材支援、6人の研究者に500万円補助 1000年前の書物の解読もAIで, engadget日本版, 2019-07-11
  3. AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発, PC Watch, 2019-07-11
  4. 便利すぎるこれ!古文書や浮世絵のくずし字を自動解読してくれる無料の「AIくずし字認識」が素晴らしい!, Japaaan, 2019-07-11
  5. 古典書体「くずし字」の判別も--AIで社会課題の解決目指すグーグル「Solve with AI」, CNET Japan, 2019-07-12
  6. AIを「悪の手先」にしないためにGoogleが取り組んでいること, ITMedia News, 2019-07-14
  7. 人工知能(AI)の流行で改めて感じる「それはAIでやるべきなのか」という感覚の大切さ, Yahoo!ニュース 個人, 2019-07-15
  8. Google – Solve with AI: Trí tuệ nhân tạo giúp chẩn đoán ung thư và giải quyết các vấn đề của xã hội, TechTimes Vietnam, 2019-07-11
  9. Google tổ chức sự kiện về trí tuệ nhân tạo, TechSign.in, 2019-07-11
  10. 【東京直擊】AI好神 肺癌篩檢比醫生還準, 蘋果日報, 2019-07-11
  11. Penggunaan Pembelajaran Mesin Tensorflow Untuk Memulihara Tulisan 1000 Tahun Kuzushiji, Amanz, 2019-07-11
  12. 東京直擊Google Solve with AI論壇 解救人類危機 人工智慧3大應用 癌症篩檢比人工更準確, 蘋果日報, 2019-07-12
  13. Google AI 七项原则发布一年,AI 业务掌门人杰夫·迪恩谈技术与善的距离, 爱范儿, 2019-07-12
  14. Google AI 七項原則發表一年,AI 業務掌門人傑夫‧迪恩談技術與道德的距離, TechNews 科技新報, 2019-07-15
  15. Secrets of billions of ancient Japanese texts being uncovered by AI, 9news (Australia), 2019-07-15
  16. L'intelligence artificielle déchiffre des milliards de textes en japonais ancien, LeBigData.fr, 2019-07-15
  17. HERE'S HOW GOOGLE IS PUTTING AI TO WORK IN HEALTHCARE, ENVIRONMENTAL CONSERVATION, AGRICULTURE AND MORE, Digit, 2019-07-16
  18. I giapponesi hanno cambiato sistema di scrittura e non capiscono più i vecchi documenti. Li salverà un algoritmo?, Linkiesta, 2019-07-17
  19. AIは地球を救う|石川温のPCスマホニュース解説, ASCII.jp, 2019-07-22
  20. 社会課題の解決にAIは貢献できるのか Googleの「Solve with AI」に世界の先端事例を見る, DIGITAL X(デジタルクロス), 2019-08-15

なお、以上の報道やソーシャルメディアの多くで誤解されている点ですが、今回の講演で紹介したくずし字認識モデル「KuroNet」の研究開発においては、Googleからの技術的支援は受けていません。実際にはGoogleの機械学習ソフトウェア(TensorFlow)よりも、Facebookの機械学習ソフトウェア(PyTorch)を主に利用しており、Googleのソフトウェアだけを利用しているわけではありません。また、一部のニュースでは「翻訳」と報じられましたが、これは「翻刻」の誤りです。両者の違いについては、くずし字翻刻(テキスト化)/翻訳をご覧下さい。

2019-07-06

Mila Newsletter - July 2019にて、先日採択されたICDAR 2019論文に関するくずし字認識の最新研究成果が紹介されました。

2019-06-30

江戸料理レシピデータセットに関して、2018年6月5日から始まった、鶏鳴新聞社・国文学研究資料館・クックパッドとのコラボ企画「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」は、当初の予定通り28点のレシピを公開し、いったんお休みすることになりました。その他のレシピについては、現代語訳が進んだ段階で、あらためて再開したいと考えています。

『万宝料理秘密箱 卵百珍』では現在48点のレシピを公開しており、画像一覧ではレシピの写真を一覧できます。またこれらのレシピは、クックパッド江戸ご飯でも公開しています。現代では考えられない調理方法や組み合わせなど、卵の可能性を感じさせる江戸料理レシピを、ぜひお試しください。

2019-06-24

IIIF Curation Platformを更新しました。特に重要な更新は、IIIF Curation Viewerの切り取り画像エクスポートプラグインです。このプラグインからICPから利用可能な外部サービスを利用することで、IIIFの活用方法は大きく広がります。

すでに「画像を切り取ってくずし字を認識する」機能は2019年5月1日にリリースしましたが、今回はこれに加えて、「画像を切り取って別のアーカイブ(東京大学デジタルアーカイブズの「貼り込み資料画像検索」)を検索する」「画像を切り取って同じ浮世絵の他の所蔵を検索する」「画像を切り取ってGoogle画像検索する」という外部サービスも利用可能としました。ICPサービスリポジトリのエンドポイント設定あるいは他のサイトで、エンドポイント設定(JSONファイル)を共有するだけで他サービスが簡単に利用可能となりますので、ぜひお試しください。

なお本更新の内容は、本日から始まる2019 IIIF Conferenceでも発表を行います。

  1. 東京大学附属図書館、電子展示『捃拾帖』の「貼り込み資料画像検索プロトタイプ」とCODH・IIIF Curation Platformとの連携開始を発表, カレントアウェアネス, 2019-06-26

2019-06-16

2019年6月上旬のDigital Humanities Summer Institute 2019で開催した「Digital Humanities for Japanese Culture: Resources and Methods」コース。ここで実施したIIIF Curation Platformを活用した「キュレーソン」の結果を掲載しました。

2019-06-01

ICP Tutorialの英語版を公開しました。

2019-05-31

CODHが後援する第23回 PRMUアルゴリズムコンテスト くずし字認識チャレンジ2019が始まりました。締切は2019年8月31日です。

2019-05-29

歴史ビッグデータプロジェクトの特任研究員を募集します。

  1. コンテンツ科学研究系 北本研究室 特任研究員(特定有期雇用職員) 募集
  2. JREC-IN

2019-05-28

NHK WORLD-JAPAN NEWSROOM TOKYOの特集コーナーTHE FOCUSにて、「THROUGH THE OCCUPIER'S LENS」とのタイトルで華北交通アーカイブが紹介されました。

  1. History of occupied China through the lens | NHK WORLD-JAPAN News

2019-05-21

The Official NVIDIA Blogのブログ記事By the Book: AI Making Millions of Ancient Japanese Texts More Accessibleで、くずし字認識に関する研究が紹介されました。

なお日本語訳については、歴史を『読み解く』:AI で日本の古文書の膨大な文章をより多くの人々へ (2019-06-10)をお読み下さい。

くずし字認識に関連するその他の記事

  1. Deep learning creates Rosetta Stone for Medieval Japanese script, SAMSUNG NEXT (2019-04-23)
  2. 「くずし字」をAIで解読する研究がますます盛んに:機械学習と人文系の分野横断的研究も, Marvin(マーヴィン)人工知能・AIと機械学習の事例メディア (2019-05-21)
  3. 日本古文書のくずし字、GPU活用したAI技術で自動解析進む, マイナビニュース (2019-05-22)
  4. AIとOCRで、古典資料に書かれた「くずし字」を判読可能に――研究者たちの挑戦, ITmedia エンタープライズ (2019-05-27)

2019-05-14

カラーヌワット・タリンさんが進めるAIくずし字認識の研究に関する記事が、NIHU Magazineに掲載されました。

  1. 日本語:vol.037 - 情報学から読み解く日本古典文学:はじまりは『源氏物語』
  2. English: vol.037 - The Tale of Genji to computer science

2019-05-07

人文・社会科学におけるオープンサイエンス @ Japan Open Science Summit 2019の情報を公開しました。2019年5月28日開催です。

2019-05-01

日本古典籍くずし字データセット 文字種(くずし字)一覧の個々の文字を、元の古典籍画像上で確認できるようにしました。例えば「」の文字をクリックすると、くずし字認識ビューアで元の古典籍画像を表示し、文字の位置(四角形)を青線で表示します。これにより、切り取られる前の古典籍ではどのような文脈で使われた文字なのかを確認できます。

さらにこのビューアはAIくずし字認識(一文字)機能も備えておりますので、AI(ディープラーニング/機械学習)によるくずし字認識もお試しください。

  1. 日本古典籍くずし字データセット文字種(くずし字)一覧の個々の文字が元の古典籍画像上で確認できるように, カレントアウェアネス, 2019-05-08

2019-05-01

顔貌コレクション(顔コレ)は、サービス移転のため長期間にわたって停止しておりましたが、本日から再開しましたのでご利用下さい。

2019-04-27

くずし字アプリとして、くずし字一文字認識およびくずし字認識ビューアを公開しました。

2019-04-27

Quebec Artificial Intelligence Institute - Milaのブログ記事Choosing AI Benchmark Tasks to Benefit Other Fieldsにて、Kuzushiji MNISTくずし字データセットなどが紹介されました。

2019-04-01

新元号「令和」が発表されました。典拠となった文は、『万葉集』でご覧いただけます。

  1. 令和 - Wikipedia

2019-03-26

IIIF Curation Platformを更新しました。

  1. 新規公開: IIIF Curation Viewer Embedded
  2. 更新: IIIF Curation ViewerIIIF Curation PlayerIIIF Curation Finder

2019-03-18

くずし字検索を公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「くずし字検索」を公開, カレントアウェアネス, 2019-03-20

2019-02-16

カラーヌワット・タリンCODH特任研究員、北本朝展CODHセンター長らが、人文科学とコンピュータシンポジウム「じんもんこん2018」の最優秀論文賞を受賞しました。対象論文36件中、最も優秀な論文1件に与えられたものです。

受賞論文: End-to-End Pre-Modern Japanese Character (Kuzushiji) Spotting with Deep Learning

論文著者: Tarin Clanuwat(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)、 Alex Lamb(モントリオール大学MILA)、 Asanobu Kitamoto(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)

関連する研究内容につきましては、以下のウェブサイトなどをご覧ください。

  1. 日本古典籍くずし字データセット
  2. KMNISTデータセット
  3. くずし字チャレンジ!
  1. NIIニュース

2019-02-12

華北交通アーカイブ正式版を公開しました。

  1. 京都大学総合博物館での展示に関する情報
  2. 人文学オープンデータ共同利用センター(CODH)、華北交通アーカイブ正式版を公開:京都大学総合博物館でも関連展示を開催, カレントアウェアネス, 2019-02-12
  3. 日本公开3.5万余张中国抗日战争时期老照片(图), 新浪網, 2019-02-13
  4. 日本公开大量中国抗日战争老照片 系西日本地区首次, 国际新闻 环球网, 2019-02-13
  5. 这组日军侵华老照片展出 看过后让人感慨万千(图), 新浪網, 2019-02-14
  6. 「日本が3万点余りの中国侵略時の写真を公開」と中国メディア、微博ランキングでも上位に, Record China, 2019-02-14
  7. 日本公开侵华期间老照片, 凤凰网, 2019-02-14
  8. Japanese wartime photos strike a nerve in China, South China Morning Post, 2019-02-14
  9. Japanese college exhibits 35,000 rare photos from WWII aggression, Global Times, 2019-02-14
  10. 京都大学で80年前の中国を写した「華北交通写真展」を開催, 東方ネット, 2019-02-15
  11. 周末看展|华北交通写真:日本3.5万张照片里80年前的中国, 搜狐, 2019-02-15
  12. 日本公开3.5万张侵华时期照片 中国网友称无法原谅战争罪行, 搜狐, 2019-02-17
  13. 日本京都大学博物馆:华北交通写真之80年前的新乡, 新浪网, 2019-02-18
  14. 战争与图像:华北交通写真档案(1939-1945), 网易新闻, 2019-02-27
  15. 首次曝光!日本公开3.5万张侵华时照片,看看镜头中的女大学生, 东方新闻, 2019-05-09

2019-01-30

日本古典籍に関するオープンデータを大幅に拡充しました。

  1. 日本古典籍データセットに書籍データを追加し、点数が1,767→3,126、コマ数が329,702→609,631(約1.8倍)に増えました。特に春日懐紙/万葉集万葉集/春日懐紙春日懐紙/万葉集の3点は、重要文化財に指定されている貴重書です。
  2. 日本古典籍くずし字データセットに字形データを追加し、文字種が3,999→4,645、文字数が403,242→684,165(約1.7倍)に増えました。数点の料理本に加え、言葉遊び本『ぢぐち』や、人情本の代表作『春色梅児誉美』、人気滑稽本『浮世風呂』などを含みます。

なお上記の2つのデータセットの公開は、CODHと国文学研究資料館との共同研究に基づくものです。国文学研究資料館を中心とする歴史的典籍NW事業のおかげで、日本文学に関する大規模オープンデータの公開が実現しました。

  1. 「日本古典籍データセット」「日本古典籍くずし字データセット」の収録データが拡充, カレントアウェアネス, 2019-01-31

2019-01-17

Geoshapeリポジトリを大幅に拡充し、歴史的地名に関する情報源としての機能を充実させました。

  1. 国勢調査町丁・字等別境界データセットを公開しました。2019年1月現在、町丁・字は219,271件、市区町村と町丁字のリンク数は7,424,327件です。
  2. 歴史的行政区域データセットβ版に、「市区町村の歴史的変遷」(1970年4月以降)、「隣接行政区域」、「リンクトオープンデータ」の項目を追加しました。
  3. 歴史的地名/現代地名による境界データ検索をリリースしました。
  4. 歴史的行政区域データセットβ版国勢調査町丁・字等別境界データセットをリンクし、「現在の町丁・字はかつてどの市区町村に属していたか?」などを調べることができるようにしました。
  1. 人文学オープンデータ共同利用センター(CODH)、Geoshapeリポジトリを大幅に拡充し、歴史的地名に関する情報源としての機能を充実させたことを発表, カレントアウェアネス, 2019-01-21

2018年

2018-12-27

近代雑誌データセットで、『国民之友(第105号-第140号)』の画像を公開しました。

2018-12-08

KMNISTデータセットを公開しました。MNIST互換の機械学習データセットとして様々な目的に利用できます。Kuzushiji-MNIST、Kuzushiji-49、Kuzushiji-Kanjiの3種類のデータセットは、GitHubのリポジトリからダウンロードして下さい。最新情報は@rois_codhにもまとめています。

  1. 人文学オープンデータ共同利用センター(CODH)、MNISTデータセット互換のくずし字データセットKMNISTを公開, カレントアウェアネス, 2018-12-10

2018-11-30

IIIF Curation Platformを正式に公開しました。公開のポイントは以下の4点です。

  1. IIIF Curation ManagerIIIF Curation EditorIIIF Curation Playerを公開することで、IIIFの世界におけるキュレーションの生成から活用までのワークフローを一貫して支える情報基盤が構築できた。
  2. IIIF Curation PlatformをDocker環境にインストールするためのICP Dockerを公開した。
  3. IIIF Curation Platformのソースコードをダウンロードするためのページを新たに設置した。
  4. IIIF Curation Platformの活用例に、CODHがホスティングするDocker上で稼動するIIIF Curation Platformを活用した高知県立美術館の展示システムの事例を追加した。

それに加えて、これまで公開していたソフトウェアにも、多くの改良を加えています。

なお本研究に関する、より詳しい成果や意義については、2018年12月1日から2日にかけて開催される人文科学とコンピュータシンポジウム 「じんもんこん2018」にて発表します。

北本 朝展, 本間 淳, Tarek SAIER, "IIIF Curation Platform:利用者主導の画像共有を支援するオープンな次世代IIIF基盤", 人文科学とコンピュータシンポジウム じんもんこん2018, pp. 327-334, 2018年12月

またICPの使い方やインストールに関する基礎的な情報をまとめたICP Tutorial(CODH鈴木親彦)も同時に公開しています。

  1. 人文学オープンデータ共同利用センター(CODH)、 IIIF Curation Platformを正式公開, カレントアウェアネス, 2018-12-04

2018-11-21

歴史的行政区域データセットβ版に2018年版データを追加し、行政区域GeoJSON件数が82,318件から84,199件に増えました。またコロプレス地図の公開やデータセットの公開など、機能が充実しました。なおTopoJSONの拡充に伴って、GeoJSONのURLを変更しましたので、ご注意下さい。

2018-11-17

日本古典籍くずし字データセット / Kuzushiji Dataset(旧名:日本古典籍字形データセット / Dataset of PMJT Character Shapes)にDOI (10.20676/00000340)を付与しました。

2018-10-28

10月28日から始まった高知県立美術館「芳年」展。町絵師「絵金」が描いた作品「土佐年中風俗絵巻」の展示システムのバックエンドに、IIIF Curation Platformが活用されました(参考:@rois_codh)。大きな絵巻を自在に拡大縮小移動し、重要箇所の説明文が読めるようにしたいという要求に対して、IIIF Curation Viewerを活用してキュレーションを作成し、それぞれの要素に説明文を加え、JSONkeeperから提供するという仕組みを構築しました。IIIF Curation Platformという汎用的なバックエンドと、IIIFに準拠しつつ展示ごとにデザインをカスタマイズしたフロントエンドを組み合わせるという方法は、他の展示にも一般化できると考えています。

2018-10-14

KYOTOメモリーグラフの実証実験に関する記事が掲載されました。

  1. 市電の風景スマホで変遷探る アプリ使い実証実験、京都, 京都新聞, 2018-10-14

2018-09-26

Science Reportに、英訳記事「Changing the World with Data Science 02Data Science – the Humanities' New Tool」が公開されました。元の日本語記事は、「データサイエンスでここが変わる。02:データを発掘し、新たな歴史を記述する。」です。

2018-09-19

IIIF Curation Platformの公式ページを公開しました。またIIIF Curation Finderの詳細情報を公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、 IIIF Curation Platformの公式ページを公開:IIIF Curation Finderの詳細情報も公開, カレントアウェアネス, 2018-09-20

2018-08-28

日本古典籍字形データセットに関する取り組みがメディアで紹介されました。なお、記事中に「コンテストを開催する」とあるのは、「コンテストの開催を目指す」が正確な表現です。

  1. 情報・システム研、「くずし字」AIで解読 来年コンテストも, 日刊工業新聞, 2018-08-28

2018-08-04

歴史ビッグデータに関する取り組みがメディアで紹介されました。

  1. 幕末の台風ルート復元 「安政江戸」、関東と東海に大規模高潮, 京都新聞 夕刊7面, 2018-08-03
  2. 幕末の台風ルート復元 「防災想定に応用可」 歴史ビッグデータ生かせ 研究会発足, 佐賀新聞 26面, 2018-08-04
  3. 幕末の台風ルート復元 帝京大チーム 古文書から、防災応用も 多分野情報重ね分析, 大阪日日新聞 21面, 2018-08-04
  4. 台風の進路 古文書から復元, 朝日新聞大阪夕刊, 2018-11-29

2018-08-01

国文研ニューズ No.52に掲載された高岸輝氏による「絵巻研究とデジタル画像の活用」にて、顔貌コレクションが紹介されました。

2018-07-30

江戸料理レシピデータセットに『万宝料理秘密箱 卵百珍』画像一覧を追加し、画像から江戸料理レシピにアクセスできるようにしました。

2018-07-29

歴史的行政区域データセットβ版を更新し、TopoJSONデータなどを追加しました。

2018-07-28

見て楽しむ大名家デザイン集「紋・道具」にデータを追加しました。

2018-07-16

レ アィン ドゥックさんが特任研究員としてCODHのメンバーに加わりました。

2018-07-06

カラーヌワット・タリン特任研究員が、TC10/TC11 Summer School on Document Analysis: Traditional Approaches and New Trendsにて、Excellence Awardを受賞しました。これはサマースクール参加者の中から、特に優秀な実験を行った1名に与えられるものです。

2018-07-05

近代雑誌データセットで、『国民之友(第71号-第104号)』の画像を公開しました。

2018-06-05

江戸時代の料理本『卵百珍』の新たなレシピシリーズが始まりました。第1回は金糸卵のレシピ「旨味濃厚!ウニの金糸卵」です(【江戸の味】旨味濃厚!ウニの金糸卵 by クックパッド江戸ご飯)。

国文学研究資料館、クックパッドとの連携に、養鶏業界紙「鶏鳴新聞」、たまごソムリエ友加里さんが加わり、情報系研究機関×人文系研究機関×ネット企業×メディア×芸能界という異色の5者コラボを展開します。

  1. 鶏鳴新聞 5面 友加里さんの『卵百珍』 レシピ連載スタート, 2018-06-05
  2. 【友加里 連載情報】「鶏鳴新聞」連載スタート!(株式会社フリップアップ)
  3. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その② 海鮮風味の銀糸卵「銀糸卵」, 2018-06-15
  4. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その③ 酒の肴に合う コクうま!かもじ卵「かもじ卵」, 2018-06-25
  5. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その④ 純白の白髪卵!「白髪卵」, 2018-07-05
  6. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑤ 色鮮やか!カラフル糸組卵「糸組卵」, 2018-07-15
  7. 鶏鳴新聞 15面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑥ おもてなし!五色卵のお吸い物「五色卵」, 2018-07-25
  8. 鶏鳴新聞 13面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑦ トッピングに大活躍!紅焼卵, 2018-08-15
  9. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑧ 料理も映える!爽やかな青海卵, 2018-08-25
  10. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑨ 世界に一つだけの黄身返し卵, 2018-09-05
  11. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑩ ヘルシー!饅頭卵, 2018-09-25
  12. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑪ 三時のおやつに絶品小倉卵, 2018-10-05
  13. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑫ 一口サイズのコロコロ小豆餅卵, 2018-10-15
  14. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑬ ふわふわ食感!定家卵, 2018-11-05
  15. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑭ プルプル食感!唐秬卵, 2018-11-25
  16. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑮ ふわふわとろける!淡雪卵, 2018-12-05
  17. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑯ しっとりジューシー中華風!鳥煮込卵, 2018-12-15
  18. 鶏鳴新聞 31面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑰ ツルンっともっちり!長崎ズズヘイ, 2019-01-05
  19. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑱ 新感覚!とろ~り卵の柚干卵, 2019-01-25
  20. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑲ サクサク食感!江戸の卵煎餅, 2019-02-05
  21. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その⑳ さわやかお菓子!卵安留平糖, 2019-02-25
  22. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉑ やさしい甘さ ふわふわ梅仁卵・求肥卵, 2019-03-25
  23. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉒ 具だくさん!長崎卵飛龍頭, 2019-04-15
  24. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉓ 新食感!丸雪卵, 2019-04-25
  25. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉔ モチッと香ばし!麦飯卵, 2019-05-15
  26. 鶏鳴新聞 7面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉕ 肉厚ジューシー!松茸煎込卵, 2019-05-25
  27. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉖ モチッと食感!海苔巻卵, 2019-06-05
  28. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉗ コクのある味わい!漉粉卵善哉, 2019-06-15
  29. 鶏鳴新聞 5面 「三ツ星タマリエ友加里の万宝料理秘密箱 卵百珍」その㉘ もっちり美味しい!芋巻卵, 2019-06-25

2018-06-01

以下の論文で江戸料理レシピデータセットが紹介されました。

  1. 松原 恵, 小宮山 史, 山本 和明, 歴史的典籍NW事業と江戸料理-企業とのコラボの可能性と課題, 情報の科学と技術, 2018, 68 巻, 6 号, p. 285-290, doi:10.18919/jkg.68.6_285

2018-05-23

キュレーションを活用したIIIF検索エンジンのプロトタイプとなるIIIF Curation PlatformおよびIIIF Curation Finderを公開しました。またこのプラットフォームを美術史研究に利用するための顔貌コレクション(顔コレ)も公開しました。

  1. 人文学オープンデータ共同利用センター(CODH)、「IIIF Curation Finder」「IIIF Curation Platform」「顔貌コレクション(顔コレ)」を公開, カレントアウェアネス, 2018-05-23

2018-04-28

ニコニコ超会議「超みんなで翻刻してみた2018」武鑑全集を紹介しました。

  1. 「ニコニコ超会議2018」サブカルカオスの中で科学技術は輝くか (ニュースイッチ Newswitch)

2018-04-27

武鑑全集」に「紋・道具」を加えました(詳しい説明)。

  1. 人文学オープンデータ共同利用センター(CODH)、「武鑑全集」に「紋・道具」を追加, カレントアウェアネス, 2018-05-01

2018-04-26

くずし字、いろいろ」に、CODHが公開する日本古典籍字形データセットが利用されました。

  1. “くずし字”ジェネレーター、国文学研究資料館などが開発、文章を変換して古典籍風の画像として生成、Twitterでシェアも可能 (INTERNET Watch)
  2. 素晴らしすぎ!入力した文字を古文書の”くずし字”に変換してくれる「くずし字、いろいろ。」 (ニコニコニュース)

2018-04-16

カラーヌワット・タリンさんが特任研究員としてCODHのメンバーに加わりました。

2018-04-04

IIIF Curation Viewerのバージョン1.4を公開しました。主な改良点は、プラグインによる機能拡張への対応や、外部キュレーションのリスト編集への対応です。

2018-02-13

サイエンスリポートのインタビュー記事データサイエンスでここが変わる。02:データを発掘し、新たな歴史を記述する。が公開されました。

2018-02-09

国文学研究資料館の「古典に親しむ」の記事「江戸時代のレシピ本」で江戸料理レシピデータセットが紹介されました。

2018-02-02

くずし字チャレンジ!のページを更新し、人文科学とコンピュータ研究会でのパネルディスカッション・PRMU CH賞表彰の記事を追加しました。

2018-01-30

第6回CODHセミナー 歴史ビッグデータ〜過去の記録の統合解析に向けた古文書データ化の挑戦〜の申し込みを開始しました。

  1. 【イベント】第6回CODHセミナー「歴史ビッグデータ~過去の記録の統合解析に向けた古文書データ化の挑戦~」(3/12・東京), カレントアウェアネス, 2018-01-31

2017年

2017-12-29

くずし字チャレンジ!に関連した記事が掲載されました。

  1. 古文書解読 機械で挑戦, 読売新聞 多摩版, 25面, 2017年12月29日

2017-12-26

日本古典籍データセットを大幅に拡充し、点数が701→1,767、コマ数が158,533→329,702に増えました。

  1. 【プレスリリース】 「日本古典籍データセット」を大幅に拡充/日本文化を楽しめる料理本や伊勢物語、「武鑑」、絵本を多数公開(国立情報学研究所)

また以下のメディアで紹介されました。

  1. 「日本古典籍データセット」、収録点数を2倍以上に拡充:ビューアーの機能も向上, カレントアウェアネス, 2017-12-27

2017-12-22

人文学オープンデータ共同利用センター特任研究員募集(〆2018.1.24)を開始しました。ご応募をお待ちしています。

2017-12-18

国文学研究資料館と共同して、今年もLOD Challenge 2017データ提供パートナーとして参加し、データセットを提供します。

2017-12-13

CODHがサポートするオープンソースソフトウェアJSONkeeperを公開しました。ソフトウェアからご覧下さい。

2017-12-05

「字形データセット」データ作成基本仕様を公開しました。

2017-11-15

The 4th International Workshop on Historical Document Imaging and Processing (HIP 2017)にて、日本古典籍字形データセットを活用した論文が、ワークショップの最優秀論文としてIAPR Best Paper Awardを受賞しました。より詳しい情報はくずし字チャレンジ!のページをご覧下さい。

2017-11-13

JADH 2018のウェブサイトをプレオープンしました。

2017-11-10

IIIFのニュース記事「IIIF Tour of Japan」で、IIIF Japanイベントの開催報告が取り上げられました。

2017-11-09

Edo+150プロジェクト武鑑全集くずし字チャレンジ!を公開しました。

  1. 人文学オープンデータ共同利用センター、大政奉還150年を記念して、「Edo+150プロジェクト」「武鑑全集」「くずし字チャレンジ!」プロジェクトを開始, カレントアウェアネス, 2017-11-09

2017-10-27

国文学研究資料館が新日本古典籍総合データベースを正式に公開しました。CODHのオープンデータも言及されています。

  1. 日本古典籍のポータルサイト 正式公開へ 先人達の「知」に、だれでも・いつ・どこからでも簡単アクセス(国文学研究資料館)
  2. パンフレット(国文学研究資料館)
  3. CiNii Booksに新機能/新日本古典籍総合データベースと連携/古典籍の本文画像公開ページに直接アクセス(国立情報学研究所)

2017-10-13

日本古典籍字形データセットで、データがダウンロードできなくなっていた問題を修正しました。

2017-10-12

IIIFグローバルキュレーションを公開しました。

2017-10-11

IIIF Curation Viewerをバージョン1.3に更新しました。またこの新バージョンをお試しするためのIIIF Curation ViewerのデモンストレーションIIIF Curation ViewerのインストールおよびおすすめIIIFサイトを公開しました。

2017-10-10

DS施設公募型共同研究で2件の共同研究が採択されました。

  1. メモリーハンティングを活用した戦後から現在の京都の景観変化に関する研究-京都市電のデジタル・アーカイブ写真を事例として-
  2. スマホ・アプリ「長崎古写真ハンティング」の実証実験

2017-10-02

2つのイベントの告知を開始しました。

  1. 【イベント】IIIF Japan シンポジウム 〜 デジタルアーカイブにおける画像公開の新潮流 〜(10/17・東京), カレントアウェアネス, 2017-10-02
  2. 【イベント】「デジタルアーカイブ」と「研究データ」の出会いシンポジウム~データの保存と活用へ、ライブラリアンとアーキビストの挑戦 (11/6・東京), カレントアウェアネス, 2017-10-02

2017-10-01

市野美夏さんが特任研究員としてCODHのメンバーに加わりました。

2017-09-26

岩波書店「科学」2017年10月号に、デジタル史料批判によるシルクロード遺跡の再発見が掲載されました。

2017-09-20

日本橋三越本店および銀座三越では、9月20日から10月3日まで江戸料理を店頭販売しています。江戸料理レシピデータセットのように、江戸の料理本の翻刻と現代レシピを対応させ、当時のレシピを現代風にアレンジしています。

  1. 【プレスリリース】いま「江戸」料理をお手元へ 国⽂研と三越伊勢丹がコラボ! 9⽉20⽇から「江⼾の味」を販売(国文学研究資料館)
  2. 国文学研究資料館、江戸料理の再現・アレンジキャンペーンに協力, カレントアウェアネス, 2017-09-19
  3. How to Taste Japanese Food as It Was Prepared Centuries Ago, Tokyo Weekender, 2017年9月
  4. 東京)研究者と老舗料亭が江戸料理を再現し販売, 朝日新聞都内版, 2017年10月1日

2017-09-19

江戸時代の人気料理本「萬寶料理秘密箱」の卵料理が現代レシピに!, 鶏の研究, 2017年10月号, 57ページ に江戸料理レシピデータセットが掲載されました。

2017-09-12

CODHコンファレンスのページに、JADH 2018とTEI 2018の開催日を記載しました。

2017-08-30

国文学研究資料館が企画したEAJS2017のプレイベント「日本語の歴史的典籍の近未来」にて、クリエイティブなハサミとノリ:IIIF Curation Viewerと人⽂情報学の探求とのタイトルでCODHの活動を紹介しました。

2017-08-26

第1回CODHチュートリアル DOIを中心とした識別子システムの全体像を開催しました。

2017-08-25

鶏卵・食鳥に関する業界紙「鶏鳴新聞」で、卵百珍レシピの連載が始まりました。初回の記事は現代によみがえる『卵百珍』 国立情報学研究所と国文学研究資料館がレシピを順次公開中をご覧下さい。

  1. 鶏鳴新聞 第2004号 7面 万宝料理秘密箱 卵百珍 その① たこ焼き器で作るしめじ型の卵「卜活卵(しめぢたまご)」, 2017-08-25
  2. 鶏鳴新聞 第2005号 5面 万宝料理秘密箱 卵百珍 その② お箸で作れる!かんたん花卵「花卵(はなたまご)」, 2017-09-05
  3. 鶏鳴新聞 第2006号 5面 万宝料理秘密箱 卵百珍 その③ 好きな模様に☆茶巾形のゆで卵「茶巾卵(ちゃきんたまご)」, 2017-09-15
  4. 鶏鳴新聞 第2007号 5面 万宝料理秘密箱 卵百珍 その④ うずらの卵で作るおはぎ「小豆餅卵(あずきもちたまご)」, 2017-09-25
  5. 鶏鳴新聞 第2008号 5面 万宝料理秘密箱 卵百珍 その⑤ 江戸時代のオムレツ!? 「鶉卵(うずらたまご)」, 2017-10-05
  6. 鶏鳴新聞 第2009号 5面 万宝料理秘密箱 卵百珍 その⑥ 和食にも、洋食にも!!「源氏卵(げんじたまご)」, 2017-10-15
  7. 鶏鳴新聞 第2010号 5面 万宝料理秘密箱 卵百珍 その⑦ まさに江戸のカステラ「家主貞良卵(かすてらたまご)」, 2017-10-25
  8. 鶏鳴新聞 第2011号 5面 万宝料理秘密箱 卵百珍 その⑧ おつまみに!卵の酒粕漬け「糟漬卵(かすづけたまご)」, 2017-11-05
  9. 鶏鳴新聞 第2012号 5面 万宝料理秘密箱 卵百珍 その⑨ 江戸時代のプリン。黒蜜をかけても!「冷し卵羊羹(ひやしたまごようかん)」, 2017-11-15
  10. 鶏鳴新聞 第2013号 5面 万宝料理秘密箱 卵百珍 その⑩ 素材を味わう、ふんわり卵豆腐「卵豆腐(たまごどうふ)」, 2017-11-25
  11. 鶏鳴新聞 第2014号 7面 万宝料理秘密箱 卵百珍 その⑪ 江戸時代の卵サラダ「卵膾(たまごなます)」, 2017-12-05
  12. 鶏鳴新聞 第2016号 31面 万宝料理秘密箱 卵百珍 その⑫ 刺身がおすすめ「卵蒲鉾(たまごかまぼこ)」, 2018-01-05
  13. 鶏鳴新聞 第2017号 7面 万宝料理秘密箱 卵百珍 その⑬ やまぶき色の卵料理「卵山吹蒲鉾(たまごやまぶきかまぼこ)」, 2018-01-25
  14. 鶏鳴新聞 第2018号 5面 万宝料理秘密箱 卵百珍 その⑭ 江戸時代のパワーフード「卵白粥(たまごしろがゆ)」, 2018-02-05
  15. 鶏鳴新聞 第2019号 5面 万宝料理秘密箱 卵百珍 その⑮(最終回) お酒の締めにも「卵潮煎(たまごうしおに)」, 2018-02-15

2017-08-21

IIIFのニュース記事「IIIF in Japan」で、第4回CODHセミナー デジタルアーカイブにおける画像公開の新しいトレンド~IIIFが拓く画像アクセスの標準化と高度化~の開催報告が取り上げられました。

2017-08-13

CODHチュートリアルCODHコンファレンスCODHコンペティションを公開しました。

2017-08-04

第4回CODHセミナー デジタルアーカイブにおける画像公開の新しいトレンド~IIIFが拓く画像アクセスの標準化と高度化~の発表資料を公開しました。それぞれの発表資料にはDOIも付与しています。

2017-08-03

近代雑誌データセットの一つとして、『東洋学芸雑誌(第1号-第87号)』の画像を公開しました。

  1. 人文学オープンデータ共同利用センター、近代雑誌データセット『東洋学芸雑誌』を公開, カレントアウェアネス, 2017-08-07

2017-08-02

奈良絵本顔貌データセットを公開しました。

2017-08-01

読売新聞で江戸料理レシピデータセットが紹介されました。

  1. 読売新聞, 朝刊, 2017-08-01

2017-07-27

ディジタル・シルクロードの『東洋文庫所蔵』貴重書デジタルアーカイブが、IIIFによる高解像度画像の公開+書籍へのDOIの付与を開始しました(ニュース)。

  1. 『東洋文庫所蔵』貴重書デジタルアーカイブ、IIIFによる高解像度画像の公開とコンテンツへのDOIの付与を開始, カレントアウェアネス, 2017-08-14

2017-07-26

IIIF Curation Viewer v1.2およびIIIF Curation Viewer for Timeline v1.2を公開しました。また、これらのソフトウェアで実装したIIIF規格の拡張であるCuration APITimeline APICursor APIの仕様を、日本語と英語(仮訳)で公開しました。

2017-07-25

日本古典籍キュレーションとして、3本のキュレーションを公開しました。

2017-07-23

トップページおよびいくつかの下層ページのテキストを英語に翻訳しました。

2017-07-19

2大学共同利用機関法人が連携・協力推進で協定 ~情報・システム研究機構と人間文化研究機構が連携協定に調印~

  1. 情報・システム研究機構と人間文化研究機構が連携協定を調印, カレントアウェアネス, 2017-07-26

2017-07-16

読売新聞で日本古典籍字形データセットが紹介されました。

  1. 読売新聞「コレハ人間 瞬時に識別」, サイエンスView, 朝刊17面, 2017-07-16

2017-06-23

歴史的行政区域データセットβ版に2017年版データを追加し、本日時点までの各種データ修正も適用した結果、行政区域件数が16,428件から16,429件に、行政区域GeoJSON件数が82,311件に増えました。

2017-06-02

日本古典籍データセットおよび日本古典籍字形データセットを更新しました。日本古典籍データセットは、点数が700→701、コマ数が158,455→158,553に増加し、日本古典籍字形データセットは、文字種が1,521→3,999、文字数が86,176→403,242に増えました。

2017-05-25

江戸料理レシピデータセットを更新し、レシピが5→15、現代語訳が20→40に増えました。

2017-05-22

人文学研究データリポジトリを公開しました。

2017-04-29

国文学研究資料館が新日本古典籍総合データベースの試験公開を開始し、古典籍にDOIが付与されましたので、日本古典籍データセットでもDOIの表示を開始しました。

2017-04-03

IIIF Curation Viewer v1.1を公開しました。好みのページ(コマ)を収集して保存、公開するためのキュレーション機能がビューワ上から利用できます。古典籍を対象に、自分のコレクションを公開して下さい。

2017-04-01

人文学オープンデータ共同利用センターが正式に誕生しました。2016年4月に準備室としてスタートしましたが、2017年4月からはセンターとなり、鈴木親彦さんが特任研究員としてCODHのメンバーに加わりました。外部との連携も一層拡大していきたいと考えていますので、どうぞよろしくお願いします。

  1. 人文学オープンデータ共同利用センター、正式発足, カレントアウェアネス, 2017-04-04

2017-03-20

第21回 PRMUアルゴリズムコンテスト この文字読めますか? 〜くずし字認識にチャレンジ!〜の告知が始まりました。CODHは日本古典籍字形データセットを提供し、コンテストの企画にも関わります。

2017-03-13

CODHで開発を進めるメモリーグラフスマートフォンアプリを活用した「長崎古写真ハンティング」について、長崎市長への成果報告がメディアで取り上げられました。長崎古写真ハンティングは、長崎外国語大学の姫野順一教授との共同研究でただいま開発中です。

  1. KTNテレビ長崎, 報道番組, 2017-03-13
  2. NCC長崎文化放送, メモリー・ハンティングで観光周遊コースを開発, 2017-03-13

2017-03-09

一般社団法人オープン&ビッグデータ活用・地方創生推進機構(VLED)が主催する2016年度勝手表彰にて、国文学研究資料館と人文学オープンデータ共同利用センター準備室が進める「日本古典籍デジタルデータのオープン化」がOpen Knowledge Japan賞を受賞しました。

  1. 2016年度VLED勝手表彰 受賞者⼀覧
  2. NIIニュース

2017-02-25

平凡社『こころ』Vol.35(2017年2月25日発行)の「ディジタル・シルクロード・アーカイブスの試み」の記事に、ディジタル・シルクロードが紹介されました。

2017-01-29

日本古典籍データセットのIIIF画像配信サーバの設定ミスを修正しました。これにより、IIIF Curation Viewer以外の各種IIIFビューアーでも、画像を正常に表示できるようになりました。

2017-01-15

歴史的行政区域データセットβ版を公開しました。

2017-01-13

ディジタル・シルクロードの『東洋文庫所蔵』貴重書デジタルアーカイブに新たに8冊の本を加え、合計で245冊、72,591ページとなりました。

2017-01-06

国文学研究資料館と共同して、LOD Challenge 2016データ提供パートナーとして参加し、データセットを提供しました。

2017-01-04

東洋大学の西村陽子准教授、国立情報学研究所の北本朝展准教授の論文が、『陝西師範大学学報』における2016年優秀論文に選ばれました。

受賞論文:絲綢之路遺址之重新定位与遺址数拠庫之建立

受賞者:西村陽子(東洋大学、元国立情報学研究所特任研究員)、北本朝展(国立情報学研究所、情報・システム研究機構人文学オープンデータ共同利用センター)

2016年

2016-11-29

華北交通アーカイブを公開しました。

  1. 【プレスリリース】 戦前・戦中の中国北部の様子を伝える「華北交通アーカイブ」を公開〜宣伝活動用写真と交通網データをリンクした研究データベース〜(国立情報学研究所)

また以下のメディアで紹介されました。

  1. 華北地方の戦前・戦中伝える秘蔵写真公開(Science Portal China)
  2. 貴志教授ら研究グループによって行われた華北交通写真資料シンポジウム、写真展について各新聞に掲載されました(京都大学地域研究統合情報センター)
  3. 戦中の中国の写真を展示 華北地方で国策会社が撮影(産経フォト)2016-12-03
  4. 写真時評〜モンタージュ 現在×過去〜 華北交通の秘蔵写真(サイゾーpremium)2016-12-29

2016-11-24

江戸料理レシピデータセットを公開しました。

  1. 【プレスリリース】 江戸の文化を現代に取り込む「江戸料理レシピデータセット」を整備~江戸時代の料理本を「レシピ化」し、クックパッドでも公開~(国立情報学研究所)
  2. 【プレスリリース】 江戸の文化を現代に取り込む「江戸料理レシピデータセット」を整備~江戸時代の料理本を「レシピ化」し、クックパッドでも公開~(国文学研究資料館)

また以下のメディアで紹介されました。

  1. 江戸時代の和菓子再現=「卵ようかん」料理本から-情報研(時事ドットコムニュース)
  2. 「江戸料理レシピデータセット」公開、天明5年刊行の料理本から卵料理107点をデジタル化 現代向けにアレンジしたレシピも「クックパッド」で公開(INTERNET Watch)
  3. 江戸時代のスイーツなどのレシピ 投稿サイトで公開(NHK NEWS WEB)
  4. 東京)江戸時代の料理レシピを公開 国文研など(朝日新聞デジタル), 朝日新聞 朝刊23面 2016-11-25
  5. 江戸の菓子や料理のレシピ公開…冷卵羊羹など(YOMIURI ONLINE), 読売新聞 朝刊39面 2016-11-25
  6. 情報学研など、クックパッド活用−「和食」の歴史と文化普及へ、江戸時代のレシピ公開(日刊工業新聞電子版), 日刊工業新聞 朝刊4面 2016-11-25
  7. 国立情報学研究所と国文学研究資料館、「江戸料理レシピデータセット」を公開, カレントアウェアネス, 2016-11-25
  8. これは試したい!クックパッドで江戸時代の料理本レシピが公開「江戸料理レシピデータセット」(Japaaanマガジン)
  9. 何これ、美味しそう!江戸時代の料理本がレシピ化され、クックパッドで公開(IRORIO)
  10. Recipes for Edo-Period cuisine offered online(NHK WORLD)
  11. 江戸時代のスイーツはどんな味?200年前の料理本レシピがクックパッドに 江戸時代の味がお家で!「つくれぽ」も大歓迎(BuzzFeed)
  12. お料理で江戸を体験。国立情報学研究所が江戸ご飯レシピを公開(GIZMODO)
  13. 18世紀の料理本に記載されたレシピがクックパッドに 見た目も美しい江戸時代の卵料理にチャレンジしてみては?(ねとらぼ)
  14. 11/24の和食の日に合わせて、江戸時代の料理本「万宝料理秘密箱」の卵料理レシピ107点が公開。このプロジェクトがすごいのは、古文書を現代の生きた情報にするために…(ツイナビ)
  15. 「江戸ご飯レシピ」再現、作って食べてみた(日テレNEWS24 2016年11月30日)
  16. 江戸時代の人々のグルメっぷりに舌を巻く! 当時の料理本を現代語に訳したレシピ約30点がクックパッドに公開(Pouch)
  17. 江戸時代のオムレツって? 昔のレシピ、クックパッドにも掲載(OVO)
  18. クックパッドに掲載「江戸料理レシピデータセット」担当者生解説(フジテレビ「ホウドウキョク」 2016年12月6日)
  19. 江戸っ子の味を現代に。クックパッドで江戸料理!(TOKYO FM+ 2016年12月15日)
  20. 読売新聞「おあしす」 2016年11月25日
  21. 日本情報産業新聞「くずし字を現代語訳 江戸時代のレシピを再現」, 朝刊2面, 2016年11月25日
  22. ジャパンナレッジNEWS「江戸料理を作ってみよう!」, 2016年11月29日
  23. 科学新聞「江戸時代の料理本 手順をデジタル化」, 6面, 2016年12月9日
  24. InterFM897「Happy Hour!」 2016年12月8日
  25. TBSテレビ「白熱ライブ!ビビット」 2016年12月15日
  26. 日テレ「ズームイン!!サタデー」 2016年12月17日
  27. 朝日学生新聞 2016年12月21日
  28. 江戸ガールもスイーツに夢中! 江戸時代のベストセラーレシピが公開【お正月】 (wotopi)
  29. FMヨコハマ「Lovely Day」, 2017年1月2日
  30. 日本経済新聞「文化往来 江戸料理のレシピ、クックパッドで公開」, 朝刊(36面), 2017年1月6日
  31. J-WAVE POP UP!「7-ELEVEN GOURMET-3」, 2017年1月12日
  32. 読売新聞深読みチャンネル「クックパッドに「江戸ご飯」が掲載された深い理由」, 2017年1月13日
  33. 読売新聞「江戸時代の卵料理再現」, 2017年3月20日
  34. えくてぴあん「作ってみました『江戸ご飯』」1〜4、2017年1月〜2017年4月
  35. BS日テレ「料理はじまり帖」第5段、2017年1月28日
  36. Jチャン山口「江戸料理レシピデータセット066 長崎卵飛龍頭」、2017年2月8日
  37. アサココ「古典籍のオープンデータ700点余」、2017年3月2日
  38. 月刊江戸楽4月号「江戸のスイーツ特集」、2017年3月20日
  39. ニュースイッチ「いにしえの知見を現代に!国文研、古典文献30万点を画像化 医学や生命科学、自然災害など異分野の融合研究を促し新分野の創造」, 2017年5月9日
  40. ママテナ「みをつくし料理帖で話題!美味しい楽しい江戸料理レシピ」, 2017年5月17日
  41. クックパッドニュース「【DAIGOも絶賛】「もしかしてズレてる?」で紹介された!超簡単おつまみレシピ」, 2017年6月12日
  42. AERA dot. (アエラドット) 「江戸っ子が愛した和食の原点「江戸料理」を再現してみた! (1/2) 〈週刊朝日〉」, 2017年7月4日
  43. 桐谷美玲 hashtag|NEWS ZERO|日本テレビ「注目の"歴メシ"食事会で"驚き料理"」, 2017年9月12日

2016-11-17

日本古典籍字形データセットを公開しました。

  1. 【プレスリリース】 江戸時代の文字の字形データセットを国文研との協働で構築/機械と人間の学習のためのオープンデータとして公開(国立情報学研究所)
  2. 【プレスリリース】 くずし字学習、文字認識に朗報!日本古典籍字形データセット 8万字を公開(国文学研究資料館)

また以下のメディアで紹介されました。

  1. 江戸時代のくずし字1521文字種・8万6176件の字形データセット無償公開、ディープラーニングを用いた文字認識のサンプルプログラムも~NIIと国文研(INTERNET Watch)
  2. 国文学研究資料館、日本古典籍字形データセットを公開, カレントアウェアネス, 2016-11-18
  3. 古文書を自動翻訳する日も近い!?江戸時代の8万字超の「くずし字 字形データ」が無償公開へ(Japaaanマガジン)
  4. 江戸時代の料理本などからとった「くずし字」8万6176文字をオープンデータとして公開(MdN Design Interactive)

2016-11-17

日本古典籍データセットに8点の本文テキストデータを追加しました。追加したのは当世料理万宝料理秘密箱膳部料理抄料理物語日用惣菜俎不時珍客即席庖丁料理方心得之事新編異国料理料理秘伝抄です。

2016-11-16

日本古典籍データセットに、書誌データや本文テキストデータのみをまとめたパッケージを用意しました。画像が不要な方は、書誌や本文テキストのみをダウンロードできます。

2016-11-15

本センターが共催する「歴史的典籍オープンデータワークショップ~使いたおそう!古典籍データ~」の申し込みが始まりました。

2016-11-10

日本古典籍データセットを公開しました。

  1. 【プレスリリース】 「日本古典籍データセット」公開で国文研と協働/国内研究機関のオープンデータの取り組みを支援・推進(国立情報学研究所)
  2. 【プレスリリース】 のぞき⾒しません?・・・古典の世界! ⽇本古典籍データセット700点⼤公開(国文学研究資料館)
  3. 日本古典籍データセット(国文学研究資料館)

また以下のメディアで紹介されました。

  1. 国文学研究資料館、日本古典籍データセットを公開, カレントアウェアネス, 2016-11-10
  2. 古典籍オープンデータに, 読売新聞, 2016-11-18

2016-11-07

人文学オープンデータ共同利用センター 特任研究員(特定有期雇用職員)の公募を開始しました。締め切りは2017年1月6日(必着)です。皆様の積極的なご応募をお待ちしております。

2016-11-06

ウェブサイトをリニューアルオープンしました。

2016-11-05

メモリーグラフのAndroidアプリをGoogle Playで一般公開しました。

2016-11-02

「古典籍のくずし字翻刻 自然科学や防災 幅広い活用期待」(中日新聞朝刊 13面)で、10月20日のPRMU研究会での発表を中心に、古典籍のくずし字翻刻の最新状況と今後の展開が紹介されました。

2016-11-01

人工知能学会誌(2016年11月号)に論文が掲載されました。
西村 陽子, 北本 朝展, "ディジタル史料批判と歴史学における新発見," 人工知能学会誌, Vol. 31, No. 6, pp. 769-774, 2016年11月

2016-10-20〜21

オープンサイエンス~研究資源と研究体制のオープン化~(パターン認識・メディア理解研究会(PRMU))で、センターの活動を紹介しました。
北本 朝展, "オープンサイエンスの動向と情報学分野へのインパクト," 電子情報通信学会技術報告, Vol. 116, No. 259, pp. 1-6, 2016年10月

2016-05-09

情報・システム研究機構、人文学オープンデータ共同利用センター準備室を開設(STI Updates)で紹介されました。

2016-04-01

情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター準備室がスタートしました。

  1. 情報・システム研究機構、人文学オープンデータ共同利用センター準備室を開設, カレントアウェアネス, 2016-04-25