日本では、古典籍・古文書・古記録などの過去の資料(史料)が千年以上も大切に受け継がれており、数億点規模という、世界でも稀にみる大量の資料が現存しています。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが喫緊の重要な課題となっています。そこで本シンポジウムは、AI(人工知能)を活用してくずし字を読み解く研究の、過去・現在から未来までを議論し、世界に広がるくずし字研究の最前線をご紹介します。
基本情報
日時 | 2019年11月11日(月) 10:00〜17:45(9:30開場) |
会場 |
一橋講堂 東京都千代田区一ツ橋2丁目1-2 学術総合センター2F グーグルマップ |
参加費 | 無料 |
参加申込 |
事前登録をお願いします → 申込ページ
なお定員を越えた場合は申込を途中で打ち切る場合がありますので、お早めにお申し込み下さい。 |
言語 | 日本語、一部英語(日本語同時通訳あり) |
生中継/アーカイブ |
本シンポジウムは、YouTube生中継とアーカイブ動画の公開を行います。参加が難しい方や当日に視聴できない方は、下記リンクからYouTubeチャネルにアクセスしてください。
→ ROIS-DS CODH YouTubeチャンネル |
ニュース
2019-11-18
発表資料とポスターを公開しました。各発表のタイトルからリポジトリにリンクしています。
2019-11-12
シンポジウムの来場者は225名でした。ご参加いただき、ありがとうございました。
2019-11-11
日本古典籍くずし字データセットおよびKuroNetくずし字認識を公開しました。
2019-11-08
YouTubeによる生中継/アーカイブの情報を掲載しました。
2019-10-07
シンポジウムの登録者が200名を越えました。
2019-10-06
シンポジウムの告知用ポスターを公開しました。ご自由にダウンロードしてお使いください。
2019-09-13
シンポジウムの参加申込を開始しました。
プログラム
9:30 | 開場 | |
10:00-10:10 | 開会挨拶 | 北本 朝展 (ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所) |
セッション1-日本の文字文化とAI | ||
10:10-10:35 | 木簡情報のオープンデータ化と文字画像DB連携の強化 | 馬場 基 (奈良文化財研究所) |
10:35-11:00 | 東京大学史料編纂所における字形データの蓄積経緯と花押データへの展開 | 井上 聡 (東京大学史料編纂所) |
11:00-11:25 | 新たな検索機能提供のための調査研究活動―次世代デジタルライブラリーを中心とした近年の取組紹介― | 青池 亨 (国立国会図書館電子情報部電子情報企画課次世代システム開発研究室) |
11:25-11:50 | 市民参加とAI―「みんなで翻刻」開発者の立場から | 橋本 雄太 (国立歴史民俗博物館) |
11:50-13:10 | 昼食休憩/講演者によるデモンストレーション | |
13:10-13:15 | 基調講演紹介 | 北本 朝展 (ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所) |
基調講演-AIによるくずし字認識の展望 | ||
13:15-13:50 | 文字認識研究の過去・現在・未来 | 内田 誠一 (九州大学大学院システム情報科学研究院) |
13:50-14:25 | 過去からの挑戦状-くずし字認識の未来- | 佐々木 孝浩 (慶應義塾大学附属研究所斯道文庫) |
セッション2-くずし字データセット100万文字公開とデジタル人文学研究 | ||
14:25-14:40 | NIJL-NWプロジェクトとくずし字データセット | 山本 和明 (国文学研究資料館) |
14:40-14:55 | デジタル人文学研究とAIくずし字認識 | 北本 朝展 (ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所) |
14:55-15:25 | 休憩/講演者によるデモンストレーション | |
セッション3-Kaggleコンペティション | ||
15:25-15:40 | 世界中のアイデアを集めるくずし字コンペの開催 | カラーヌワット タリン (ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所) |
15:40-15:55 | 世界中のAI研究者がくずし字に挑んだ結果 | Alex Lamb (モントリオール大学MILA) |
セッション4-Kaggle授賞式、Kaggle入賞者講演、ディスカッション | ||
- | Kaggleコンペ祝辞、授賞式 |
喜連川 優
(国立情報学研究所)
ロバート キャンベル (国文学研究資料館) |
- | Kaggleコンペ上位者講演 |
2位 Konstantin Lopukhin(オンライン)
3位 土井 賢治(会場) 5位 See--(オンライン) 7位 K_mat(会場) 8位 半谷 敏規(会場) 9位 Marcos(会場) |
- | まとめ |
ロバート キャンベル
(国文学研究資料館)
内田 誠一 (九州大学大学院システム情報科学研究院) 佐々木 孝浩 (慶應義塾大学附属研究所斯道文庫) |
17:40-17:45 | 閉会挨拶 | 山本 和明 (国文学研究資料館) |
ポスター発表アーカイブ
- カラーヌワット タリン, Alex Lamb, くずし字データセット・ KuroNetデモ
- 鈴木 親彦, Yingtao Tian, 顔貌コレクション(顔コレ)と顔コレデータセット
- レ ドゥック アイン, Deep Learning for Recognition of Modern Japanese Magazines
- 市野 美夏, 過去の記録を統合解析し、超学際的な課題に挑む歴史ビッグデータ
リリース
- 「日本文化とAIシンポジウム2019~AIがくずし字を読む時代がやってきた~」11月11日に開催、参加申込スタート
- 「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」 11月11日に開催、参加申込スタート
- 【シンポジウム開催報告】「日本文化とAIシンポジウム2019」
- 人文学研究データリポジトリ
ポスター
シンポジウムのポスターはご自由にダウンロードしてお使いください。