くずし字チャレンジ!
Edo+150 Projects CODH

江戸時代の古典籍はくずし字で書かれていますが、ほとんどの現代の日本人はくずし字が読めません。では人工知能(AI)はくずし字を読めるようになるでしょうか?くずし字に関する大規模な機械学習データセット「日本古典籍くずし字データセット」を広く世界に公開し、AIによるくずし字認識(OCR)の研究開発を促進することで、1000年に及ぶ日本の文字文化を解読するというグランドチャレンジに挑みます。

データセットの公開だけでなく、コンテストの開催などを通じて知識やソフトウェアの共有を進めていく計画です。ぜひご参加下さい [もっと詳しく..]

  • 「みを:AIくずし字認識アプリ」が、2022年度グッドデザイン賞を受賞

  • 2022 10/7

みを:AIくずし字認識アプリが、2022年度グッドデザイン賞を受賞しました。

参考:【プレスリリース】世界初のAIくずし字認識アプリ「みを(miwo)」が2022年度グッドデザイン賞を受賞~くずし字教育や古文書による地域史料調査などにも貢献~

  • AIくずし字認識アプリ「みを(miwo)」公開

  • 2021 8/30

2021年8月30日、日本時間正午、AIくずし字認識アプリ「みを(miwo)」を公開しました。Google PlayまたはApp Storeからインストールし、スマートフォンやタブレットなどでご利用下さい。

「みを」アプリは、人文学研究を支援し、古典日本文学や日本文化を広めるため、無料で配布しております。「みを」アプリで用いるサーバ(GPU含む)は、ROIS-DS人文学オープンデータ共同利用センターが運用しています。[もっと詳しく..]

  • Kaggleコンペティション「くずし字認識」が終了

  • 2019 10/18

2019年10月14日23:59UTC(2019年10月15日8:59JST)、Kaggleコンペティション「くずし字認識」が終了しました。そして昨日、上位5名の入賞者も正式に決定しました。結果については、コンペティションの公式ページのLeaderboardをご覧下さい。

今回のコンペティションで開発した解法については、すでにいくつかのチームがDiscussionに公表しています。これらは日本文化を読み解くための貴重な知見になりそうです。コンペ主催者もこれらを分析することで、よりよいくずし字認識手法を研究開発したいと考えていきます。非常に熱心にコンペにご参加いただいた皆様、本当にありがとうございました!

次のビッグイベントは、11月11日に開催する「日本文化とAIシンポジウム2019」です。ここでKaggleコンペのまとめを行うだけでなく、日本国内の関連する研究なども一挙にご紹介します。まだ参加を受け付けておりますので、ぜひお越し下さい。

  • Kaggleコンペティション「くずし字認識」を開始

  • 2019 7/26

2019年7月19日、Kaggleコンペティション「くずし字認識」が始まりました。日本の古典籍画像中に含まれる文字(くずし字)の種類と位置を自動的に抽出する「くずし字OCRアルゴリズム」の開発が課題です。

コンペティションの公式ページはKuzushiji Recognition | Kaggle、また主催者のページであるKaggleコンペティション:くずし字認識には関連情報をまとめています。

今回のコンペティションは、Kaggleでも初の人文系コンペとなります。特に日本の文字を対象としたコンペですので、日本のコンピュータビジョン・機械学習・AI研究コミュニティなどからの積極的な参加を期待しております!

またコンペの副題は「千年に及ぶ日本文化への扉を開く」としました。これは、日本で千年にわたって使われてきたくずし字の存在を再認識するとともに、いまや大多数の日本人が読めなくなった過去の日本文化へのアクセスを向上させるために、革新的なツールやデータの構築に挑戦して欲しいというコンペ開催者からのメッセージです。我々の文化を研究するための現代的な基盤を作ることは、AIを用いた社会課題の解決の中でも特に重要な取り組みだと考えています。

コンペの締切は10月14日です。まだ始まって1週間ですが、すでに高得点を叩き出すアルゴリズムも登場しています。また入賞者の方々に対しては、11月11日に開催する「日本文化とAIシンポジウム2019」にて、表彰式および成果発表を行います。ぜひご参加下さい。

ちなみに現在は、第23回PRMUアルゴリズムコンテスト「くずし字認識チャレンジ2019」も開催しておりますので、こちらもどうぞ。