Kaggleコンペティション:くずし字認識

2019年7月19日から10月14日まで、Kaggleで「くずし字認識:千年に及ぶ日本文化への扉を開く」と題するコンペティションを開催します。

Kaggleコンペティションのページ:Kuzushiji Recognition - Opening the door to a thousand years of Japanese culture

シンポジウム

Kaggleコンペティションの表彰式を兼ねたシンポジウムを開催します。

日本文化とAIシンポジウム2019〜AIがくずし字を読む時代がやってきた〜

コンペティションの結果

Leaderboardの上位5名が入賞となります。上位10名は以下の通りです。

その他、以下の方々が解法を提供しています。

これまでの経緯

くずし字認識に関するこれまでの経緯や、基礎的な情報をまとめます。

くずし字チャレンジ!

日本文化とAIシンポジウム2019〜AIがくずし字を読む時代がやってきた〜

第2回CODHセミナー くずし字チャレンジ 〜機械の認識と人間の翻刻の未来〜

機械学習(AI)の活用例

機械学習(AI)を活用したくずし字アプリ・サービスを紹介します。

くずし字OCRサービス

くずし字OCR(AIくずし字認識)

くずし字翻刻(テキスト化)/古文・漢文→現代文翻訳

くずし字アプリ・サービス(検索/認識/解読)

関連データセット

重要な注意:以下のデータセットは、Kaggleコンペティションで利用するデータセットとは異なります。コンペティション参加者は、必ずKaggleサイトからダウンロードして下さい。

日本古典籍くずし字データセット

くずし字データベース検索(変体仮名・カタカナ・漢字)

KMNISTデータセット(機械学習用くずし字データセット)

参考文献

  1. 北本 朝展, カラーヌワット タリン, ボーバー・イリザー ミケル, "Kaggle くずし字認識─世界規模の人文系コンペ開催への挑戦─", 人工知能学会誌, Vol. 35, No. 3, pp. 366-376, 2020年5月 [ Paper ]
  2. 北本 朝展, カラーヌワット タリン, Alex LAMB, Mikel BOBER-IRIZAR, "くずし字認識のためのKaggle機械学習コンペティションの経過と成果", 人文科学とコンピュータシンポジウム じんもんこん2019論文集, pp. 223-230, 2019年12月 [ Paper ]

プレスリリース

  1. 【プレスリリース】「くずし字」の認識に世界のAI研究者・技術者が挑戦(2019/07/10)(データサイエンス共同利用基盤施設)
  2. 「くずし字」の認識に世界のAI研究者・技術者が挑戦―全世界的コンペティションをKaggleで7月から開催―(国立情報学研究所)

その他のコンペティション

第23回 PRMUアルゴリズムコンテスト

第23回 PRMUアルゴリズムコンテスト くずし字認識チャレンジ2019 (2019-08-31締切)