2019年7月19日から10月14日まで、Kaggleで「くずし字認識:千年に及ぶ日本文化への扉を開く」と題するコンペティションを開催します。
Kaggleコンペティションのページ:Kuzushiji Recognition - Opening the door to a thousand years of Japanese culture
シンポジウム
Kaggleコンペティションの表彰式を兼ねたシンポジウムを開催します。
日本文化とAIシンポジウム2019〜AIがくずし字を読む時代がやってきた〜
コンペティションの結果
Leaderboardの上位5名が入賞となります。上位10名は以下の通りです。
1 | tascj | 0.950 | 1st place solution |
2 | Konstantin Lopuhin | 0.950 | 2nd place solution overview: detection + full-page classification |
3 | Kenji | 0.944 | 3rd place solution overview: 2-stage + FalsePositive Predictor |
4 | YoudaoOCR | 0.942 | 4th place solution |
5 | See-- | 0.940 | 5th place solution overview: One stage CenterNet |
6 | abc | 0.939 | |
7 | K_mat | 0.934 | 7th place solution |
8 | t-hanya | 0.920 | 8th place solution: Two stage & kuzushiji data augmentation |
9 | Ollie, Nanashi, and Tom | 0.910 | Top 9th Solution: Simple but complete approach. |
10 | Zenkei_R&D | 0.903 |
その他、以下の方々が解法を提供しています。
13 | James Day | 0.901 | 13th place solution + unsuccessful language model |
15 | s tatsuya | 0.900 | 15th place solution |
80 | Shingo.S | 0.715 | Kaggle奮闘記 〜Kuzushiji Recognition〜 |
これまでの経緯
くずし字認識に関するこれまでの経緯や、基礎的な情報をまとめます。
日本文化とAIシンポジウム2019〜AIがくずし字を読む時代がやってきた〜
第2回CODHセミナー くずし字チャレンジ 〜機械の認識と人間の翻刻の未来〜
機械学習(AI)の活用例
機械学習(AI)を活用したくずし字アプリ・サービスを紹介します。
関連データセット
重要な注意:以下のデータセットは、Kaggleコンペティションで利用するデータセットとは異なります。コンペティション参加者は、必ずKaggleサイトからダウンロードして下さい。
参考文献
- 北本 朝展, カラーヌワット タリン, ボーバー・イリザー ミケル, "Kaggle くずし字認識─世界規模の人文系コンペ開催への挑戦─", 人工知能学会誌, Vol. 35, No. 3, pp. 366-376, 2020年5月 [ Paper ]
- 北本 朝展, カラーヌワット タリン, Alex LAMB, Mikel BOBER-IRIZAR, "くずし字認識のためのKaggle機械学習コンペティションの経過と成果", 人文科学とコンピュータシンポジウム じんもんこん2019論文集, pp. 223-230, 2019年12月 [ Paper ]
プレスリリース
- 【プレスリリース】「くずし字」の認識に世界のAI研究者・技術者が挑戦(2019/07/10)(データサイエンス共同利用基盤施設)
- 「くずし字」の認識に世界のAI研究者・技術者が挑戦―全世界的コンペティションをKaggleで7月から開催―(国立情報学研究所)
その他のコンペティション
第23回 PRMUアルゴリズムコンテスト
第23回 PRMUアルゴリズムコンテスト くずし字認識チャレンジ2019 (2019-08-31締切)