くずし字データセットダウンロード →
個別(ZIP 7.71 MB)
全体(字形画像除く)(ZIP 4906.06 MB)
/
全体(字形画像含む)(ZIP 7354.19 MB)
くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示 / 四角表示
KuroNetくずし字認識サービス → KuroNetくずし字認識ビューアを使う
日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示 / サムネイル表示
データセットの統計情報
データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。
なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)やUnicode変体仮名一覧をご利用下さい。
文字種:78 / 文字数:121
頻度順文字種リスト
U+306E
6
1位
|
U+306B
4
2位
|
U+305F
4
2位
|
U+309D
3
4位
|
U+308A
3
4位
|
U+306A
3
4位
|
U+3082
3
4位
|
U+3042
3
4位
|
U+307E
3
4位
|
U+306F
3
4位
|
U+3093
3
4位
|
U+304B
3
4位
|
U+304D
3
4位
|
U+3089
2
14位
|
U+3084
2
14位
|
U+3044
2
14位
|
U+4ED9
2
14位
|
U+3073
2
14位
|
U+90CE
2
14位
|
U+3055
2
14位
|
U+304F
2
14位
|
U+3091
2
14位
|
U+9152
2
14位
|
U+3059
2
14位
|
U+308B
2
14位
|
U+3081
1
26位
|
U+7D0D
1
26位
|
U+308D
1
26位
|
U+6C34
1
26位
|
U+8C46
1
26位
|
U+6642
1
26位
|
U+3064
1
26位
|
U+3054
1
26位
|
U+4E09
1
26位
|
U+97F3
1
26位
|
U+888B
1
26位
|
U+3053
1
26位
|
U+5EFB
1
26位
|
U+3070
1
26位
|
U+671D
1
26位
|
U+304E
1
26位
|
U+66F8
1
26位
|
U+3069
1
26位
|
U+51FA
1
26位
|
U+756A
1
26位
|
U+8CCA
1
26位
|
U+3060
1
26位
|
U+7B1B
1
26位
|
U+4E73
1
26位
|
U+6176
1
26位
|
U+5F01
1
26位
|
U+87F9
1
26位
|
U+3057
1
26位
|
U+56FD
1
26位
|
U+68D2
1
26位
|
U+6E6F
1
26位
|
U+4E94
1
26位
|
U+93A7
1
26位
|
U+3050
1
26位
|
U+5165
1
26位
|
U+9B3C
1
26位
|
U+3076
1
26位
|
U+309E
1
26位
|
U+5E03
1
26位
|
U+5927
1
26位
|
U+82B1
1
26位
|
U+3075
1
26位
|
U+3088
1
26位
|
U+307C
1
26位
|
U+70CF
1
26位
|
U+3052
1
26位
|
U+4EBA
1
26位
|
U+95A2
1
26位
|
U+3071
1
26位
|
U+5B9C
1
26位
|
U+934B
1
26位
|
U+307F
1
26位
|
U+591C
1
26位
|
コード順文字種リスト
U+3042
3
|
U+3044
2
|
U+304B
3
|
U+304D
3
|
U+304E
1
|
U+304F
2
|
U+3050
1
|
U+3052
1
|
U+3053
1
|
U+3054
1
|
U+3055
2
|
U+3057
1
|
U+3059
2
|
U+305F
4
|
U+3060
1
|
U+3064
1
|
U+3069
1
|
U+306A
3
|
U+306B
4
|
U+306E
6
|
U+306F
3
|
U+3070
1
|
U+3071
1
|
U+3073
2
|
U+3075
1
|
U+3076
1
|
U+307C
1
|
U+307E
3
|
U+307F
1
|
U+3081
1
|
U+3082
3
|
U+3084
2
|
U+3088
1
|
U+3089
2
|
U+308A
3
|
U+308B
2
|
U+308D
1
|
U+3091
2
|
U+3093
3
|
U+309D
3
|
U+309E
1
|
U+4E09
1
|
U+4E73
1
|
U+4E94
1
|
U+4EBA
1
|
U+4ED9
2
|
U+5165
1
|
U+51FA
1
|
U+56FD
1
|
U+591C
1
|
U+5927
1
|
U+5B9C
1
|
U+5E03
1
|
U+5EFB
1
|
U+5F01
1
|
U+6176
1
|
U+6642
1
|
U+66F8
1
|
U+671D
1
|
U+68D2
1
|
U+6C34
1
|
U+6E6F
1
|
U+70CF
1
|
U+756A
1
|
U+7B1B
1
|
U+7D0D
1
|
U+82B1
1
|
U+87F9
1
|
U+888B
1
|
U+8C46
1
|
U+8CCA
1
|
U+90CE
2
|
U+9152
2
|
U+934B
1
|
U+93A7
1
|
U+95A2
1
|
U+97F3
1
|
U+9B3C
1
|
ライセンス
『日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。
詳しくはライセンスの説明をご覧下さい。
このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。
『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340
ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。
また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。