竹斎

downloadくずし字データセットダウンロード: 個別(ZIP 214.54 MB)全体(ZIP 7032.01 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア): 文字表示四角表示

picture KuroNetくずし字認識サービス

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer): 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)をご利用下さい。

文字種:312 / 文字数:33,163

頻度順文字種リスト

U+3057
1495
U+306E
1353
U+304B
1259
U+306F
1186
U+306B
1131
U+3068
1093
U+308A
990
U+3066
860
U+306A
857
U+304F
845
U+3082
824
U+305F
822
U+3046
743
U+3092
727
U+3084
669
U+3044
668
U+3093
666
U+3055
663
U+3089
660
U+308B
657
U+3051
652
U+308C
652
U+304D
637
U+307E
575
U+3072
552
U+3064
531
U+3042
478
U+307F
433
U+3053
420
U+3078
415
U+3075
393
U+3061
369
U+305D
369
U+3088
359
U+3059
346
U+309D
322
U+3070
306
U+305B
289
U+304A
255
U+3081
240
U+304C
235
U+4EBA
202
U+3086
202
U+308F
188
U+307B
173
U+4E8B
169
U+5FA1
163
U+306D
158
U+7533
157
U+308D
149
U+3058
142
U+3080
139
U+306C
137
U+3031
126
U+3060
123
U+4E00
117
U+7D66
111
U+3073
106
U+3069
100
U+3065
92
U+3052
91
U+3048
89
U+305A
87
U+3091
84
U+601D
83
U+5019
74
U+304E
73
U+3076
69
U+5FC3
69
U+8EAB
68
U+305E
68
U+6B64
67
U+3056
62
U+51FA
61
U+3079
61
U+7269
57
U+6709
55
U+898B
52
U+307C
50
U+53C8
50
U+4E5F
50
U+5927
49
U+3067
49
U+309E
46
U+7ACB
45
U+3090
44
U+4E16
44
U+6B4C
43
U+6642
40
U+4E09
40
U+53C2
40
U+3054
40
U+5C71
39
U+6211
38
U+4E2D
38
U+4F55
38
U+65E5
37
U+3050
36
U+5973
32
U+4E0A
31
U+305C
29
U+53D6
26
U+6C34
25
U+5DDD
25
U+884C
24
U+3062
24
U+591C
23
U+6240
23
U+7A0B
22
U+4E94
21
U+516D
20
U+5165
20
U+82B1
20
U+6708
20
U+8FD4
19
U+5BBF
17
U+795E
17
U+98A8
17
U+5929
17
U+4E8C
17
U+9053
17
U+5176
16
U+6298
16
U+6587
16
U+6728
15
U+7389
15
U+56DB
15
U+660E
14
U+5185
14
U+5F15
14
U+4E0B
14
U+6210
13
U+5BFA
13
U+541B
13
U+4E03
12
U+4ECA
12
U+91CE
12
U+5341
12
U+805E
12
U+4ECF
10
U+7AF9
10
U+6761
10
U+904E
10
U+8349
9
U+96F2
9
U+516B
9
U+56FD
9
U+303B
8
U+9023
8
U+624B
8
U+9732
8
U+5922
8
U+6253
8
U+4E95
7
U+662F
7
U+8896
7
U+5B50
7
U+5C0F
7
U+5BB6
7
U+5BAE
7
U+767E
7
U+5F8C
7
U+540D
7
U+7B46
7
U+8846
7
U+90FD
7
U+6BD4
6
U+677E
6
U+6625
6
U+9CE5
6
U+6238
6
U+6BBF
6
U+539F
6
U+82E5
6
U+7530
5
U+3005
5
U+8272
5
U+821F
5
U+8DE1
5
U+5343
5
U+85AC
5
U+756A
5
U+5E74
4
U+5317
4
U+4E5D
4
U+91CC
4
U+5171
4
U+5915
4
U+96E8
4
U+7A7A
4
U+751F
4
U+5C11
4
U+604B
4
U+8863
3
U+53E3
3
U+9593
3
U+8449
3
U+4E38
3
U+53E5
3
U+5730
3
U+5439
3
U+4EAC
3
U+590F
3
U+65B9
3
U+7B2C
3
U+7121
3
U+96EA
3
U+4F8D
3
U+90CE
3
U+6570
3
U+706B
3
U+5F85
3
U+9580
2
U+671D
2
U+536F
2
U+897F
2
U+5C06
2
U+91D1
2
U+672C
2
U+8ECA
2
U+5DE6
2
U+685C
2
U+4E91
2
U+5144
2
U+66AE
2
U+6795
2
U+5982
2
U+6765
2
U+52A9
2
U+6CB3
2
U+9577
2
U+8A69
2
U+6614
2
U+904A
2
U+6CD5
2
U+5F1F
2
U+54B2
2
U+753A
2
U+5409
2
U+53CB
2
U+65B0
2
U+57F7
1
U+30CE
1
U+5B58
1
U+4EAB
1
U+67F3
1
U+54C9
1
U+5CA9
1
U+6885
1
U+53F3
1
U+4E07
1
U+4EE3
1
U+8C37
1
U+3032
1
U+6589
1
U+6C5F
1
U+6751
1
U+5DF4
1
U+679D
1
U+5BF8
1
U+738B
1
U+5BC4
1
U+5EA6
1
U+7559
1
U+66F8
1
U+7D39
1
U+68A8
1
U+899A
1
U+95A2
1
U+5E2F
1
U+6597
1
U+6C0F
1
U+592A
1
U+6545
1
U+7F6E
1
U+9054
1
U+7230
1
U+79CB
1
U+4FDD
1
U+9280
1
U+88CF
1
U+6247
1
U+6E90
1
U+7881
1
U+885B
1
U+4EF0
1
U+4ED8
1
U+7FBD
1
U+77F3
1
U+5F71
1
U+5C3A
1
U+51AC
1
U+89A7
1
U+52E2
1
U+4F0A
1
U+8A9E
1
U+30A2
1
U+963F
1
U+518A
1
U+8AF8
1
U+8B5A
1
U+99AC
1
U+677F
1
U+5411
1
U+4E45
1
U+30EA
1
U+85E4
1
U+5C4B
1
U+4F4D
1
U+5CF0
1
U+5FD8
1
U+9AD8
1

コード順文字種リスト

U+3005
5
U+3031
126
U+3032
1
U+303B
8
U+3042
478
U+3044
668
U+3046
743
U+3048
89
U+304A
255
U+304B
1259
U+304C
235
U+304D
637
U+304E
73
U+304F
845
U+3050
36
U+3051
652
U+3052
91
U+3053
420
U+3054
40
U+3055
663
U+3056
62
U+3057
1495
U+3058
142
U+3059
346
U+305A
87
U+305B
289
U+305C
29
U+305D
369
U+305E
68
U+305F
822
U+3060
123
U+3061
369
U+3062
24
U+3064
531
U+3065
92
U+3066
860
U+3067
49
U+3068
1093
U+3069
100
U+306A
857
U+306B
1131
U+306C
137
U+306D
158
U+306E
1353
U+306F
1186
U+3070
306
U+3072
552
U+3073
106
U+3075
393
U+3076
69
U+3078
415
U+3079
61
U+307B
173
U+307C
50
U+307E
575
U+307F
433
U+3080
139
U+3081
240
U+3082
824
U+3084
669
U+3086
202
U+3088
359
U+3089
660
U+308A
990
U+308B
657
U+308C
652
U+308D
149
U+308F
188
U+3090
44
U+3091
84
U+3092
727
U+3093
666
U+309D
322
U+309E
46
U+30A2
1
U+30CE
1
U+30EA
1
U+4E00
117
U+4E03
12
U+4E07
1
U+4E09
40
U+4E0A
31
U+4E0B
14
U+4E16
44
U+4E2D
38
U+4E38
3
U+4E45
1
U+4E5D
4
U+4E5F
50
U+4E8B
169
U+4E8C
17
U+4E91
2
U+4E94
21
U+4E95
7
U+4EAB
1
U+4EAC
3
U+4EBA
202
U+4ECA
12
U+4ECF
10
U+4ED8
1
U+4EE3
1
U+4EF0
1
U+4F0A
1
U+4F4D
1
U+4F55
38
U+4F8D
3
U+4FDD
1
U+5019
74
U+5144
2
U+5165
20
U+516B
9
U+516D
20
U+5171
4
U+5176
16
U+5185
14
U+518A
1
U+51AC
1
U+51FA
61
U+52A9
2
U+52E2
1
U+5317
4
U+5341
12
U+5343
5
U+536F
2
U+539F
6
U+53C2
40
U+53C8
50
U+53CB
2
U+53D6
26
U+53E3
3
U+53E5
3
U+53F3
1
U+5409
2
U+540D
7
U+5411
1
U+541B
13
U+5439
3
U+54B2
2
U+54C9
1
U+56DB
15
U+56FD
9
U+5730
3
U+57F7
1
U+590F
3
U+5915
4
U+591C
23
U+5922
8
U+5927
49
U+5929
17
U+592A
1
U+5973
32
U+5982
2
U+5B50
7
U+5B58
1
U+5BAE
7
U+5BB6
7
U+5BBF
17
U+5BC4
1
U+5BF8
1
U+5BFA
13
U+5C06
2
U+5C0F
7
U+5C11
4
U+5C3A
1
U+5C4B
1
U+5C71
39
U+5CA9
1
U+5CF0
1
U+5DDD
25
U+5DE6
2
U+5DF4
1
U+5E2F
1
U+5E74
4
U+5EA6
1
U+5F15
14
U+5F1F
2
U+5F71
1
U+5F85
3
U+5F8C
7
U+5FA1
163
U+5FC3
69
U+5FD8
1
U+601D
83
U+604B
4
U+6210
13
U+6211
38
U+6238
6
U+6240
23
U+6247
1
U+624B
8
U+6253
8
U+6298
16
U+6545
1
U+6570
3
U+6587
16
U+6589
1
U+6597
1
U+65B0
2
U+65B9
3
U+65E5
37
U+660E
14
U+6614
2
U+6625
6
U+662F
7
U+6642
40
U+66AE
2
U+66F8
1
U+6708
20
U+6709
55
U+671D
2
U+6728
15
U+672C
2
U+6751
1
U+6761
10
U+6765
2
U+677E
6
U+677F
1
U+6795
2
U+679D
1
U+67F3
1
U+685C
2
U+6885
1
U+68A8
1
U+6B4C
43
U+6B64
67
U+6BBF
6
U+6BD4
6
U+6C0F
1
U+6C34
25
U+6C5F
1
U+6CB3
2
U+6CD5
2
U+6E90
1
U+706B
3
U+7121
3
U+7230
1
U+7269
57
U+7389
15
U+738B
1
U+751F
4
U+7530
5
U+7533
157
U+753A
2
U+7559
1
U+756A
5
U+767E
7
U+77F3
1
U+7881
1
U+795E
17
U+79CB
1
U+7A0B
22
U+7A7A
4
U+7ACB
45
U+7AF9
10
U+7B2C
3
U+7B46
7
U+7D39
1
U+7D66
111
U+7F6E
1
U+7FBD
1
U+805E
12
U+821F
5
U+8272
5
U+82B1
20
U+82E5
6
U+8349
9
U+8449
3
U+85AC
5
U+85E4
1
U+8846
7
U+884C
24
U+885B
1
U+8863
3
U+8896
7
U+88CF
1
U+897F
2
U+898B
52
U+899A
1
U+89A7
1
U+8A69
2
U+8A9E
1
U+8AF8
1
U+8B5A
1
U+8C37
1
U+8DE1
5
U+8EAB
68
U+8ECA
2
U+8FD4
19
U+9023
8
U+904A
2
U+904E
10
U+9053
17
U+9054
1
U+90CE
3
U+90FD
7
U+91CC
4
U+91CE
12
U+91D1
2
U+9280
1
U+9577
2
U+9580
2
U+9593
3
U+95A2
1
U+963F
1
U+96E8
4
U+96EA
3
U+96F2
9
U+9732
8
U+98A8
17
U+99AC
1
U+9AD8
1
U+9CE5
6

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI (10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元である人文学オープンデータ共同利用センターへのリンクをお願いします。

提供:人文学オープンデータ共同利用センター