くずし字データセットダウンロード →
個別(ZIP 155.80 MB)
全体(字形画像除く)(ZIP 4906.06 MB)
/
全体(字形画像含む)(ZIP 7354.19 MB)
くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示 / 四角表示
KuroNetくずし字認識サービス → KuroNetくずし字認識ビューアを使う
日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示 / サムネイル表示
データセットの統計情報
データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。
なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)やUnicode変体仮名一覧をご利用下さい。
文字種:166 / 文字数:29,584
頻度順文字種リスト
U+3057
1203
1位
|
U+306E
1181
2位
|
U+304B
1036
3位
|
U+306B
969
4位
|
U+3068
958
5位
|
U+3046
927
6位
|
U+308A
873
7位
|
U+306F
871
8位
|
U+3066
849
9位
|
U+3044
841
10位
|
U+3093
748
11位
|
U+3092
735
12位
|
U+306A
719
13位
|
U+305F
701
14位
|
U+304D
660
15位
|
U+3051
658
16位
|
U+304F
635
17位
|
U+308B
580
18位
|
U+308C
578
19位
|
U+3089
548
20位
|
U+3082
545
21位
|
U+307E
539
22位
|
U+3084
522
23位
|
U+3064
501
24位
|
U+3055
471
25位
|
U+3072
460
26位
|
U+3053
447
27位
|
U+3042
402
28位
|
U+3070
392
29位
|
U+3061
386
30位
|
U+3059
360
31位
|
U+3088
360
31位
|
U+304C
339
33位
|
U+309D
324
34位
|
U+304A
321
35位
|
U+3078
295
36位
|
U+3075
284
37位
|
U+307F
254
38位
|
U+305B
249
39位
|
U+305D
242
40位
|
U+3060
205
41位
|
U+3058
198
42位
|
U+3081
192
43位
|
U+308F
185
44位
|
U+3069
165
45位
|
U+305E
151
46位
|
U+3067
150
47位
|
U+4E8B
145
48位
|
U+305A
143
49位
|
U+3086
142
50位
|
U+308D
138
51位
|
U+307B
136
52位
|
U+3080
135
53位
|
U+306D
134
54位
|
U+3065
133
55位
|
U+3056
131
56位
|
U+4EBA
122
57位
|
U+4E00
114
58位
|
U+3079
112
59位
|
U+7D66
101
60位
|
U+3052
101
60位
|
U+3076
98
62位
|
U+90CE
97
63位
|
U+4E09
91
64位
|
U+5FA1
89
65位
|
U+7533
88
66位
|
U+3090
87
67位
|
U+304E
86
68位
|
U+3091
83
69位
|
U+3050
80
70位
|
U+3062
79
71位
|
U+3031
75
72位
|
U+3073
75
72位
|
U+309E
74
74位
|
U+601D
72
75位
|
U+3054
71
76位
|
U+306C
67
77位
|
U+5171
65
78位
|
U+5019
63
79位
|
U+307C
62
80位
|
U+5FC3
61
81位
|
U+4E8C
61
81位
|
U+5927
60
83位
|
U+5341
53
84位
|
U+3048
50
85位
|
U+4E94
48
86位
|
U+898B
47
87位
|
U+305C
42
88位
|
U+6B64
38
89位
|
U+65E5
37
90位
|
U+5B50
33
91位
|
U+56DB
29
92位
|
U+4ECA
27
93位
|
U+6B21
27
93位
|
U+5165
26
95位
|
U+3005
25
96位
|
U+8EAB
23
97位
|
U+53C8
23
97位
|
U+4E2D
22
99位
|
U+516D
21
100位
|
U+5C71
21
100位
|
U+624B
21
100位
|
U+516B
21
100位
|
U+592A
20
104位
|
U+4E03
20
104位
|
U+3032
19
106位
|
U+5973
18
107位
|
U+4E5F
17
108位
|
U+767E
17
108位
|
U+6708
16
110位
|
U+541B
12
111位
|
U+4E5D
10
112位
|
U+5C0F
9
113位
|
U+5343
8
114位
|
U+6728
6
115位
|
U+4E0A
5
116位
|
U+5176
5
116位
|
U+6211
4
118位
|
U+591C
4
118位
|
U+5EFF
4
118位
|
U+540D
4
118位
|
U+5345
3
122位
|
U+8A9E
3
122位
|
U+6C34
3
122位
|
U+5DFB
3
122位
|
U+4E0B
3
122位
|
U+7269
3
122位
|
U+7B2C
3
122位
|
U+66FD
3
122位
|
U+4EE5
2
130位
|
U+4EE3
2
130位
|
U+738B
2
130位
|
U+6268
2
130位
|
U+5929
2
130位
|
U+662F
2
130位
|
U+5DDD
2
130位
|
U+6D41
2
130位
|
U+7AF9
2
130位
|
U+6BBF
2
130位
|
U+6210
2
130位
|
U+5916
1
141位
|
U+8A5E
1
141位
|
U+5C3C
1
141位
|
U+6642
1
141位
|
U+7537
1
141位
|
U+8272
1
141位
|
U+6587
1
141位
|
U+53C2
1
141位
|
U+756A
1
141位
|
U+6C5F
1
141位
|
U+805E
1
141位
|
U+51FA
1
141位
|
U+8FD4
1
141位
|
U+4ECD
1
141位
|
U+7D42
1
141位
|
U+4F55
1
141位
|
U+89AA
1
141位
|
U+85E4
1
141位
|
U+76EE
1
141位
|
U+25B2
1
141位
|
U+7A0B
1
141位
|
U+884C
1
141位
|
U+7ACB
1
141位
|
U+5F8C
1
141位
|
U+9332
1
141位
|
U+6D25
1
141位
|
コード順文字種リスト
U+25B2
1
|
U+3005
25
|
U+3031
75
|
U+3032
19
|
U+3042
402
|
U+3044
841
|
U+3046
927
|
U+3048
50
|
U+304A
321
|
U+304B
1036
|
U+304C
339
|
U+304D
660
|
U+304E
86
|
U+304F
635
|
U+3050
80
|
U+3051
658
|
U+3052
101
|
U+3053
447
|
U+3054
71
|
U+3055
471
|
U+3056
131
|
U+3057
1203
|
U+3058
198
|
U+3059
360
|
U+305A
143
|
U+305B
249
|
U+305C
42
|
U+305D
242
|
U+305E
151
|
U+305F
701
|
U+3060
205
|
U+3061
386
|
U+3062
79
|
U+3064
501
|
U+3065
133
|
U+3066
849
|
U+3067
150
|
U+3068
958
|
U+3069
165
|
U+306A
719
|
U+306B
969
|
U+306C
67
|
U+306D
134
|
U+306E
1181
|
U+306F
871
|
U+3070
392
|
U+3072
460
|
U+3073
75
|
U+3075
284
|
U+3076
98
|
U+3078
295
|
U+3079
112
|
U+307B
136
|
U+307C
62
|
U+307E
539
|
U+307F
254
|
U+3080
135
|
U+3081
192
|
U+3082
545
|
U+3084
522
|
U+3086
142
|
U+3088
360
|
U+3089
548
|
U+308A
873
|
U+308B
580
|
U+308C
578
|
U+308D
138
|
U+308F
185
|
U+3090
87
|
U+3091
83
|
U+3092
735
|
U+3093
748
|
U+309D
324
|
U+309E
74
|
U+4E00
114
|
U+4E03
20
|
U+4E09
91
|
U+4E0A
5
|
U+4E0B
3
|
U+4E2D
22
|
U+4E5D
10
|
U+4E5F
17
|
U+4E8B
145
|
U+4E8C
61
|
U+4E94
48
|
U+4EBA
122
|
U+4ECA
27
|
U+4ECD
1
|
U+4EE3
2
|
U+4EE5
2
|
U+4F55
1
|
U+5019
63
|
U+5165
26
|
U+516B
21
|
U+516D
21
|
U+5171
65
|
U+5176
5
|
U+51FA
1
|
U+5341
53
|
U+5343
8
|
U+5345
3
|
U+53C2
1
|
U+53C8
23
|
U+540D
4
|
U+541B
12
|
U+56DB
29
|
U+5916
1
|
U+591C
4
|
U+5927
60
|
U+5929
2
|
U+592A
20
|
U+5973
18
|
U+5B50
33
|
U+5C0F
9
|
U+5C3C
1
|
U+5C71
21
|
U+5DDD
2
|
U+5DFB
3
|
U+5EFF
4
|
U+5F8C
1
|
U+5FA1
89
|
U+5FC3
61
|
U+601D
72
|
U+6210
2
|
U+6211
4
|
U+624B
21
|
U+6268
2
|
U+6587
1
|
U+65E5
37
|
U+662F
2
|
U+6642
1
|
U+66FD
3
|
U+6708
16
|
U+6728
6
|
U+6B21
27
|
U+6B64
38
|
U+6BBF
2
|
U+6C34
3
|
U+6C5F
1
|
U+6D25
1
|
U+6D41
2
|
U+7269
3
|
U+738B
2
|
U+7533
88
|
U+7537
1
|
U+756A
1
|
U+767E
17
|
U+76EE
1
|
U+7A0B
1
|
U+7ACB
1
|
U+7AF9
2
|
U+7B2C
3
|
U+7D42
1
|
U+7D66
101
|
U+805E
1
|
U+8272
1
|
U+85E4
1
|
U+884C
1
|
U+898B
47
|
U+89AA
1
|
U+8A5E
1
|
U+8A9E
3
|
U+8EAB
23
|
U+8FD4
1
|
U+90CE
97
|
U+9332
1
|
ライセンス
『日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。
詳しくはライセンスの説明をご覧下さい。
このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。
『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340
ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。
また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。