くずし字データセットダウンロード →
個別(ZIP 47.17 MB)
全体(字形画像除く)(ZIP 4906.06 MB)
/
全体(字形画像含む)(ZIP 7354.19 MB)
くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示 / 四角表示
KuroNetくずし字認識サービス → KuroNetくずし字認識ビューアを使う
日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示 / サムネイル表示
データセットの統計情報
データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。
なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)やUnicode変体仮名一覧をご利用下さい。
文字種:193 / 文字数:11,566
頻度順文字種リスト
U+3057
547
1位
|
U+305F
498
2位
|
U+304B
485
3位
|
U+307E
439
4位
|
U+3068
434
5位
|
U+306E
433
6位
|
U+306F
423
7位
|
U+306A
415
8位
|
U+306B
381
9位
|
U+308A
368
10位
|
U+304D
347
11位
|
U+3066
330
12位
|
U+3082
313
13位
|
U+304A
266
14位
|
U+3064
256
15位
|
U+308B
249
16位
|
U+3055
244
17位
|
U+3044
243
18位
|
U+304F
233
19位
|
U+3046
216
20位
|
U+3053
214
21位
|
U+3072
212
22位
|
U+3089
208
23位
|
U+309D
185
24位
|
U+307B
184
25位
|
U+3059
183
26位
|
U+3092
183
26位
|
U+3078
183
26位
|
U+3075
179
29位
|
U+307F
176
30位
|
U+3051
170
31位
|
U+3042
160
32位
|
U+5FA1
160
32位
|
U+308C
150
34位
|
U+305B
132
35位
|
U+3080
115
36位
|
U+3061
109
37位
|
U+305D
103
38位
|
U+3084
100
39位
|
U+3081
97
40位
|
U+3048
88
41位
|
U+3088
85
42位
|
U+308D
81
43位
|
U+4EBA
78
44位
|
U+7D66
76
45位
|
U+3031
60
46位
|
U+308F
56
47位
|
U+3086
54
48位
|
U+306C
45
49位
|
U+4E8B
42
50位
|
U+5FC3
41
51位
|
U+306D
34
52位
|
U+3093
28
53位
|
U+5BAE
25
54位
|
U+4F8D
22
55位
|
U+5973
17
56位
|
U+4E16
16
57位
|
U+541B
13
58位
|
U+3090
13
58位
|
U+6240
12
60位
|
U+5927
11
61位
|
U+65E5
10
62位
|
U+5185
10
62位
|
U+6708
10
62位
|
U+601D
9
65位
|
U+6642
9
65位
|
U+3091
9
65位
|
U+6BBF
8
68位
|
U+3058
8
68位
|
U+591C
8
68位
|
U+65B9
7
71位
|
U+6625
6
72位
|
U+6E90
6
72位
|
U+6C0F
6
72位
|
U+53F3
6
72位
|
U+4E2D
5
76位
|
U+53C8
5
76位
|
U+623F
5
76位
|
U+304C
5
76位
|
U+3065
5
76位
|
U+547D
5
76位
|
U+66F4
4
82位
|
U+305A
4
82位
|
U+4E00
4
82位
|
U+3079
4
82位
|
U+5A66
4
82位
|
U+8863
4
82位
|
U+8EAB
4
82位
|
U+5FBD
3
89位
|
U+7D0D
3
89位
|
U+5F01
3
89位
|
U+56DB
3
89位
|
U+89A7
3
89位
|
U+3056
3
89位
|
U+6211
3
89位
|
U+3070
3
89位
|
U+9732
3
89位
|
U+4E09
3
89位
|
U+5143
3
89位
|
U+5B50
3
89位
|
U+3069
3
89位
|
U+5F18
3
89位
|
U+4E94
3
89位
|
U+76F8
3
89位
|
U+81E3
3
89位
|
U+5BA3
3
89位
|
U+5E1D
3
89位
|
U+670D
3
89位
|
U+8A00
3
89位
|
U+5EA7
3
89位
|
U+79CB
2
111位
|
U+98A8
2
111位
|
U+8535
2
111位
|
U+8349
2
111位
|
U+6545
2
111位
|
U+4E0B
2
111位
|
U+4E8C
2
111位
|
U+3060
2
111位
|
U+7533
2
111位
|
U+8CB4
2
111位
|
U+305E
2
111位
|
U+96F2
2
111位
|
U+9662
2
111位
|
U+3052
2
111位
|
U+304E
2
111位
|
U+8FD4
2
111位
|
U+516D
2
111位
|
U+540D
2
111位
|
U+537F
2
111位
|
U+738B
2
111位
|
U+65E8
2
111位
|
U+5148
2
111位
|
U+574A
2
111位
|
U+3050
2
111位
|
U+5983
2
111位
|
U+307C
2
111位
|
U+694A
2
111位
|
U+5C06
1
138位
|
U+91CE
1
138位
|
U+9D3B
1
138位
|
U+4EE3
1
138位
|
U+90E8
1
138位
|
U+7121
1
138位
|
U+6DBC
1
138位
|
U+9928
1
138位
|
U+6C60
1
138位
|
U+8449
1
138位
|
U+5341
1
138位
|
U+54C1
1
138位
|
U+3005
1
138位
|
U+8077
1
138位
|
U+4EAD
1
138位
|
U+898B
1
138位
|
U+89AA
1
138位
|
U+4F4D
1
138位
|
U+5916
1
138位
|
U+5F8C
1
138位
|
U+5E74
1
138位
|
U+67F3
1
138位
|
U+5F71
1
138位
|
U+6068
1
138位
|
U+8272
1
138位
|
U+6DB2
1
138位
|
U+8299
1
138位
|
U+5C11
1
138位
|
U+590F
1
138位
|
U+4F7F
1
138位
|
U+672A
1
138位
|
U+5C71
1
138位
|
U+5357
1
138位
|
U+706B
1
138位
|
U+677E
1
138位
|
U+5C3A
1
138位
|
U+309E
1
138位
|
U+592E
1
138位
|
U+5E8A
1
138位
|
U+6D99
1
138位
|
U+9957
1
138位
|
U+7269
1
138位
|
U+5175
1
138位
|
U+8FD1
1
138位
|
U+7406
1
138位
|
U+4FEE
1
138位
|
U+524D
1
138位
|
U+84C9
1
138位
|
U+81DA
1
138位
|
U+9577
1
138位
|
U+52C5
1
138位
|
U+5929
1
138位
|
U+3062
1
138位
|
U+7336
1
138位
|
U+82B1
1
138位
|
U+6B4C
1
138位
|
コード順文字種リスト
U+3005
1
|
U+3031
60
|
U+3042
160
|
U+3044
243
|
U+3046
216
|
U+3048
88
|
U+304A
266
|
U+304B
485
|
U+304C
5
|
U+304D
347
|
U+304E
2
|
U+304F
233
|
U+3050
2
|
U+3051
170
|
U+3052
2
|
U+3053
214
|
U+3055
244
|
U+3056
3
|
U+3057
547
|
U+3058
8
|
U+3059
183
|
U+305A
4
|
U+305B
132
|
U+305D
103
|
U+305E
2
|
U+305F
498
|
U+3060
2
|
U+3061
109
|
U+3062
1
|
U+3064
256
|
U+3065
5
|
U+3066
330
|
U+3068
434
|
U+3069
3
|
U+306A
415
|
U+306B
381
|
U+306C
45
|
U+306D
34
|
U+306E
433
|
U+306F
423
|
U+3070
3
|
U+3072
212
|
U+3075
179
|
U+3078
183
|
U+3079
4
|
U+307B
184
|
U+307C
2
|
U+307E
439
|
U+307F
176
|
U+3080
115
|
U+3081
97
|
U+3082
313
|
U+3084
100
|
U+3086
54
|
U+3088
85
|
U+3089
208
|
U+308A
368
|
U+308B
249
|
U+308C
150
|
U+308D
81
|
U+308F
56
|
U+3090
13
|
U+3091
9
|
U+3092
183
|
U+3093
28
|
U+309D
185
|
U+309E
1
|
U+4E00
4
|
U+4E09
3
|
U+4E0B
2
|
U+4E16
16
|
U+4E2D
5
|
U+4E8B
42
|
U+4E8C
2
|
U+4E94
3
|
U+4EAD
1
|
U+4EBA
78
|
U+4EE3
1
|
U+4F4D
1
|
U+4F7F
1
|
U+4F8D
22
|
U+4FEE
1
|
U+5143
3
|
U+5148
2
|
U+516D
2
|
U+5175
1
|
U+5185
10
|
U+524D
1
|
U+52C5
1
|
U+5341
1
|
U+5357
1
|
U+537F
2
|
U+53C8
5
|
U+53F3
6
|
U+540D
2
|
U+541B
13
|
U+547D
5
|
U+54C1
1
|
U+56DB
3
|
U+574A
2
|
U+590F
1
|
U+5916
1
|
U+591C
8
|
U+5927
11
|
U+5929
1
|
U+592E
1
|
U+5973
17
|
U+5983
2
|
U+5A66
4
|
U+5B50
3
|
U+5BA3
3
|
U+5BAE
25
|
U+5C06
1
|
U+5C11
1
|
U+5C3A
1
|
U+5C71
1
|
U+5E1D
3
|
U+5E74
1
|
U+5E8A
1
|
U+5EA7
3
|
U+5F01
3
|
U+5F18
3
|
U+5F71
1
|
U+5F8C
1
|
U+5FA1
160
|
U+5FBD
3
|
U+5FC3
41
|
U+601D
9
|
U+6068
1
|
U+6211
3
|
U+623F
5
|
U+6240
12
|
U+6545
2
|
U+65B9
7
|
U+65E5
10
|
U+65E8
2
|
U+6625
6
|
U+6642
9
|
U+66F4
4
|
U+6708
10
|
U+670D
3
|
U+672A
1
|
U+677E
1
|
U+67F3
1
|
U+694A
2
|
U+6B4C
1
|
U+6BBF
8
|
U+6C0F
6
|
U+6C60
1
|
U+6D99
1
|
U+6DB2
1
|
U+6DBC
1
|
U+6E90
6
|
U+706B
1
|
U+7121
1
|
U+7269
1
|
U+7336
1
|
U+738B
2
|
U+7406
1
|
U+7533
2
|
U+76F8
3
|
U+79CB
2
|
U+7D0D
3
|
U+7D66
76
|
U+8077
1
|
U+81DA
1
|
U+81E3
3
|
U+8272
1
|
U+8299
1
|
U+82B1
1
|
U+8349
2
|
U+8449
1
|
U+84C9
1
|
U+8535
2
|
U+8863
4
|
U+898B
1
|
U+89A7
3
|
U+89AA
1
|
U+8A00
3
|
U+8CB4
2
|
U+8EAB
4
|
U+8FD1
1
|
U+8FD4
2
|
U+90E8
1
|
U+91CE
1
|
U+9577
1
|
U+9662
2
|
U+96F2
2
|
U+9732
3
|
U+98A8
2
|
U+9928
1
|
U+9957
1
|
U+9D3B
1
|
ライセンス
『日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。
詳しくはライセンスの説明をご覧下さい。
このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。
『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340
ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。
また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。