曾我物語

downloadくずし字データセットダウンロード → 個別(ZIP 155.80 MB)
全体(字形画像除く)(ZIP 4906.06 MB)全体(字形画像含む)(ZIP 7354.19 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示四角表示

picture KuroNetくずし字認識サービスKuroNetくずし字認識ビューアを使う

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)Unicode変体仮名一覧をご利用下さい。

文字種:166 / 文字数:29,584

頻度順文字種リスト

U+3057
1203
1位
U+306E
1181
2位
U+304B
1036
3位
U+306B
969
4位
U+3068
958
5位
U+3046
927
6位
U+308A
873
7位
U+306F
871
8位
U+3066
849
9位
U+3044
841
10位
U+3093
748
11位
U+3092
735
12位
U+306A
719
13位
U+305F
701
14位
U+304D
660
15位
U+3051
658
16位
U+304F
635
17位
U+308B
580
18位
U+308C
578
19位
U+3089
548
20位
U+3082
545
21位
U+307E
539
22位
U+3084
522
23位
U+3064
501
24位
U+3055
471
25位
U+3072
460
26位
U+3053
447
27位
U+3042
402
28位
U+3070
392
29位
U+3061
386
30位
U+3059
360
31位
U+3088
360
31位
U+304C
339
33位
U+309D
324
34位
U+304A
321
35位
U+3078
295
36位
U+3075
284
37位
U+307F
254
38位
U+305B
249
39位
U+305D
242
40位
U+3060
205
41位
U+3058
198
42位
U+3081
192
43位
U+308F
185
44位
U+3069
165
45位
U+305E
151
46位
U+3067
150
47位
U+4E8B
145
48位
U+305A
143
49位
U+3086
142
50位
U+308D
138
51位
U+307B
136
52位
U+3080
135
53位
U+306D
134
54位
U+3065
133
55位
U+3056
131
56位
U+4EBA
122
57位
U+4E00
114
58位
U+3079
112
59位
U+7D66
101
60位
U+3052
101
60位
U+3076
98
62位
U+90CE
97
63位
U+4E09
91
64位
U+5FA1
89
65位
U+7533
88
66位
U+3090
87
67位
U+304E
86
68位
U+3091
83
69位
U+3050
80
70位
U+3062
79
71位
U+3031
75
72位
U+3073
75
72位
U+309E
74
74位
U+601D
72
75位
U+3054
71
76位
U+306C
67
77位
U+5171
65
78位
U+5019
63
79位
U+307C
62
80位
U+5FC3
61
81位
U+4E8C
61
81位
U+5927
60
83位
U+5341
53
84位
U+3048
50
85位
U+4E94
48
86位
U+898B
47
87位
U+305C
42
88位
U+6B64
38
89位
U+65E5
37
90位
U+5B50
33
91位
U+56DB
29
92位
U+4ECA
27
93位
U+6B21
27
93位
U+5165
26
95位
U+3005
25
96位
U+8EAB
23
97位
U+53C8
23
97位
U+4E2D
22
99位
U+516D
21
100位
U+5C71
21
100位
U+624B
21
100位
U+516B
21
100位
U+592A
20
104位
U+4E03
20
104位
U+3032
19
106位
U+5973
18
107位
U+4E5F
17
108位
U+767E
17
108位
U+6708
16
110位
U+541B
12
111位
U+4E5D
10
112位
U+5C0F
9
113位
U+5343
8
114位
U+6728
6
115位
U+4E0A
5
116位
U+5176
5
116位
U+6211
4
118位
U+591C
4
118位
U+5EFF
4
118位
U+540D
4
118位
U+5345
3
122位
U+8A9E
3
122位
U+6C34
3
122位
U+5DFB
3
122位
U+4E0B
3
122位
U+7269
3
122位
U+7B2C
3
122位
U+66FD
3
122位
U+4EE5
2
130位
U+4EE3
2
130位
U+738B
2
130位
U+6268
2
130位
U+5929
2
130位
U+662F
2
130位
U+5DDD
2
130位
U+6D41
2
130位
U+7AF9
2
130位
U+6BBF
2
130位
U+6210
2
130位
U+5916
1
141位
U+8A5E
1
141位
U+5C3C
1
141位
U+6642
1
141位
U+7537
1
141位
U+8272
1
141位
U+6587
1
141位
U+53C2
1
141位
U+756A
1
141位
U+6C5F
1
141位
U+805E
1
141位
U+51FA
1
141位
U+8FD4
1
141位
U+4ECD
1
141位
U+7D42
1
141位
U+4F55
1
141位
U+89AA
1
141位
U+85E4
1
141位
U+76EE
1
141位
U+25B2
1
141位
U+7A0B
1
141位
U+884C
1
141位
U+7ACB
1
141位
U+5F8C
1
141位
U+9332
1
141位
U+6D25
1
141位

コード順文字種リスト

U+25B2
1
U+3005
25
U+3031
75
U+3032
19
U+3042
402
U+3044
841
U+3046
927
U+3048
50
U+304A
321
U+304B
1036
U+304C
339
U+304D
660
U+304E
86
U+304F
635
U+3050
80
U+3051
658
U+3052
101
U+3053
447
U+3054
71
U+3055
471
U+3056
131
U+3057
1203
U+3058
198
U+3059
360
U+305A
143
U+305B
249
U+305C
42
U+305D
242
U+305E
151
U+305F
701
U+3060
205
U+3061
386
U+3062
79
U+3064
501
U+3065
133
U+3066
849
U+3067
150
U+3068
958
U+3069
165
U+306A
719
U+306B
969
U+306C
67
U+306D
134
U+306E
1181
U+306F
871
U+3070
392
U+3072
460
U+3073
75
U+3075
284
U+3076
98
U+3078
295
U+3079
112
U+307B
136
U+307C
62
U+307E
539
U+307F
254
U+3080
135
U+3081
192
U+3082
545
U+3084
522
U+3086
142
U+3088
360
U+3089
548
U+308A
873
U+308B
580
U+308C
578
U+308D
138
U+308F
185
U+3090
87
U+3091
83
U+3092
735
U+3093
748
U+309D
324
U+309E
74
U+4E00
114
U+4E03
20
U+4E09
91
U+4E0A
5
U+4E0B
3
U+4E2D
22
U+4E5D
10
U+4E5F
17
U+4E8B
145
U+4E8C
61
U+4E94
48
U+4EBA
122
U+4ECA
27
U+4ECD
1
U+4EE3
2
U+4EE5
2
U+4F55
1
U+5019
63
U+5165
26
U+516B
21
U+516D
21
U+5171
65
U+5176
5
U+51FA
1
U+5341
53
U+5343
8
U+5345
3
U+53C2
1
U+53C8
23
U+540D
4
U+541B
12
U+56DB
29
U+5916
1
U+591C
4
U+5927
60
U+5929
2
U+592A
20
U+5973
18
U+5B50
33
U+5C0F
9
U+5C3C
1
U+5C71
21
U+5DDD
2
U+5DFB
3
U+5EFF
4
U+5F8C
1
U+5FA1
89
U+5FC3
61
U+601D
72
U+6210
2
U+6211
4
U+624B
21
U+6268
2
U+6587
1
U+65E5
37
U+662F
2
U+6642
1
U+66FD
3
U+6708
16
U+6728
6
U+6B21
27
U+6B64
38
U+6BBF
2
U+6C34
3
U+6C5F
1
U+6D25
1
U+6D41
2
U+7269
3
U+738B
2
U+7533
88
U+7537
1
U+756A
1
U+767E
17
U+76EE
1
U+7A0B
1
U+7ACB
1
U+7AF9
2
U+7B2C
3
U+7D42
1
U+7D66
101
U+805E
1
U+8272
1
U+85E4
1
U+884C
1
U+898B
47
U+89AA
1
U+8A5E
1
U+8A9E
3
U+8EAB
23
U+8FD4
1
U+90CE
97
U+9332
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。

提供:ROIS-DS人文学オープンデータ共同利用センター