曾我物語

downloadくずし字データセットダウンロード: 個別(ZIP 155.80 MB)全体(ZIP 7032.01 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア): 文字表示四角表示

picture KuroNetくずし字認識サービス

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer): 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)をご利用下さい。

文字種:166 / 文字数:29,584

頻度順文字種リスト

U+3057
1203
U+306E
1181
U+304B
1036
U+306B
969
U+3068
958
U+3046
927
U+308A
873
U+306F
871
U+3066
849
U+3044
841
U+3093
748
U+3092
735
U+306A
719
U+305F
701
U+304D
660
U+3051
658
U+304F
635
U+308B
580
U+308C
578
U+3089
548
U+3082
545
U+307E
539
U+3084
522
U+3064
501
U+3055
471
U+3072
460
U+3053
447
U+3042
402
U+3070
392
U+3061
386
U+3088
360
U+3059
360
U+304C
339
U+309D
324
U+304A
321
U+3078
295
U+3075
284
U+307F
254
U+305B
249
U+305D
242
U+3060
205
U+3058
198
U+3081
192
U+308F
185
U+3069
165
U+305E
151
U+3067
150
U+4E8B
145
U+305A
143
U+3086
142
U+308D
138
U+307B
136
U+3080
135
U+306D
134
U+3065
133
U+3056
131
U+4EBA
122
U+4E00
114
U+3079
112
U+7D66
101
U+3052
101
U+3076
98
U+90CE
97
U+4E09
91
U+5FA1
89
U+7533
88
U+3090
87
U+304E
86
U+3091
83
U+3050
80
U+3062
79
U+3073
75
U+3031
75
U+309E
74
U+601D
72
U+3054
71
U+306C
67
U+5171
65
U+5019
63
U+307C
62
U+5FC3
61
U+4E8C
61
U+5927
60
U+5341
53
U+3048
50
U+4E94
48
U+898B
47
U+305C
42
U+6B64
38
U+65E5
37
U+5B50
33
U+56DB
29
U+4ECA
27
U+6B21
27
U+5165
26
U+3005
25
U+8EAB
23
U+53C8
23
U+4E2D
22
U+516B
21
U+624B
21
U+5C71
21
U+516D
21
U+4E03
20
U+592A
20
U+3032
19
U+5973
18
U+4E5F
17
U+767E
17
U+6708
16
U+541B
12
U+4E5D
10
U+5C0F
9
U+5343
8
U+6728
6
U+4E0A
5
U+5176
5
U+6211
4
U+5EFF
4
U+591C
4
U+540D
4
U+7B2C
3
U+5345
3
U+7269
3
U+6C34
3
U+4E0B
3
U+8A9E
3
U+66FD
3
U+5DFB
3
U+6210
2
U+662F
2
U+6D41
2
U+4EE3
2
U+6268
2
U+4EE5
2
U+6BBF
2
U+7AF9
2
U+5929
2
U+738B
2
U+5DDD
2
U+5916
1
U+89AA
1
U+6642
1
U+884C
1
U+805E
1
U+6D25
1
U+8272
1
U+4ECD
1
U+9332
1
U+7ACB
1
U+6C5F
1
U+8FD4
1
U+7D42
1
U+53C2
1
U+76EE
1
U+7537
1
U+4F55
1
U+8A5E
1
U+25B2
1
U+85E4
1
U+6587
1
U+5C3C
1
U+756A
1
U+51FA
1
U+5F8C
1
U+7A0B
1

コード順文字種リスト

U+25B2
1
U+3005
25
U+3031
75
U+3032
19
U+3042
402
U+3044
841
U+3046
927
U+3048
50
U+304A
321
U+304B
1036
U+304C
339
U+304D
660
U+304E
86
U+304F
635
U+3050
80
U+3051
658
U+3052
101
U+3053
447
U+3054
71
U+3055
471
U+3056
131
U+3057
1203
U+3058
198
U+3059
360
U+305A
143
U+305B
249
U+305C
42
U+305D
242
U+305E
151
U+305F
701
U+3060
205
U+3061
386
U+3062
79
U+3064
501
U+3065
133
U+3066
849
U+3067
150
U+3068
958
U+3069
165
U+306A
719
U+306B
969
U+306C
67
U+306D
134
U+306E
1181
U+306F
871
U+3070
392
U+3072
460
U+3073
75
U+3075
284
U+3076
98
U+3078
295
U+3079
112
U+307B
136
U+307C
62
U+307E
539
U+307F
254
U+3080
135
U+3081
192
U+3082
545
U+3084
522
U+3086
142
U+3088
360
U+3089
548
U+308A
873
U+308B
580
U+308C
578
U+308D
138
U+308F
185
U+3090
87
U+3091
83
U+3092
735
U+3093
748
U+309D
324
U+309E
74
U+4E00
114
U+4E03
20
U+4E09
91
U+4E0A
5
U+4E0B
3
U+4E2D
22
U+4E5D
10
U+4E5F
17
U+4E8B
145
U+4E8C
61
U+4E94
48
U+4EBA
122
U+4ECA
27
U+4ECD
1
U+4EE3
2
U+4EE5
2
U+4F55
1
U+5019
63
U+5165
26
U+516B
21
U+516D
21
U+5171
65
U+5176
5
U+51FA
1
U+5341
53
U+5343
8
U+5345
3
U+53C2
1
U+53C8
23
U+540D
4
U+541B
12
U+56DB
29
U+5916
1
U+591C
4
U+5927
60
U+5929
2
U+592A
20
U+5973
18
U+5B50
33
U+5C0F
9
U+5C3C
1
U+5C71
21
U+5DDD
2
U+5DFB
3
U+5EFF
4
U+5F8C
1
U+5FA1
89
U+5FC3
61
U+601D
72
U+6210
2
U+6211
4
U+624B
21
U+6268
2
U+6587
1
U+65E5
37
U+662F
2
U+6642
1
U+66FD
3
U+6708
16
U+6728
6
U+6B21
27
U+6B64
38
U+6BBF
2
U+6C34
3
U+6C5F
1
U+6D25
1
U+6D41
2
U+7269
3
U+738B
2
U+7533
88
U+7537
1
U+756A
1
U+767E
17
U+76EE
1
U+7A0B
1
U+7ACB
1
U+7AF9
2
U+7B2C
3
U+7D42
1
U+7D66
101
U+805E
1
U+8272
1
U+85E4
1
U+884C
1
U+898B
47
U+89AA
1
U+8A5E
1
U+8A9E
3
U+8EAB
23
U+8FD4
1
U+90CE
97
U+9332
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI (10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元である人文学オープンデータ共同利用センターへのリンクをお願いします。

提供:人文学オープンデータ共同利用センター