源氏物語

downloadくずし字データセットダウンロード: 個別(ZIP 57.25 MB)全体(ZIP 7032.01 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア): 文字表示四角表示

picture KuroNetくずし字認識サービス

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer): 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)をご利用下さい。

文字種:237 / 文字数:11,132

頻度順文字種リスト

U+3057
500
U+304B
422
U+306E
410
U+306A
402
U+306B
380
U+308A
354
U+306F
329
U+305F
316
U+3068
306
U+307E
294
U+3082
283
U+304D
279
U+3066
275
U+308B
248
U+304A
239
U+3044
227
U+3046
222
U+7D66
218
U+3055
213
U+3089
206
U+304F
195
U+3064
192
U+3092
186
U+307F
175
U+5FA1
160
U+3072
153
U+3042
153
U+308C
149
U+3053
149
U+3078
138
U+305B
128
U+3051
127
U+309D
122
U+3075
122
U+3069
119
U+3059
108
U+3084
101
U+3081
95
U+3061
92
U+3093
92
U+307C
91
U+3070
91
U+307B
88
U+3048
85
U+305D
82
U+3088
79
U+4EBA
75
U+305A
75
U+304C
69
U+3065
65
U+308D
63
U+308F
56
U+3067
52
U+5FC3
50
U+3079
48
U+309E
47
U+3052
47
U+3086
47
U+306C
45
U+304E
45
U+3058
44
U+3060
44
U+3080
43
U+3050
35
U+306D
34
U+3056
31
U+3031
29
U+3073
29
U+601D
26
U+805E
23
U+4E16
22
U+5BAE
22
U+4F8D
21
U+305E
21
U+3032
19
U+5973
17
U+3054
16
U+3090
16
U+3062
14
U+6240
14
U+5927
11
U+3005
11
U+6708
10
U+541B
10
U+6642
10
U+3091
9
U+65E5
9
U+7269
9
U+547D
9
U+591C
8
U+6BBF
8
U+5185
8
U+899A
6
U+6C0F
6
U+4E2D
6
U+6625
6
U+4E8B
6
U+6E90
6
U+53F3
6
U+6B64
5
U+89A7
5
U+305C
5
U+623F
5
U+8FD4
5
U+6210
5
U+8EAB
5
U+5FCD
4
U+5A66
4
U+5915
4
U+866B
4
U+8A00
4
U+7336
4
U+5B50
4
U+76F8
4
U+6BD4
4
U+3076
4
U+4E00
4
U+8863
4
U+66F4
4
U+5FBD
3
U+4E94
3
U+604B
3
U+98A8
3
U+5F18
3
U+7D0D
3
U+9732
3
U+670D
3
U+82B1
3
U+5E1D
3
U+5BA3
3
U+56DB
3
U+5143
3
U+8272
3
U+4E09
3
U+5EA7
3
U+81E3
3
U+5F01
3
U+96F2
3
U+5E74
3
U+5317
3
U+5165
3
U+884C
3
U+51FA
2
U+91CE
2
U+5F8C
2
U+6545
2
U+540D
2
U+6709
2
U+516D
2
U+4E8C
2
U+7533
2
U+5148
2
U+9662
2
U+694A
2
U+4ECA
2
U+5206
2
U+738B
2
U+53C8
2
U+8CB4
2
U+537F
2
U+54C0
2
U+8349
2
U+5983
2
U+4E0B
2
U+6DBC
2
U+898B
2
U+671D
2
U+65E8
2
U+79CB
2
U+574A
2
U+9D3B
1
U+5171
1
U+9CE5
1
U+7B1B
1
U+5439
1
U+5341
1
U+6587
1
U+5C11
1
U+8077
1
U+4F4D
1
U+7A0B
1
U+6B4C
1
U+706B
1
U+4F7F
1
U+6DB2
1
U+54C1
1
U+9957
1
U+8A9E
1
U+592E
1
U+524D
1
U+672B
1
U+5EA6
1
U+5F62
1
U+5C0B
1
U+6068
1
U+9053
1
U+4FEE
1
U+5C71
1
U+4F55
1
U+5357
1
U+8429
1
U+621A
1
U+6728
1
U+7A7A
1
U+5C06
1
U+4EE3
1
U+81DA
1
U+9577
1
U+8449
1
U+5C0F
1
U+52C5
1
U+5929
1
U+7389
1
U+8FD1
1
U+6751
1
U+6211
1
U+8299
1
U+677E
1
U+5916
1
U+89AA
1
U+84C9
1
U+66AE
1
U+7B46
1
U+4E0A
1
U+8535
1
U+590F
1
U+662F
1
U+67F3
1
U+7406
1
U+5E8A
1
U+90E8
1
U+4EAD
1
U+5175
1
U+7121
1
U+9928
1
U+5BBF
1
U+672A
1

コード順文字種リスト

U+3005
11
U+3031
29
U+3032
19
U+3042
153
U+3044
227
U+3046
222
U+3048
85
U+304A
239
U+304B
422
U+304C
69
U+304D
279
U+304E
45
U+304F
195
U+3050
35
U+3051
127
U+3052
47
U+3053
149
U+3054
16
U+3055
213
U+3056
31
U+3057
500
U+3058
44
U+3059
108
U+305A
75
U+305B
128
U+305C
5
U+305D
82
U+305E
21
U+305F
316
U+3060
44
U+3061
92
U+3062
14
U+3064
192
U+3065
65
U+3066
275
U+3067
52
U+3068
306
U+3069
119
U+306A
402
U+306B
380
U+306C
45
U+306D
34
U+306E
410
U+306F
329
U+3070
91
U+3072
153
U+3073
29
U+3075
122
U+3076
4
U+3078
138
U+3079
48
U+307B
88
U+307C
91
U+307E
294
U+307F
175
U+3080
43
U+3081
95
U+3082
283
U+3084
101
U+3086
47
U+3088
79
U+3089
206
U+308A
354
U+308B
248
U+308C
149
U+308D
63
U+308F
56
U+3090
16
U+3091
9
U+3092
186
U+3093
92
U+309D
122
U+309E
47
U+4E00
4
U+4E09
3
U+4E0A
1
U+4E0B
2
U+4E16
22
U+4E2D
6
U+4E8B
6
U+4E8C
2
U+4E94
3
U+4EAD
1
U+4EBA
75
U+4ECA
2
U+4EE3
1
U+4F4D
1
U+4F55
1
U+4F7F
1
U+4F8D
21
U+4FEE
1
U+5143
3
U+5148
2
U+5165
3
U+516D
2
U+5171
1
U+5175
1
U+5185
8
U+51FA
2
U+5206
2
U+524D
1
U+52C5
1
U+5317
3
U+5341
1
U+5357
1
U+537F
2
U+53C8
2
U+53F3
6
U+540D
2
U+541B
10
U+5439
1
U+547D
9
U+54C0
2
U+54C1
1
U+56DB
3
U+574A
2
U+590F
1
U+5915
4
U+5916
1
U+591C
8
U+5927
11
U+5929
1
U+592E
1
U+5973
17
U+5983
2
U+5A66
4
U+5B50
4
U+5BA3
3
U+5BAE
22
U+5BBF
1
U+5C06
1
U+5C0B
1
U+5C0F
1
U+5C11
1
U+5C71
1
U+5E1D
3
U+5E74
3
U+5E8A
1
U+5EA6
1
U+5EA7
3
U+5F01
3
U+5F18
3
U+5F62
1
U+5F8C
2
U+5FA1
160
U+5FBD
3
U+5FC3
50
U+5FCD
4
U+601D
26
U+604B
3
U+6068
1
U+6210
5
U+6211
1
U+621A
1
U+623F
5
U+6240
14
U+6545
2
U+6587
1
U+65E5
9
U+65E8
2
U+6625
6
U+662F
1
U+6642
10
U+66AE
1
U+66F4
4
U+6708
10
U+6709
2
U+670D
3
U+671D
2
U+6728
1
U+672A
1
U+672B
1
U+6751
1
U+677E
1
U+67F3
1
U+694A
2
U+6B4C
1
U+6B64
5
U+6BBF
8
U+6BD4
4
U+6C0F
6
U+6DB2
1
U+6DBC
2
U+6E90
6
U+706B
1
U+7121
1
U+7269
9
U+7336
4
U+7389
1
U+738B
2
U+7406
1
U+7533
2
U+76F8
4
U+79CB
2
U+7A0B
1
U+7A7A
1
U+7B1B
1
U+7B46
1
U+7D0D
3
U+7D66
218
U+805E
23
U+8077
1
U+81DA
1
U+81E3
3
U+8272
3
U+8299
1
U+82B1
3
U+8349
2
U+8429
1
U+8449
1
U+84C9
1
U+8535
1
U+866B
4
U+884C
3
U+8863
4
U+898B
2
U+899A
6
U+89A7
5
U+89AA
1
U+8A00
4
U+8A9E
1
U+8CB4
2
U+8EAB
5
U+8FD1
1
U+8FD4
5
U+9053
1
U+90E8
1
U+91CE
2
U+9577
1
U+9662
2
U+96F2
3
U+9732
3
U+98A8
3
U+9928
1
U+9957
1
U+9CE5
1
U+9D3B
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI (10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元である人文学オープンデータ共同利用センターへのリンクをお願いします。

提供:人文学オープンデータ共同利用センター