源氏物語

downloadくずし字データセットダウンロード → 個別(ZIP 47.17 MB)
全体(字形画像除く)(ZIP 4906.06 MB)全体(字形画像含む)(ZIP 7354.19 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示四角表示

picture KuroNetくずし字認識サービスKuroNetくずし字認識ビューアを使う

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)Unicode変体仮名一覧をご利用下さい。

文字種:193 / 文字数:11,566

頻度順文字種リスト

U+3057
547
1位
U+305F
498
2位
U+304B
485
3位
U+307E
439
4位
U+3068
434
5位
U+306E
433
6位
U+306F
423
7位
U+306A
415
8位
U+306B
381
9位
U+308A
368
10位
U+304D
347
11位
U+3066
330
12位
U+3082
313
13位
U+304A
266
14位
U+3064
256
15位
U+308B
249
16位
U+3055
244
17位
U+3044
243
18位
U+304F
233
19位
U+3046
216
20位
U+3053
214
21位
U+3072
212
22位
U+3089
208
23位
U+309D
185
24位
U+307B
184
25位
U+3059
183
26位
U+3092
183
26位
U+3078
183
26位
U+3075
179
29位
U+307F
176
30位
U+3051
170
31位
U+3042
160
32位
U+5FA1
160
32位
U+308C
150
34位
U+305B
132
35位
U+3080
115
36位
U+3061
109
37位
U+305D
103
38位
U+3084
100
39位
U+3081
97
40位
U+3048
88
41位
U+3088
85
42位
U+308D
81
43位
U+4EBA
78
44位
U+7D66
76
45位
U+3031
60
46位
U+308F
56
47位
U+3086
54
48位
U+306C
45
49位
U+4E8B
42
50位
U+5FC3
41
51位
U+306D
34
52位
U+3093
28
53位
U+5BAE
25
54位
U+4F8D
22
55位
U+5973
17
56位
U+4E16
16
57位
U+541B
13
58位
U+3090
13
58位
U+6240
12
60位
U+5927
11
61位
U+65E5
10
62位
U+5185
10
62位
U+6708
10
62位
U+601D
9
65位
U+6642
9
65位
U+3091
9
65位
U+6BBF
8
68位
U+3058
8
68位
U+591C
8
68位
U+65B9
7
71位
U+6625
6
72位
U+6E90
6
72位
U+6C0F
6
72位
U+53F3
6
72位
U+4E2D
5
76位
U+53C8
5
76位
U+623F
5
76位
U+304C
5
76位
U+3065
5
76位
U+547D
5
76位
U+66F4
4
82位
U+305A
4
82位
U+4E00
4
82位
U+3079
4
82位
U+5A66
4
82位
U+8863
4
82位
U+8EAB
4
82位
U+5FBD
3
89位
U+7D0D
3
89位
U+5F01
3
89位
U+56DB
3
89位
U+89A7
3
89位
U+3056
3
89位
U+6211
3
89位
U+3070
3
89位
U+9732
3
89位
U+4E09
3
89位
U+5143
3
89位
U+5B50
3
89位
U+3069
3
89位
U+5F18
3
89位
U+4E94
3
89位
U+76F8
3
89位
U+81E3
3
89位
U+5BA3
3
89位
U+5E1D
3
89位
U+670D
3
89位
U+8A00
3
89位
U+5EA7
3
89位
U+79CB
2
111位
U+98A8
2
111位
U+8535
2
111位
U+8349
2
111位
U+6545
2
111位
U+4E0B
2
111位
U+4E8C
2
111位
U+3060
2
111位
U+7533
2
111位
U+8CB4
2
111位
U+305E
2
111位
U+96F2
2
111位
U+9662
2
111位
U+3052
2
111位
U+304E
2
111位
U+8FD4
2
111位
U+516D
2
111位
U+540D
2
111位
U+537F
2
111位
U+738B
2
111位
U+65E8
2
111位
U+5148
2
111位
U+574A
2
111位
U+3050
2
111位
U+5983
2
111位
U+307C
2
111位
U+694A
2
111位
U+5C06
1
138位
U+91CE
1
138位
U+9D3B
1
138位
U+4EE3
1
138位
U+90E8
1
138位
U+7121
1
138位
U+6DBC
1
138位
U+9928
1
138位
U+6C60
1
138位
U+8449
1
138位
U+5341
1
138位
U+54C1
1
138位
U+3005
1
138位
U+8077
1
138位
U+4EAD
1
138位
U+898B
1
138位
U+89AA
1
138位
U+4F4D
1
138位
U+5916
1
138位
U+5F8C
1
138位
U+5E74
1
138位
U+67F3
1
138位
U+5F71
1
138位
U+6068
1
138位
U+8272
1
138位
U+6DB2
1
138位
U+8299
1
138位
U+5C11
1
138位
U+590F
1
138位
U+4F7F
1
138位
U+672A
1
138位
U+5C71
1
138位
U+5357
1
138位
U+706B
1
138位
U+677E
1
138位
U+5C3A
1
138位
U+309E
1
138位
U+592E
1
138位
U+5E8A
1
138位
U+6D99
1
138位
U+9957
1
138位
U+7269
1
138位
U+5175
1
138位
U+8FD1
1
138位
U+7406
1
138位
U+4FEE
1
138位
U+524D
1
138位
U+84C9
1
138位
U+81DA
1
138位
U+9577
1
138位
U+52C5
1
138位
U+5929
1
138位
U+3062
1
138位
U+7336
1
138位
U+82B1
1
138位
U+6B4C
1
138位

コード順文字種リスト

U+3005
1
U+3031
60
U+3042
160
U+3044
243
U+3046
216
U+3048
88
U+304A
266
U+304B
485
U+304C
5
U+304D
347
U+304E
2
U+304F
233
U+3050
2
U+3051
170
U+3052
2
U+3053
214
U+3055
244
U+3056
3
U+3057
547
U+3058
8
U+3059
183
U+305A
4
U+305B
132
U+305D
103
U+305E
2
U+305F
498
U+3060
2
U+3061
109
U+3062
1
U+3064
256
U+3065
5
U+3066
330
U+3068
434
U+3069
3
U+306A
415
U+306B
381
U+306C
45
U+306D
34
U+306E
433
U+306F
423
U+3070
3
U+3072
212
U+3075
179
U+3078
183
U+3079
4
U+307B
184
U+307C
2
U+307E
439
U+307F
176
U+3080
115
U+3081
97
U+3082
313
U+3084
100
U+3086
54
U+3088
85
U+3089
208
U+308A
368
U+308B
249
U+308C
150
U+308D
81
U+308F
56
U+3090
13
U+3091
9
U+3092
183
U+3093
28
U+309D
185
U+309E
1
U+4E00
4
U+4E09
3
U+4E0B
2
U+4E16
16
U+4E2D
5
U+4E8B
42
U+4E8C
2
U+4E94
3
U+4EAD
1
U+4EBA
78
U+4EE3
1
U+4F4D
1
U+4F7F
1
U+4F8D
22
U+4FEE
1
U+5143
3
U+5148
2
U+516D
2
U+5175
1
U+5185
10
U+524D
1
U+52C5
1
U+5341
1
U+5357
1
U+537F
2
U+53C8
5
U+53F3
6
U+540D
2
U+541B
13
U+547D
5
U+54C1
1
U+56DB
3
U+574A
2
U+590F
1
U+5916
1
U+591C
8
U+5927
11
U+5929
1
U+592E
1
U+5973
17
U+5983
2
U+5A66
4
U+5B50
3
U+5BA3
3
U+5BAE
25
U+5C06
1
U+5C11
1
U+5C3A
1
U+5C71
1
U+5E1D
3
U+5E74
1
U+5E8A
1
U+5EA7
3
U+5F01
3
U+5F18
3
U+5F71
1
U+5F8C
1
U+5FA1
160
U+5FBD
3
U+5FC3
41
U+601D
9
U+6068
1
U+6211
3
U+623F
5
U+6240
12
U+6545
2
U+65B9
7
U+65E5
10
U+65E8
2
U+6625
6
U+6642
9
U+66F4
4
U+6708
10
U+670D
3
U+672A
1
U+677E
1
U+67F3
1
U+694A
2
U+6B4C
1
U+6BBF
8
U+6C0F
6
U+6C60
1
U+6D99
1
U+6DB2
1
U+6DBC
1
U+6E90
6
U+706B
1
U+7121
1
U+7269
1
U+7336
1
U+738B
2
U+7406
1
U+7533
2
U+76F8
3
U+79CB
2
U+7D0D
3
U+7D66
76
U+8077
1
U+81DA
1
U+81E3
3
U+8272
1
U+8299
1
U+82B1
1
U+8349
2
U+8449
1
U+84C9
1
U+8535
2
U+8863
4
U+898B
1
U+89A7
3
U+89AA
1
U+8A00
3
U+8CB4
2
U+8EAB
4
U+8FD1
1
U+8FD4
2
U+90E8
1
U+91CE
1
U+9577
1
U+9662
2
U+96F2
2
U+9732
3
U+98A8
2
U+9928
1
U+9957
1
U+9D3B
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。

提供:ROIS-DS人文学オープンデータ共同利用センター