源氏物語

downloadくずし字データセットダウンロード: 個別(ZIP 47.17 MB)全体(ZIP 7032.01 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア): 文字表示四角表示

picture KuroNetくずし字認識サービス

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer): 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)をご利用下さい。

文字種:193 / 文字数:11,566

頻度順文字種リスト

U+3057
547
U+305F
498
U+304B
485
U+307E
439
U+3068
434
U+306E
433
U+306F
423
U+306A
415
U+306B
381
U+308A
368
U+304D
347
U+3066
330
U+3082
313
U+304A
266
U+3064
256
U+308B
249
U+3055
244
U+3044
243
U+304F
233
U+3046
216
U+3053
214
U+3072
212
U+3089
208
U+309D
185
U+307B
184
U+3092
183
U+3059
183
U+3078
183
U+3075
179
U+307F
176
U+3051
170
U+5FA1
160
U+3042
160
U+308C
150
U+305B
132
U+3080
115
U+3061
109
U+305D
103
U+3084
100
U+3081
97
U+3048
88
U+3088
85
U+308D
81
U+4EBA
78
U+7D66
76
U+3031
60
U+308F
56
U+3086
54
U+306C
45
U+4E8B
42
U+5FC3
41
U+306D
34
U+3093
28
U+5BAE
25
U+4F8D
22
U+5973
17
U+4E16
16
U+541B
13
U+3090
13
U+6240
12
U+5927
11
U+6708
10
U+65E5
10
U+5185
10
U+601D
9
U+3091
9
U+6642
9
U+591C
8
U+3058
8
U+6BBF
8
U+65B9
7
U+6625
6
U+6C0F
6
U+53F3
6
U+6E90
6
U+3065
5
U+4E2D
5
U+623F
5
U+53C8
5
U+304C
5
U+547D
5
U+5A66
4
U+3079
4
U+8863
4
U+66F4
4
U+8EAB
4
U+305A
4
U+4E00
4
U+7D0D
3
U+89A7
3
U+5F18
3
U+5BA3
3
U+5E1D
3
U+8A00
3
U+670D
3
U+9732
3
U+5FBD
3
U+4E94
3
U+5F01
3
U+81E3
3
U+3056
3
U+3070
3
U+5143
3
U+56DB
3
U+5B50
3
U+5EA7
3
U+6211
3
U+4E09
3
U+76F8
3
U+3069
3
U+307C
2
U+694A
2
U+9662
2
U+98A8
2
U+5148
2
U+7533
2
U+4E8C
2
U+8CB4
2
U+537F
2
U+738B
2
U+3052
2
U+3050
2
U+516D
2
U+540D
2
U+3060
2
U+6545
2
U+65E8
2
U+96F2
2
U+8535
2
U+304E
2
U+574A
2
U+305E
2
U+79CB
2
U+5983
2
U+8349
2
U+8FD4
2
U+4E0B
2
U+592E
1
U+524D
1
U+9957
1
U+3062
1
U+5C71
1
U+4FEE
1
U+7336
1
U+82B1
1
U+6068
1
U+5341
1
U+309E
1
U+91CE
1
U+9D3B
1
U+6DB2
1
U+54C1
1
U+4F7F
1
U+706B
1
U+6B4C
1
U+5F8C
1
U+8077
1
U+4F4D
1
U+5C11
1
U+7406
1
U+5E74
1
U+5E8A
1
U+67F3
1
U+590F
1
U+5916
1
U+89AA
1
U+84C9
1
U+3005
1
U+9928
1
U+672A
1
U+7121
1
U+5175
1
U+7269
1
U+90E8
1
U+4EAD
1
U+8449
1
U+9577
1
U+8272
1
U+81DA
1
U+4EE3
1
U+5C06
1
U+6D99
1
U+5357
1
U+5C3A
1
U+677E
1
U+8299
1
U+898B
1
U+6DBC
1
U+5929
1
U+8FD1
1
U+6C60
1
U+5F71
1
U+52C5
1

コード順文字種リスト

U+3005
1
U+3031
60
U+3042
160
U+3044
243
U+3046
216
U+3048
88
U+304A
266
U+304B
485
U+304C
5
U+304D
347
U+304E
2
U+304F
233
U+3050
2
U+3051
170
U+3052
2
U+3053
214
U+3055
244
U+3056
3
U+3057
547
U+3058
8
U+3059
183
U+305A
4
U+305B
132
U+305D
103
U+305E
2
U+305F
498
U+3060
2
U+3061
109
U+3062
1
U+3064
256
U+3065
5
U+3066
330
U+3068
434
U+3069
3
U+306A
415
U+306B
381
U+306C
45
U+306D
34
U+306E
433
U+306F
423
U+3070
3
U+3072
212
U+3075
179
U+3078
183
U+3079
4
U+307B
184
U+307C
2
U+307E
439
U+307F
176
U+3080
115
U+3081
97
U+3082
313
U+3084
100
U+3086
54
U+3088
85
U+3089
208
U+308A
368
U+308B
249
U+308C
150
U+308D
81
U+308F
56
U+3090
13
U+3091
9
U+3092
183
U+3093
28
U+309D
185
U+309E
1
U+4E00
4
U+4E09
3
U+4E0B
2
U+4E16
16
U+4E2D
5
U+4E8B
42
U+4E8C
2
U+4E94
3
U+4EAD
1
U+4EBA
78
U+4EE3
1
U+4F4D
1
U+4F7F
1
U+4F8D
22
U+4FEE
1
U+5143
3
U+5148
2
U+516D
2
U+5175
1
U+5185
10
U+524D
1
U+52C5
1
U+5341
1
U+5357
1
U+537F
2
U+53C8
5
U+53F3
6
U+540D
2
U+541B
13
U+547D
5
U+54C1
1
U+56DB
3
U+574A
2
U+590F
1
U+5916
1
U+591C
8
U+5927
11
U+5929
1
U+592E
1
U+5973
17
U+5983
2
U+5A66
4
U+5B50
3
U+5BA3
3
U+5BAE
25
U+5C06
1
U+5C11
1
U+5C3A
1
U+5C71
1
U+5E1D
3
U+5E74
1
U+5E8A
1
U+5EA7
3
U+5F01
3
U+5F18
3
U+5F71
1
U+5F8C
1
U+5FA1
160
U+5FBD
3
U+5FC3
41
U+601D
9
U+6068
1
U+6211
3
U+623F
5
U+6240
12
U+6545
2
U+65B9
7
U+65E5
10
U+65E8
2
U+6625
6
U+6642
9
U+66F4
4
U+6708
10
U+670D
3
U+672A
1
U+677E
1
U+67F3
1
U+694A
2
U+6B4C
1
U+6BBF
8
U+6C0F
6
U+6C60
1
U+6D99
1
U+6DB2
1
U+6DBC
1
U+6E90
6
U+706B
1
U+7121
1
U+7269
1
U+7336
1
U+738B
2
U+7406
1
U+7533
2
U+76F8
3
U+79CB
2
U+7D0D
3
U+7D66
76
U+8077
1
U+81DA
1
U+81E3
3
U+8272
1
U+8299
1
U+82B1
1
U+8349
2
U+8449
1
U+84C9
1
U+8535
2
U+8863
4
U+898B
1
U+89A7
3
U+89AA
1
U+8A00
3
U+8CB4
2
U+8EAB
4
U+8FD1
1
U+8FD4
2
U+90E8
1
U+91CE
1
U+9577
1
U+9662
2
U+96F2
2
U+9732
3
U+98A8
2
U+9928
1
U+9957
1
U+9D3B
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI (10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元である人文学オープンデータ共同利用センターへのリンクをお願いします。

提供:人文学オープンデータ共同利用センター