ぢぐち

downloadくずし字データセットダウンロード → 個別(ZIP 7.71 MB)
全体(字形画像除く)(ZIP 4906.06 MB)全体(字形画像含む)(ZIP 7354.19 MB)

picture くずし字データセットの閲覧(くずし字一文字認識ビューア) → 文字表示四角表示

picture KuroNetくずし字認識サービスKuroNetくずし字認識ビューアを使う

list 書誌情報

picture日本古典籍画像の閲覧(IIIF Curation Viewer) → 画像表示サムネイル表示

データセットの統計情報

データセットに含まれる文字種を、頻度順文字種リストまたはコード順文字種リストで一覧できます。くずし字の一つ一つの文字の形の違いだけでなく、くずし字の元となる字母の違いによる異体字のバリエーションなど、実際の字形を画像で確認しながら、くずし字の学習などにご利用ください。文字をクリックすると字形一覧ページに移動します。文字の検索にはブラウザの検索機能を使って下さい。

なおデータセット全体の統計情報については、日本古典籍くずし字データセット 文字種(くずし字)一覧、また検索にはくずし字データベース検索(ひらがな(変体仮名)・カタカナ・漢字)Unicode変体仮名一覧をご利用下さい。

文字種:78 / 文字数:121

頻度順文字種リスト

U+306E
6
1位
U+306B
4
2位
U+305F
4
2位
U+309D
3
4位
U+308A
3
4位
U+306A
3
4位
U+3082
3
4位
U+3042
3
4位
U+307E
3
4位
U+306F
3
4位
U+3093
3
4位
U+304B
3
4位
U+304D
3
4位
U+3089
2
14位
U+3084
2
14位
U+3044
2
14位
U+4ED9
2
14位
U+3073
2
14位
U+90CE
2
14位
U+3055
2
14位
U+304F
2
14位
U+3091
2
14位
U+9152
2
14位
U+3059
2
14位
U+308B
2
14位
U+3081
1
26位
U+7D0D
1
26位
U+308D
1
26位
U+6C34
1
26位
U+8C46
1
26位
U+6642
1
26位
U+3064
1
26位
U+3054
1
26位
U+4E09
1
26位
U+97F3
1
26位
U+888B
1
26位
U+3053
1
26位
U+5EFB
1
26位
U+3070
1
26位
U+671D
1
26位
U+304E
1
26位
U+66F8
1
26位
U+3069
1
26位
U+51FA
1
26位
U+756A
1
26位
U+8CCA
1
26位
U+3060
1
26位
U+7B1B
1
26位
U+4E73
1
26位
U+6176
1
26位
U+5F01
1
26位
U+87F9
1
26位
U+3057
1
26位
U+56FD
1
26位
U+68D2
1
26位
U+6E6F
1
26位
U+4E94
1
26位
U+93A7
1
26位
U+3050
1
26位
U+5165
1
26位
U+9B3C
1
26位
U+3076
1
26位
U+309E
1
26位
U+5E03
1
26位
U+5927
1
26位
U+82B1
1
26位
U+3075
1
26位
U+3088
1
26位
U+307C
1
26位
U+70CF
1
26位
U+3052
1
26位
U+4EBA
1
26位
U+95A2
1
26位
U+3071
1
26位
U+5B9C
1
26位
U+934B
1
26位
U+307F
1
26位
U+591C
1
26位

コード順文字種リスト

U+3042
3
U+3044
2
U+304B
3
U+304D
3
U+304E
1
U+304F
2
U+3050
1
U+3052
1
U+3053
1
U+3054
1
U+3055
2
U+3057
1
U+3059
2
U+305F
4
U+3060
1
U+3064
1
U+3069
1
U+306A
3
U+306B
4
U+306E
6
U+306F
3
U+3070
1
U+3071
1
U+3073
2
U+3075
1
U+3076
1
U+307C
1
U+307E
3
U+307F
1
U+3081
1
U+3082
3
U+3084
2
U+3088
1
U+3089
2
U+308A
3
U+308B
2
U+308D
1
U+3091
2
U+3093
3
U+309D
3
U+309E
1
U+4E09
1
U+4E73
1
U+4E94
1
U+4EBA
1
U+4ED9
2
U+5165
1
U+51FA
1
U+56FD
1
U+591C
1
U+5927
1
U+5B9C
1
U+5E03
1
U+5EFB
1
U+5F01
1
U+6176
1
U+6642
1
U+66F8
1
U+671D
1
U+68D2
1
U+6C34
1
U+6E6F
1
U+70CF
1
U+756A
1
U+7B1B
1
U+7D0D
1
U+82B1
1
U+87F9
1
U+888B
1
U+8C46
1
U+8CCA
1
U+90CE
2
U+9152
2
U+934B
1
U+93A7
1
U+95A2
1
U+97F3
1
U+9B3C
1

ライセンス

クリエイティブ・コモンズ・ライセンス
日本古典籍くずし字データセット』(国文学研究資料館所蔵/情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター加工)はクリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンス(CC BY-SA)の下に提供されています。 詳しくはライセンスの説明をご覧下さい。

このデータセットのみをご利用の際には、例えば以下のような表示をお願いします。データセット全体をご利用の際にはデータセットのライセンスをご参照下さい。

『日本古典籍くずし字データセット』(国文研所蔵/CODH加工) doi:10.20676/00000340

ここで、データセットのDOI(doi:10.20676/00000340)は、データセットを特定するために重要な情報ですので、引用の際にはできるだけ含めて下さい。なお、このDOIはデータセットの更新にかかわらず不変のIDとし、データセットのバージョン管理は行いません。

また可能な場合には、データ提供元であるROIS-DS人文学オープンデータ共同利用センター(CODH)へのリンクをお願いします。

提供:ROIS-DS人文学オープンデータ共同利用センター