古活字プロジェクトは、基幹研究プロジェクト 異分野融合による総合書物学の拡張的研究の一環として、情報学的な手法を用いて「嵯峨本」などの古活字の謎に迫るプロジェクトです。古活字については、古活字とくずし字をご覧ください。
アプリ
「そあん(soan)」は、古活字データセットを加工したデータセットを用いて、現代日本語テキストをくずし字画像に変換/共有するサービスです。
そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス
「古活字データセット簡易KWIC検索」は、古活字データセットの各種検索やKWIC表示、版面における出現場所などを表示するツールです。
古活字データセット簡易KWIC検索(@2SC1815J氏作成)
データセット
参考文献
- 北本 朝展, 本間 淳, カラーヌワット タリン, "そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有", 人文科学とコンピュータシンポジウム じんもんこん2023論文集, pp. 51-58, 2023年12月
研究費
- 文字を介した視覚的コミュニケーション基盤の創成, 科学研究費 基盤研究(A), 研究代表者 内田 誠一
- 歴史ビッグデータ:史料とデータ駆動型モデルを結合する分野横断型研究基盤の構築, 科学研究費 基盤研究(A), 研究代表者 北本 朝展
記事
- 人と機械がアタマをつきあわせてー「総合書物学」のいま - 国文研ニューズ No.64
ニュース
2024-04-03
データセットの文字および字母を、1文字修正しました。
2023-10-03
古活字プロジェクトの成果として、古活字データセットを公開しました。