古活字版の情報学的解析

古活字版の情報学的解析プロジェクトは、基幹研究プロジェクト 異分野融合による総合書物学の拡張的研究の一環として、情報学的な手法を用いて「嵯峨本」などの古活字の謎に迫るプロジェクトです。古活字については、古活字とくずし字をご覧ください。

アプリ

「そあん(soan)」は、古活字データセットを加工したデータセットを用いて、現代日本語テキストをくずし字画像に変換/共有するサービスです。

そあん(soan):古活字画像を用いて現代日本語テキストをくずし字画像に変換/共有するサービス

「古活字データセット簡易KWIC検索」は、古活字データセットの各種検索やKWIC表示、版面における出現場所などを表示するツールです。

古活字データセット簡易KWIC検索(@2SC1815J氏作成)

データセット

古活字データセット

研究ツール

古活字ブロック分析

参考文献

  1. Ignacio Perez-Messina, Asanobu KITAMOTO, "Kokatsuji: A Visualization Approach for Typographic Forensics of Early Japanese Movable Type", 9th Workshop on Visualization for the Digital Humanities, doi:10.34726/11413, 2025年11月 (in English)
  2. 北本 朝展, カラーヌワット タリン, Yuxiao Li, "古活字版の活字ブロック自動分割・同定のためのAI分析基盤", 異分野融合による総合書物学の拡張的研究 3ユニット合同シンポジウム, 2025年3月
  3. Yuxiao Li, Asanobu KITAMOTO, "A Machine Learning Approach to Identify Printing Blocks for Japanese Kokatsuji (Old Movable Type) Books", Digital Humanities 2024, pp. 440-444, doi:10.5281/zenodo.13761066, 2024年8月 (in English)
  4. 北本 朝展, 本間 淳, カラーヌワット タリン, "そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有", 人文科学とコンピュータシンポジウム じんもんこん2023論文集, pp. 51-58, 2023年12月

研究費

  1. 文字を介した視覚的コミュニケーション基盤の創成, 科学研究費 基盤研究(A), 研究代表者 内田 誠一
  2. 歴史ビッグデータ:史料とデータ駆動型モデルを結合する分野横断型研究基盤の構築, 科学研究費 基盤研究(A), 研究代表者 北本 朝展

記事

  1. 人と機械がアタマをつきあわせてー「総合書物学」のいま - 国文研ニューズ No.64

ニュース

2024-12-24

古活字ブロック分析を構築しました。

2024-04-03

データセットの文字および字母を、1文字修正しました。

2023-10-03

古活字版の情報学的解析プロジェクトの成果として、古活字データセットを公開しました。