CODHが取り組む歴史GIS(Geographic Information Systems)の一環として公開する、歴史的地理空間データセット・ソフトウェアに関する情報をまとめます。これは歴史ビッグデータプロジェクトに不可欠の基盤となります。
データセット
古地図などのデジタルデータを公開するだけでなく、古地図からの情報抽出や分析、さらに古地図を基盤とした歴史ビッグデータの研究などを進めています。
江戸マップβ版
江戸の古地図など江戸時代の文書から情報を抽出し再構成することで、江戸都市空間の地理情報基盤を構築するプロジェクトです。試験公開として、29枚の地図から8719ヶ所の地名を抽出してデータベース化しました。
国立国会図書館などが公開する古地図「江戸切絵図」に対して、IIIF Curation Platformの仕組みにより様々な情報を統合し、歴史ビッグデータや歴史GISの研究に活用します。
歴史的行政区域データセットβ版
近代から現代にかけての基礎的な歴史的地理空間データとして「歴史的行政区域データセットβ版」を構築し、市区町村境界の変遷をウェブ地図で公開しています。合併で消滅した市町村の名前は今でも地元ではよく使われているため、そうした地名がどの範囲を指すのかを把握することは、歴史研究のみならず災害対応などにも重要です。
またこれと関連して、れきちめ:日本歴史地名統合データベースの一部として、以下のデータセットを公開しています。
歴史地名マップ
人間・文化研究機構による歴史地名データを活用し、歴史地名を地図上に表示します。バイナリベクトルタイル技術により、多数の地点を表示しつつズームイン/アウトする機能を実現しました。現在の地名数は298,914件です。
ソフトウェア
GeoNLP
文章中に出現する地名を自動的に抽出して地図化するために、地理情報処理(GIS)と自然言語処理(NLP)とを統合したソフトウェアGeoNLPの開発も進めています。
GeoNLP - テキストを自動的に地図化する地名情報処理ソフトウェア
さらにGeoNLPのための歴史的地名辞書の開発も進めています。歴史地名辞書を充実させることにより、歴史文書を入力すると歴史地名を自動的に抽出し、地図化することも将来的には可能になるでしょう。GeoNLP地名辞書の中で、特に歴史的地名を重点的に集めているのは以下のデータセットです。
GeoLOD
GeoLODは地名に関する固有識別子(GeoLOD ID)を付与し、複数の情報源で共有することで、地名情報を統合処理するためのプラットフォームです。
ここには上記すべての歴史地名の情報も登録しており、地名情報を共有して相互運用可能とするための基盤として活用できます。
サービス
edomi
都市としての江戸/時代としての江戸に関する各種のデータを一望するために、江戸をみる/江戸をみせるデータを現代的に構造化し集約するデータポータルです。
武鑑全集
江戸時代の200年続いたベストセラーである『武鑑』を網羅的に解析し、江戸時代の大名家や幕府役人に関する人物・地理情報などの中核的情報プラットフォームを構築します。
地理情報として、「居城」「参勤交代」「上屋敷」「献上品/拝領品/時献上」のマップを掲載しています。
ディジタル・シルクロード
関連プロジェクトのディジタル・シルクロードでは、多くの歴史的地理空間データを公開しています。詳しくは以下をご覧下さい。