歴史ビッグデータ

歴史ビッグデータとは、人類が生み出した記録に基づき、過去から現在までの環境や社会の状況を、シームレスに分析するプロジェクトです。

歴史ビッグデータへの期待

歴史を探るための方法として、過去の記録を歴史学者が読み解き、複数の記録を突き合せることで、確からしい解釈を積み上げていく方法がこれまで用いられてきました。この方法が、今後も歴史学の基本的な方法であり続けることは変わりませんが、そこに「機械」を導入することで歴史研究がどのように変わるのか、それを探るのが「歴史ビッグデータ」の目標です。

例えば「ディジタル・シルクロード」プロジェクトでは、「デジタル史料批判(digitally-enabled critique)」という手法を提案しました。これは古地図や古写真などの空間画像史料の信頼性を評価する(史料批判する)には、人間が史料を見比べるだけでは十分でなく、機械の助けを借りて定量的に見比べる必要があることを示しました。このように複数の記録を突き合せるという基本的な作業であっても、「人間が頑張る」だけでは不十分な場合があるのです。

また歴史学と他分野の融合領域では、定量的な分析の重要性がより高まります。例えば古気候研究では、過去の日記や文書に記された記録を時空間的に集約し、統計的な計算やシミュレーションを用いて過去の気候を再現します。また古地震研究では同様の方法により、震源やマグニチュード、各地の震度や津波などを推定します。こうした歴史的な分析の重要性は、我々も東日本大震災の際に痛感したところです。

このような定量的な歴史記録は、人口や経済の研究としても重要であり、個別の分野において蓄積が進んでいます。また戸籍や行政文書、人事記録など、そのままでは定量的なデータとして使えないとしても、何らかの変換を行うことで定量的な性質を引き出せるデータもあります。こうしたデータを分野横断的に利用できれば、気候と人口の関係など、複合的な問題にも答えることができるでしょう。

これと同じことが、まさに現代のビッグデータに対して日常的に行われています。複数の情報源から得られた定量的/構造化データを統合して分析することで、人々の行動を分析したり未来を予測したりしようとする。この技術を過去に持ち込んで、分析対象を「タイムシフト」したらどうなるだろうか、というのが歴史ビッグデータの基本的なアイデアです。つまり、単に過去の大規模データを分析するというにとどまらず、現在と過去との連続性を意識しながら両者をシームレスに分析することに関心があります。

もちろん現代と過去ではデータの状態が全く異なりますので、現代向けのアルゴリズムがそのまま動作するわけではありません。構造のないデータをどのように構造化して信頼性を高めればよいのか、アルゴリズムのロバスト性をどのように高めればよいのか、「歴史ビッグデータ」の研究課題はたくさんあります。このような課題を解決しながら、歴史の新たな側面を明らかにすること、それが歴史ビッグデータプロジェクトの目標です。

第6回CODHセミナー 歴史ビッグデータ〜過去の記録の統合解析に向けた古文書データ化の挑戦〜

データサイエンスでここが変わる。02 データを発掘し、新たな歴史を記述する。

歴史ビッグデータの課題

歴史ビッグデータは新しい学問分野のため、基本的な概念を導入することで、学問分野の課題を明らかにする必要があります。

歴史ビッグデータの分類

1. 歴史的状況記録

状況記録とは、人間の感覚器を経由して記録したデータです。例えば天気は人間が空の状況を視覚的に判断して記録するものです。また地震の場合はもう少し複雑です。最初に地震の揺れを聴覚または触覚で感じ、次に視覚的に確認して記録します。少し時間が経過してから、地震の被害状況などを視覚的に確認して記録します。

2. 歴史的行動記録

行動記録とは、人間の何らかの行動による変化を記録したデータです。例えば人間がある場所から別の場所に移動した記録、店で何かを買ったり食べたりした記録、そして観光地に旅した記録などがこれに相当します。状況記録が世界に関する記述であるのに対し、行動記録が人間に関する記述である点が異なります。

3. 歴史的取引記録

取引記録とは、モノの移動や売買などを記録したデータです。例えば市場における価格、生産地から消費地への移動などがこれに含まれます。行動記録が人間に焦点を合わせるのに対し、取引記録はモノに焦点を合わせます。

歴史的な文書や書籍に含まれるこうした記録を、歴史的状況記録、歴史的行動記録、歴史的取引記録などと呼びます。いずれも時空間情報や筆者に関する情報などが付与されていれば、品質管理にとってより有用なデータということになります。

諸外国の動向

EUではTime Machine Flagshipという巨大プロジェクトが約200機関の参加を得て立ち上がりつつあり、イタリアのベニスやオランダのアムステルダムなど、都市の歴史のビッグデータを集めて時空間を自由に行き来する「タイムマシン」の構築が始まっています。これらのプロジェクトは、過去の行政資料や地図などをデジタル化し構造化することで、個人レベルのデータを積み上げて経済や人口の変化を長期間にわたって追跡し、そこから新しい歴史の姿を捉えることを目指しているという意味で、「歴史ビッグデータ」と共通する問題意識を感じます。

活動記録

歴史ビッグデータ研究会などを開催しています。

更新情報

2018-06-16

歴史ビッグデータのページを開設しました。

2018-03-12

第6回CODHセミナー 歴史ビッグデータ〜過去の記録の統合解析に向けた古文書データ化の挑戦〜を開催しました。