コンピュータサイエンス × 歴史学

計算が歴史学に突きつけるもの

ある歴史家が変化点検出アルゴリズムを走らせた。出力された折れ線には、鮮やかな切れ目が現れた。「近代の始まり」と呼んでいいのか、と彼は問うた。

問いかた自体がすでに危うい。

計算を「大量処理のできる便利な機械」だと思っているなら、まだ本質を見ていない。計算手法が歴史研究に持ち込む本当の変化は、速度ではない。研究者が暗黙に抱えてきた前提を、有無を言わせず露わにしてしまうことだ。

アルゴリズムは中立に見える。だが実際には「何を対象とみなし、どう表現し、どの規則で推論し、何を妥当とするか」という設計判断を丸ごとむき出しにする。手作業の蓄積が隠してきた方法論の選択が、コードという形で可視化される。「計算史学」とは、道具が一つ増えることではない。歴史学そのものの方法論をメタレベルで組み替える営みだ。

では、変化点検出で見つかった切れ目は何を意味するか。

それは統計的な屈曲であって、歴史世界の断絶ではない。サンプリングの偏り、アーカイブの保存状態、記述規則の変更、OCRの誤認識。これらの観測系の事情だけで、分布は容易に変形する。問題は検出精度の高さにあるのではなく、何をシグナルと呼び、何をノイズとして退けたかという設計判断にある。計算の真の意義は、統計的な切れ目を自動的に「近代の始まり」へ翻訳することではない。政治・経済・環境・メディアが同じ速度では進まない、歴史の非同期性を可視化することにある。

史料批判も同じ構造をしている。

外的批判・内的批判・アーカイブ批判とは、目の前のデータセットがどのような制度、権力、記録慣行、保存の偶然を経て成立したのかを問う作業だ。データ生成機構の逆解析、と言い換えてもいい。欠損値は空白ではない。しばしば構造の痕跡だ。何が保存されず、誰が記録に値しないと判断され、どの声が分類の外に置かれたか。そしてOCRの誤認識は、特定の筆跡や方言、周縁集団を反復的に「読めないもの」にしうる。技術的誤差が、歴史叙述の偏りへ直結する。

データベース設計もオントロジーも、同じ問いを免れない。何をノードとし、どの関係を許可するかが先に決まれば、可能な歴史叙述の範囲もそこで制約される。人物や国家は表現しやすいが、慣習や曖昧な共同性は記述しにくい。表現形式は器ではない。仮説空間の事前配分だ。

因果についても、慎重に区別する必要がある。予測できることと、説明したことは同じではない。イベント・ヒストリー分析や因果グラフ、エージェントベース・シミュレーションは、反事実的な補助線を与えて複雑な過程を整理するうえで有効だ。だがネットワーク中心性の高さをそのまま影響力と読むなら、指標と概念の水準を混同している。数値が計算されたとしても、それだけで意味は成立しない。

歴史学が扱うのは変化だけではなく、持続でもある。革命の後にも行政手続は生き残り、制度改革の後にも統治の癖は残る。可視化は断絶を好む。だが歴史の実相は、短期変動と長期持続の重なりにある。計算手法が有効なのは、異なる時間粒度を同じ場に置き、何が変わり何が居座るのかを比較可能にするときだ。

最後に、「計算史学」の妥当性はコード公開や再現可能性だけでは足りない。必要なのは監査可能性だ。データ選択、ラベル付与、分類変更、例外処理、可視化、解釈更新という意思決定の履歴を追跡できること。そして問題は方法論の内部にも閉じない。計算資源、言語資源、資金、標準化の主導権が特定の機関に集中すれば、何が「分析可能な歴史」かを決める権力もまた集中する。計算は解放の技術であると同時に、可視性を配分する政治でもある。

計算は歴史学を救済しない。

だが、歴史学が自らの前提を見直すための、歪みを含んだ鏡にはなりうる。その歪みまで含めて引き受けるところに、「計算史学」の本当の意義がある。