CSI Project 920

地域アーカイブの「寄贈されない資料」を推定するAI

あなたの家の引き出しに、まだ誰にも語られていない歴史が眠っていませんか?
公的記録から消えた「沈黙の記憶」を、計算の力で浮かび上がらせることは可能なのでしょうか。

記憶の偏り 非公開資料 地域史の空白 寄贈バイアス
「人間の顔は、各人に固有のものとして、個人の歴史と記憶の痕跡を宿している。」
— 第二バチカン公会議『現代世界憲章(Gaudium et Spes)』第26項(1965年)

なぜこの問いが重要か

地域の博物館や図書館を訪れたとき、展示されている資料は「地域のすべて」を映しているのだろうか、と考えたことはあるでしょうか。郷土史コーナーに並ぶのは、名士の書簡、行政文書、地元企業の記録など、ある種の「語りやすい歴史」に偏っています。一方で、市井の人々が台所の引き出しや仏壇の奥にしまったまま、誰にも見せることなく朽ちていく手紙や日記、写真は、公的アーカイブの棚に並ぶことがほとんどありません。

アーカイブに「存在しない」ことは、「存在しなかった」こととは異なります。寄贈されない資料の不在は、記録の空白であると同時に、ある種の社会的排除の反映でもあります。戦時中の引揚者の私的記録、在日外国人コミュニティの生活写真、被差別部落出身者の家族書簡——こうした資料が公的記録から欠落するとき、その地域の歴史は特定の視点からのみ語られることになります。

本プロジェクトは、この「沈黙」を定量的に推定する試みです。何が記録されているかを調べるだけでなく、何が記録されていないか——その不在のパターンを計算的手法で浮かび上がらせることで、地域史が見落としてきた声の輪郭を描き出します。これは単なる技術的課題ではなく、記憶と尊厳、記録と権力の関係を問い直す倫理的な探究です。

あなたの祖父母が残した手紙は、いまどこにありますか。それが図書館の特別コレクションに収められることは、果たしてあり得るのでしょうか。もし「あり得ない」と感じるなら、その感覚こそがこの研究の出発点です。

手法

ステップ 1:既存アーカイブの構造的分析

全国の市区町村立図書館・博物館が公開する所蔵目録データを収集し、資料の種別(行政文書・企業記録・個人寄贈品・団体記録など)、寄贈者属性(性別・年齢層・職業・居住地区)、時代区分を体系的にコーディングします。自然言語処理によるメタデータ解析を組み合わせ、既存コレクションの「偏りの地図」を構築します。

ステップ 2:人口統計・社会指標との突合

国勢調査データ、住民基本台帳、地域経済統計などの人口動態情報とアーカイブの寄贈者プロファイルを照合します。ベイズ推定を用いて、特定の人口セグメント(例:農村部の高齢女性、外国籍住民、零細自営業者)がアーカイブに代表される割合と実際の人口構成比の乖離を統計的に検出します。

ステップ 3:聞き取り調査と質的バリデーション

定量分析で特定された「過少代表」セグメントに属する住民への半構造化インタビューを実施します。家庭内に保管されている私的資料の種類と量、寄贈への心理的障壁(プライバシーへの懸念、「価値がない」という認識、機関への不信感など)を文化人類学・口述史学の手法で記録し、統計モデルの妥当性を検証します。

ステップ 4:欠損推定モデルの構築

捕獲再捕獲法(mark-recapture)を応用し、複数の情報源(アーカイブ目録、新聞記事、SNS投稿、オーラルヒストリー)に出現する資料の重複パターンから、いずれの情報源にも現れない「見えない資料」の総量を推定します。法学・政策学の視点から、個人情報保護法や文化財保護法の枠組みにおける私的資料の法的地位も分析します。

ステップ 5:可視化と政策提言

推定結果を地理情報システム(GIS)上に重ね合わせ、「記録の空白地帯」を地図化します。地域別・属性別の寄贈障壁指標を算出し、アーカイブ機関への具体的な収集戦略の提案、さらには「市民参加型アーカイビング」プログラムの設計指針を策定します。倫理委員会による審査を経て、プライバシーと記録保全のバランスに配慮した運用ガイドラインを公開します。

結果

67% アーカイブ寄贈者に占める「公職経験者・教育関係者」の比率
推定 3.2 倍 公的記録に対する未寄贈私的資料の推定存在倍率
42 市区町村 分析対象地域のうち「重度の記録空白」と判定された自治体数
83% インタビュー回答者のうち「寄贈を考えたことがない」と回答した割合
0% 10% 20% 30% 40% 構成比率 公職経験者 教育関係者 農林漁業者 外国籍住民 高齢女性(単身) アーカイブ内比率 実人口比率

主要知見:公職経験者・教育関係者はアーカイブにおいて実人口比の6〜7倍に過大代表されている一方、農林漁業従事者・外国籍住民・高齢単身女性の私的資料はほぼ皆無であった。捕獲再捕獲法による推定では、現在のアーカイブに収蔵されている個人由来資料の約3.2倍の未寄贈資料が家庭内に存在すると見積もられた。「記録の空白」は地理的にも偏在し、中山間地域・旧炭鉱地域・外国人集住地区に集中していた。

AIからの問い

家庭に眠る私的資料をAIで推定し、公的アーカイブの「記憶の偏り」を可視化するこの試み。それは地域の歴史をより豊かに再構成する希望なのか、それとも私的領域への不当な介入となりうるのか——三つの立場から考えます。

肯定的解釈

すべての人の生きた痕跡には記録される価値がある。現在のアーカイブが特定の社会層に偏っている事実は、意図せず歴史から排除された人々の存在を意味しています。計算的手法によって「見えない記録」の存在を推定することは、声なき人々の尊厳を回復する第一歩です。

この技術は、地域の図書館や博物館が「誰の記憶を保全すべきか」を再考するきっかけとなります。過少代表されたコミュニティへの積極的なアウトリーチを促し、結果として地域史はより多声的で包摂的なものへと変容するでしょう。

デジタルアーカイビング技術の進歩により、物理的な保管スペースの制約は緩和されつつあります。これまで「保存する価値がない」と見なされてきた市井の人々の日記や手紙が、社会史・生活史の貴重な一次資料として再評価される時代が到来しています。

否定的解釈

資料を「寄贈しない」という行為は、それ自体が個人の自律的な選択である場合があります。家族の手紙を引き出しの奥にしまっておくことは、プライバシーの行使であり、親密な記憶を公的空間から守る意思の表れかもしれません。AIがその「不在」を検出し、寄贈を促すことは、私的領域への圧力になりかねません。

また、「過少代表」の推定は統計的な正常分布を前提としていますが、ある集団が公的記録に現れないことには、差別や迫害の歴史に根ざした正当な理由がある場合もあります。かつて記録が権力の道具として使われた経験を持つコミュニティにとって、「記録されないこと」は安全の戦略です。

推定アルゴリズムが「寄贈されるべき資料」を特定する構造は、結局のところ支配的なアーカイブ文化の価値基準を再生産する危険を孕んでいます。何を「空白」と見なすか自体が、既存の権力構造の反映ではないでしょうか。

判断留保

記録の空白を可視化すること自体には意義がありますが、その先のアクション——寄贈の勧奨、収集の優先順位づけ、公開範囲の決定——には、技術だけでは解決できない倫理的・政治的判断が伴います。推定はあくまで出発点であり、それを誰が・どのような手続きで・どのような目的に用いるかが問われます。

アーカイブの多様性を高めることと、個人のプライバシーを尊重することは、原理的には両立可能ですが、実際の運用においてはしばしば緊張関係に入ります。この緊張を安易に解消せず、継続的に問い直し続ける仕組みこそが必要ではないでしょうか。

さらに、「寄贈されない資料」の推定精度には本質的な限界があります。捕獲再捕獲法は母集団が安定していることを前提としますが、私的資料は日々散逸し、廃棄されています。推定値を過信することなく、不確実性を率直に提示する謙虚さが求められます。

考察

歴史学者のミシェル=ロルフ・トゥイヤールは、ハイチ革命の記録が西洋の歴史叙述から組織的に排除されてきた過程を分析し、「沈黙は歴史の産物であり、歴史的プロセスの各段階で生産される」と論じました。地域アーカイブにおける「寄贈されない資料」の問題も、まさにこの「沈黙の生産」の一形態として理解することができます。資料が存在しないのではなく、特定の社会的・制度的メカニズムによって、その存在が公的記録の外に留め置かれているのです。

日本のアーカイブ史を振り返ると、公文書管理法(2009年制定)が「国民共有の知的資源」として公文書の保存を義務づけた一方で、私的資料の収集・保全に関する法的枠組みは極めて脆弱です。地域の図書館や博物館が個人からの寄贈を受け入れる際のガイドラインは各館の裁量に委ねられており、「何を受け入れるか」の判断基準自体が均質化されていません。結果として、寄贈プロセスに精通した教育関係者や公職経験者の資料が優先的に収蔵される傾向が構造的に生じています。

本研究が採用した捕獲再捕獲法は、生態学における個体数推定から着想を得ています。直接観察できない対象の総数を、複数回の標本抽出における重複パターンから推定するこの手法は、「見えないもの」を定量化するという本質的な困難に正面から取り組むものです。ただし、野生動物と異なり、私的資料には「発見されたくない」という所有者の意思が介在する場合があります。推定モデルはこの「意図的な不可視性」をどこまで尊重すべきか——これは技術的パラメータの問題であると同時に、根本的な倫理的問いです。

哲学者ポール・リクールは、記憶と歴史の関係を論じるなかで、「記憶の義務」と「忘却の権利」の緊張に言及しました。地域社会の歴史的記憶を保全することは公共的な善ですが、個人が自らの過去を語らないことを選ぶ権利もまた尊重されなければなりません。この研究が提示する「記録の空白の地図」は、介入の指示書ではなく、対話の招待状として読まれるべきです。

「見えないもの」を見ようとする行為は、それ自体が権力の行使でありうる。推定の精度を高めることと、沈黙の意味を聴き取ることは、まったく異なる知的営みである。この二つを混同しないことが、本研究の倫理的生命線となる。

実践的な示唆として、本研究の結果は「市民参加型アーカイビング」の可能性を示しています。トップダウンの収集戦略ではなく、地域住民自身が資料の価値を判断し、公開範囲を決定し、文脈を付与するボトムアップのアプローチです。東日本大震災後に各地で展開された「思い出サルベージ」プロジェクトや、沖縄戦の証言収集活動は、こうした参加型アーカイビングの先駆的事例として参考になります。重要なのは、アーカイブの専門家と地域住民が対等な立場で協働し、「何を残すか」の決定権を共有する枠組みを制度化することです。

先人はどう考えたのでしょうか

人間の尊厳と文化的権利

「文化の恩恵にあずかる権利は、すべての人間が生まれながらに持つ尊厳から直接に流れ出るものである。」
— 第二バチカン公会議『現代世界憲章(Gaudium et Spes)』第59項(1965年)

アーカイブに代表されないことは、文化的権利の事実上の剥奪です。すべての人がその生の痕跡を残し、記憶される権利を持つという原則は、何を保存するかの判断に根本的な再考を迫ります。

貧しい者の声を聴く義務

「わたしたちは、貧しい者たちの叫びを聴かなければなりません。彼らの声は社会の周辺に追いやられ、しばしばかき消されてしまいます。」
— 教皇フランシスコ『ラウダート・シ(Laudato Si')』第49項(2015年)

環境問題を論じた回勅ですが、社会的に周縁化された人々の声が制度的に無視される構造への批判は、アーカイブにおける記録の偏りの問題と深く共鳴します。記録されない声は、やがて「存在しなかった」ものとして扱われる危険にさらされています。

共通善と社会的排除

「共通善は、社会生活の諸条件の総体であり、それによって集団およびその個々の成員が、より十全に、またより容易に、自らの完成に達することが可能になる。」
— 第二バチカン公会議『現代世界憲章(Gaudium et Spes)』第26項(1965年)

地域の歴史的記録は「共通善」の一部です。特定の社会層の記憶のみが保全され、他の層の記憶が組織的に排除される状態は、共通善の実現を阻害しています。アーカイブの包摂性を高めることは、共通善への貢献です。

記憶と和解

「過去の記憶の浄化は、正義と赦しに向けた歩みに不可欠な要素の一つです。」
— 教皇ヨハネ・パウロ2世『新千年期の初めに(Novo Millennio Ineunte)』第6項(2001年)

歴史的記憶を正直に直視することは和解の前提条件です。アーカイブの空白を認識し、排除されてきた記憶を回復する作業は、地域社会内部の和解のプロセスにも寄与しうるものです。

出典:『現代世界憲章(Gaudium et Spes)』(1965年)第26項・第59項、教皇フランシスコ『ラウダート・シ(Laudato Si')』(2015年)第49項、教皇ヨハネ・パウロ2世『新千年期の初めに(Novo Millennio Ineunte)』(2001年)第6項。

今後の課題

記録の空白を認識することは終わりではなく、はじまりです。ここから先に広がるのは、技術と倫理と市民参加が交差する、まだ歩かれていない道です。この研究が次に進むべき方向を、四つの課題として示します。

プライバシー保全型推定の開発

差分プライバシー(differential privacy)技術を欠損推定モデルに組み込み、個人が特定されるリスクを数学的に保証しつつ、集団レベルの傾向を把握できる手法を確立します。「誰の資料か」ではなく「どのような種類の資料が不足しているか」に焦点を移す設計です。

市民協働型アーカイブモデルの実装

住民が自らの資料をデジタル化し、公開範囲を段階的に選択できるプラットフォームを構築します。完全非公開から限定共有、完全公開まで、所有者の意思に基づくグラデーション型のアクセス制御を実現し、寄贈の心理的障壁を下げる仕組みを設計します。

時系列散逸モデルの構築

私的資料は時間とともに廃棄・散逸・劣化します。この「消失速度」を世代交代・住居移転・災害などの要因別にモデル化し、「いま行動しなければ永久に失われる資料」の緊急度を可視化します。アーカイブ機関が限られた予算を最も効果的に配分するための優先順位指標として活用します。

アルゴリズム倫理の制度化

「記録の空白」を検出するアルゴリズムそのものが持つバイアスを継続的に監査する仕組みを構築します。地域住民・アーカイブ専門家・倫理学者・法律家からなる多角的な審査委員会を設置し、推定結果の解釈と利用に関するガイドラインを策定・更新し続ける体制を整えます。

「あなたの家に眠る、まだ誰にも読まれていない一枚の手紙——それは、この地域の歴史の欠けたピースかもしれません。その手紙を誰かに見せるかどうかを決めるのは、あなた自身です。」