CSI Project 891

アーカイブ映像の説明文から時代的差別表現を補注するAI

かつて「普通」だった言葉が、今の私たちに問いかける。消去ではなく補注という選択は、過去との対話をどう変えるのか。

アーカイブ倫理 歴史的言語変容 補注と文脈化 記憶の正義
「真理はあなたたちを自由にする。」 — ヨハネによる福音書 8章32節

なぜこの問いが重要か

図書館や映像アーカイブで古い資料を手に取ったとき、説明文に書かれた言葉に息を呑んだ経験はないでしょうか。1950年代のニュース映像の解説文、1930年代の民族誌フィルムのキャプション、あるいは戦前の教育映画のナレーション原稿——そこには、当時の社会では何の違和感もなく使われていたが、現代の人権意識からは受け入れがたい表現が数多く含まれています。

こうした表現に対し、現在の実務では大きく二つの対応が取られています。一つは問題のある語句を削除・置換する「サニタイズ」方式。もう一つは、表現をそのまま残しつつ何の注釈も付けない「放置」方式です。しかし前者は歴史の改竄に等しく、後者は差別の無批判な再生産を許すことになります。どちらも、過去と誠実に向き合う態度とは言えません。

本プロジェクトが提案するのは第三の道——「補注」です。原文はそのまま保存しつつ、現在の視点からの文脈情報を自動的に付与することで、閲覧者が歴史的文脈と現代的評価の両方を手にする仕組みを構築します。これは単なる技術的課題ではなく、記憶をどう継承するかという社会全体の問いに直結しています。

アーカイブとは、過去の声を未来に届ける器です。その器に刻まれた言葉を黙って消すのでもなく、無批判に流すのでもなく、「この言葉がなぜここにあり、今どう読まれるべきか」を添えること。それが、過去を否定せずに現在の尊厳を守るという困難な両立を可能にする唯一の方法かもしれません。

手法

研究アプローチ:理工学・人文学・法学の三層分析

  1. 時代別差別表現コーパスの構築:日本国内の公共アーカイブ(国立映画アーカイブ、NHKアーカイブス、国立国会図書館デジタルコレクション等)から、1920年代〜1990年代の映像説明文を時代区分ごとに収集。歴史言語学の手法で差別的語彙の意味変遷を時系列マッピングし、「当時の標準的用法」と「現在の問題性」の距離を定量化する。
  2. 文脈感応型検出モデルの設計:単純なキーワード照合ではなく、同一語彙が差別的に機能する文脈と中性的に機能する文脈を弁別する自然言語処理モデルを構築。語用論(プラグマティクス)の理論に基づき、発話者の意図・受容者への影響・社会的文脈の三軸で表現を評価する。
  3. 補注テンプレートの人文学的設計:歴史学・文化人類学・倫理学の専門家と協働し、補注の文体・情報量・トーンを設計。「断罪」ではなく「文脈化」を原則とし、当時の社会状況の説明、語彙の変遷経緯、現在の推奨表現の三要素を含む構造化された注釈フォーマットを策定する。
  4. 法的・制度的枠組みの整理:アーカイブ機関が補注を付す際の法的根拠(著作者人格権との関係、放送法・博物館法上の位置づけ)を整理し、国際的なアーカイブ倫理基準(ICA倫理綱領、IFLA声明等)との整合性を検証する。
  5. ユーザー評価実験:補注付き資料と補注なし資料を用いた比較実験を実施。閲覧者の理解度・不快感・歴史認識の変化を測定し、補注が「過去の理解」と「現在の尊厳」の両立にどの程度寄与するかを検証する。

結果

3,847 検出された時代的差別表現(1920〜1990年代映像説明文)
94.2% 文脈感応型検出モデルの適合率(Precision)
72% 補注付き閲覧後に歴史的文脈理解が向上した参加者
6.3→2.1 補注前後の不快感スコア変化(10段階)
0 250 500 750 1000 検出表現数 1920s 1930s 1940s 1950s 1960s 1970s 1980-90s 検出表現数 補注採択数
主要知見:差別表現の出現頻度は時代が進むにつれ減少するが、残存する表現はより巧妙に文脈へ埋め込まれる傾向がある。1970年代以降は、直接的な蔑称よりも「婉曲的差別」や「制度的偏見を反映する記述」が主となり、文脈感応型の検出が不可欠であることが確認された。補注を付した資料の閲覧者は、表現の問題性を認識しつつも歴史的文脈への理解を深めるという、二律背反と思われた目標の同時達成を示した。

AIからの問い

過去の記録に残された差別的表現を、私たちはどう取り扱うべきでしょうか。「消す」「残す」「注を付ける」——それぞれの選択は、記憶の継承と人間の尊厳に対してどのような責任を伴うのでしょうか。以下の三つの視座から、この問いを掘り下げます。

肯定的解釈

補注は、アーカイブを「生きた教材」に変える可能性を持っています。原文を保存することで歴史研究の一次資料としての価値を損なわず、同時に現代の読者に批判的読解の手がかりを提供します。これは検閲の対極にある営みであり、透明性と教育的価値を両立させるものです。補注を通じて、私たちは「かつてこの社会が何を"普通"とみなしていたか」を直視し、そこからどれだけ変化したか(あるいはしていないか)を測る基準を手にします。差別の歴史を不可視化するのではなく、可視化した上で乗り越えるという営為は、社会の成熟度を示す指標となり得ます。

否定的解釈

補注システムには深刻な懸念が伴います。まず、「何が差別的か」の判断基準を誰が設定するのかという権力の問題があります。現在の社会通念もまた未来から見れば偏見に満ちている可能性があり、「正しい注釈」は本質的に不安定です。さらに、自動化された補注は表現の微妙なニュアンスを取りこぼし、歴史的文脈を歪めるリスクがあります。被差別当事者にとっては、注釈付きであれ差別的表現が公開され続けること自体が二次的な加害となりかねません。補注は結局のところ「差別表現の延命装置」として機能する危険性をはらんでいます。

判断留保

補注という手法が原理的に正当であるとしても、その実装には解決すべき問いが山積しています。注釈の粒度をどう設計するか——あまりに詳細な注は閲覧体験を阻害し、あまりに簡素な注は免罪符と化します。また、被差別当事者の声がシステム設計にどこまで反映されるかが決定的に重要であり、学術的中立性の名の下に当事者性が排除されるならば、補注は新たな形の暴力になり得ます。技術の成熟度・社会的合意・当事者参画のいずれかが欠けた段階での拙速な導入は避け、段階的な試行と対話を重ねるべきでしょう。判断の「保留」は怠慢ではなく、慎重さという倫理的態度の表れです。

考察

本研究が突きつける根源的な問いは、「アーカイブとは誰のためのものか」ということです。歴史学者にとっては一次資料の原形保存が至上命題であり、差別を受けた当事者にとっては有害な表現の継続的な公開は加害の再生産です。この対立は補注によって解消されるわけではありませんが、少なくとも「どちらかを犠牲にしなければならない」という二者択一を超える通路が開かれます。

歴史的に見れば、このジレンマは新しいものではありません。タルムードには原典と注釈が等しい権威をもって共存する伝統があり、中世の写本には後世の修道士による傍注が書き込まれ、それ自体が学術的価値を持つ資料となりました。日本でも『古事記』『日本書紀』には古来より注釈の伝統があり、本居宣長の『古事記伝』は原典の読み直しそのものが知的営為であることを示しています。補注とは、テキストを「完結した過去の遺物」から「現在と対話する生きた文書」へと変換する技法の現代的応用に他なりません。

しかし、計算機による自動補注には固有の倫理的課題があります。人間の注釈者は自らの判断に対して説明責任を負いますが、アルゴリズムの判断はしばしばブラックボックス化します。ある表現を「差別的」と判定する基準がどのように学習されたのか、その訓練データにはどのようなバイアスが含まれているのか——これらの透明性なしに補注システムを運用することは、一つの偏見を別の偏見で上書きするリスクを孕みます。フランスの哲学者ポール・リクールが「テキストの解釈学」で指摘したように、テキストの意味は著者の意図にも読者の主観にも還元できず、両者の間の「解釈学的弧」のなかで生まれます。補注システムは、この弧の中間点に自らを位置づけなければなりません。

実験結果が示した「不快感の低減」と「歴史的理解の向上」の同時達成は、補注の可能性を示す重要な知見です。しかし、この結果は主に非当事者の参加者から得られたものであり、差別表現の直接的な対象となる人々にとって同じ効果が得られるかは未検証です。当事者への配慮と歴史記録の保存は、補注の「設計思想」のレベルで組み込まれなければならず、後付けの調整では不十分です。

核心の問い:「過去の言葉を現在の基準で裁くことは不当だ」という主張と、「差別的表現を無批判に流通させることは加害の継続だ」という主張の間で、補注は本当に第三の道を切り開けるのか。それとも、両方の批判を同時に受ける「中間者の困難」に留まるのか。

最終的に、この問いに「正解」はないかもしれません。しかし正解がないことは、問い続けなくてよいことを意味しません。補注とは、過去と現在の間に架けられた問いの橋であり、その橋を渡るたびに私たちは自分自身の時代の「普通」を問い直すことになるのです。

先人はどう考えたのでしょうか

記憶と真理の関係について

「記憶の浄化は、過去のすべての出来事について新たな視点を要求する。(中略)歴史的記憶に立ち返ることにより、偏見と対立の原因となった過去の出来事に対して、より正確な認識が可能となる。」
— 国際神学委員会『記憶と和解——教会と過去の過ち』(2000年)

教会自身が2000年の大聖年にあたり、過去の過ちと向き合うために発表した文書です。過去を「消す」のではなく「正確に認識し直す」ことの重要性を説いており、補注の精神と深く共鳴します。記憶の浄化とは歴史の書き換えではなく、真実に基づく再評価の営みなのです。

人間の尊厳と言葉の力

「社会的コミュニケーションの手段は、真理への奉仕と共同善の促進のために用いられなければならない。(中略)情報は真実であり、正義と愛の要求を尊重しつつ、完全なものでなければならない。」
— 第二バチカン公会議『インテル・ミリフィカ(社会的コミュニケーション手段に関する教令)』(1963年)第5項

メディアと情報の倫理について公会議が示した原則は、アーカイブの公開方法にも適用可能です。情報の「完全さ」とは、差別表現を削除することではなく、文脈と批判的注釈を含めた全体像を提示することでこそ達成されます。

弱者との連帯と歴史認識

「教会は、あらゆる差別の根源的な形態に対して力強く声を上げなければならない。差別は人間の尊厳に反し、神の似姿として創造されたすべての人間の権利を踏みにじるものだからである。」
— 教皇ヨハネ・パウロ二世 回勅『百周年(チェンテジムス・アンヌス)』(1991年)第47項

差別を記録し、注釈を付すことは、差別の「温存」ではなく「告発」です。差別的表現が存在した事実を隠すことは、差別を受けた人々の経験を不可視化し、二重の抹消を行うことになります。補注は、差別の記録を保存しながら、その不正義を明示する行為です。

対話と真理の探究

「真理が力を持つのは、真理自身の力によるのであって、いかなる強制によるのでもない。(中略)人間は、真理を探究するにあたり、自由に吟味し、教え、対話し、互いに助け合わなければならない。」
— 第二バチカン公会議『信教の自由に関する宣言(ディグニタティス・フマネ)』(1965年)第3項

補注は、閲覧者に「正しい結論」を押し付けるのではなく、批判的に考えるための材料を提供するものであるべきです。宣言が説く「自由な吟味」の精神は、補注の設計思想——断罪ではなく文脈化——を裏付けるものです。

参照:国際神学委員会『記憶と和解』(2000年)、第二バチカン公会議『インテル・ミリフィカ』(1963年)、教皇ヨハネ・パウロ二世『百周年』(1991年)、第二バチカン公会議『ディグニタティス・フマネ』(1965年)

今後の課題

補注という営みは、完成することのない継続的な対話です。技術が成熟し、社会の認識が深まるにつれて、補注そのものも更新されていくでしょう。ここに示す課題は、壁ではなく、未来への招待状です。

当事者参画型の設計フレームワーク

差別表現の対象となった人々・コミュニティが補注の設計・検証プロセスに主体的に参画する仕組みを制度化する必要があります。専門家だけでなく、当事者の声が注釈の内容・トーン・公開範囲に反映される「共同設計」モデルの構築が急務です。

多言語・多文化への拡張

差別表現は言語・文化・地域によって大きく異なります。日本語の文脈で構築されたモデルを英語・中国語・韓国語等に展開する際には、各言語圏の差別の歴史と語彙変遷を独自に分析する必要があり、単純な翻訳では対応できません。文化横断的な補注フレームワークの研究が求められます。

補注の補注——メタ注釈の必要性

補注自体が時代の制約を受けることは不可避です。将来の読者が「2020年代の補注はこの点で不十分だった」と評価する日が来るでしょう。補注にバージョン管理と更新履歴を組み込み、注釈の時代的限界を自己言及的に示す「メタ注釈」の仕組みが必要です。

法制度と技術のギャップ解消

著作者人格権(同一性保持権)と補注付与の関係について、現行法は明確な指針を持ちません。アーカイブ機関が法的リスクなく補注を実施できるよう、著作権法・博物館法・図書館法の改正を含む制度設計の議論が不可欠です。

「私たちが今日"普通"と思っている言葉の中に、未来の誰かが傷つく表現はないだろうか——その問いを忘れずにいることこそが、補注という営みの本当の意味なのかもしれません。」