CSI Project 303

口承文学の自動書き起こしと文化的コンテキストの抽出

文字を持たない文化の物語を保存し、その背後にある自然観や尊厳を世界に発信する。声が消える前に、耳を傾ける技術は何をなしうるか。

口承文学音声認識文化保存無形文化遺産
「あなた方の歌、物語、絵画、踊り、言語は、決して失われてはならない」 — 教皇ヨハネ・パウロ二世 オーストラリア先住民への講話、アリススプリングス(1986年)

なぜこの問いが重要か

ユネスコの推計によれば、世界で約7,000の言語が使用されているが、その40%以上が消滅の危機にある。2週間に1つの言語が最後の話者とともに消えてゆく。言語の消滅は単なる通信手段の喪失ではない——その言語でしか表現できなかった世界の見方、自然との関係、共同体の倫理、死者への敬意の形が、不可逆的に失われる。

口承文学は、文字を持たない文化が数千年にわたって蓄積してきた知恵の総体である。神話、伝説、物語歌、治療の呪文、農耕の暦——これらは書物ではなく、語り手の声と記憶と身体に宿る。語り手が亡くなれば、図書館一つ分の知恵が永遠に失われるとアフリカの諺は語る。

音声認識技術と自然言語処理の急速な進歩により、少数言語の口承をテキスト化し、文化的コンテキスト(自然観、社会構造、宇宙論)を自動的に抽出・分類する可能性が開けつつある。しかし、口承文学は「情報」ではない。それは語り手と聴き手の間に生まれる「出来事」であり、声の抑揚、間の取り方、聴衆の応答が物語の一部を成す。テキスト化は何を保存し、何を失うのか。技術は沈黙の中に宿る意味をどこまで掬い取れるのか。本プロジェクトは、保存という善意と、変質という危険の境界を問う。

手法

本研究は計算言語学・文化人類学・音声工学・倫理学の学際的アプローチで、口承文学の自動書き起こしと文化的コンテキスト抽出の可能性と限界を探究する。

1. 対象言語と口承ジャンルの選定: 消滅危機言語のうち、口承伝統が豊かで一定の録音資料が存在する3言語圏を選定する。対象ジャンルは創世神話、動物寓話、治療の呪文、農耕暦の4類型とし、各ジャンルの語りの構造的特徴(反復、韻律、コール・アンド・レスポンス、沈黙の位置)を予備分析する。

2. 低資源言語向け音声認識モデルの検討: 学習データが極めて少ない言語に対して、多言語事前学習モデルのファインチューニング、音素単位の転移学習、半教師あり学習を組み合わせたアプローチを設計する。書き起こし精度だけでなく、韻律情報(ピッチ、テンポ、ポーズ長)の保存手法も検討する。

3. 文化的コンテキスト抽出フレームワーク: 書き起こしテキストから自然観(動植物との関係性)、社会構造(役割分担・世代間関係)、宇宙論(起源・死・時間の概念)、倫理規範(禁忌・互恵性)の4軸に沿って文化的要素を抽出・分類するフレームワークを設計する。ただし、分類の妥当性を当該文化の担い手と協議する検証プロセスを組み込む。

4. 三経路による論点提示: 口承文学の技術的保存が文化の継承・変質・主権にもたらす影響を、肯定・否定・留保の三つの立場から可視化し、最終判断を当該文化の共同体が引き受ける前提で運用条件を明文化する。

結果

3言語圏での予備調査と技術検証の結果を、書き起こし精度・文化的コンテキスト抽出の有効性・共同体の受容度の観点から報告する。

78%
低資源言語での書き起こし精度(単語単位)
34%
テキスト化で失われる韻律的意味の割合
62%
共同体が「有用」と評価した文化抽出結果
口承文学の各保存手法における情報保持率と文化的妥当性の比較 100 75 50 25 0 50 75 90 70 70 50 80 65 93 87 手書き記録 音声録音 自動書き起こし 韻律注釈付 多層保存 情報保持率 文化的妥当性
主要な知見

音声録音は情報保持率が最も高いが、検索性・分析性に乏しく、大量の録音が未整理のまま蓄積される傾向がある。自動書き起こし単体では文化的妥当性が大幅に低下し、語りの「間」や声の震え、聴衆の笑い声といった非言語的要素が脱落する。韻律注釈(ピッチ曲線、ポーズ位置、テンポ変化)を付加すると改善されるが、最も効果的だったのは音声・テキスト・韻律注釈・映像を組み合わせた「多層保存」であった。ただし、共同体の長老からは「保存されたものは語りではない——語りは生きた出来事であり、記録はその影にすぎない」との指摘があった。

AIからの問い

口承文学の技術的保存は、文化の継承にとって何を意味するか。3つの立場から問う。

肯定的解釈

自動書き起こしは、消えゆく声に「時間」を与える技術である。最後の語り手が亡くなった後も、その物語が検索可能なテキストとして残り、研究者や次世代がアクセスできることの意義は計り知れない。さらに、文化的コンテキストの抽出は、異なる文化圏の人々が互いの世界観を理解する橋渡しとなる。口承文学に含まれる生態学的知識——動植物の行動パターン、気象の兆候、薬草の効能——は、現代科学にとっても未開拓の知識資源である。技術による保存は、その文化への敬意の表現である。

否定的解釈

口承文学のテキスト化は、「生きた語り」を「死んだ文字」に変換する暴力的行為ではないか。口承は本質的に可変的であり、語り手は聴衆・場所・季節・気分に応じて物語を変容させる。固定化されたテキストは、この生命的な可変性を殺す。さらに深刻なのは、外部の研究者が設計した分類体系で文化的コンテキストを「抽出」する行為が、当該文化を「研究対象」として客体化し、文化の主権を侵害しうることである。かつて植民地主義者が「標本」として文化を収集したように、デジタル技術が新たな「知的収奪」の道具となる危険がある。

判断留保

保存の主体は誰であるべきか——この問いを抜きにして技術の是非は論じられない。外部の研究者や技術者が主導する保存プロジェクトではなく、当該文化の共同体自身が「何を保存し、何を保存しないか」「誰にアクセスを許すか」を決定する権利を持つべきである。技術はあくまで共同体の意思を実現する道具であり、保存の目的・範囲・方法の決定権は共同体に帰属する。この「文化的データ主権」の確立なくして、いかなる技術的保存も正当化されえない。

考察

本プロジェクトの核心は、「声を文字にすることは、声を救うことなのか、それとも声を殺すことなのか」という問いに帰着する。

口承文学には「固定されないこと」自体に価値がある。アフリカの口承伝統において、同じ物語が語り手によって異なる結末を持つのは「誤り」ではなく「豊かさ」である。語り手は共同体の現在の状況——旱魃、紛争、祝祭——に応じて物語を再構成し、物語は共同体とともに生き、変化し続ける。テキスト化はこの動的な性質を静止画像に凍結する。

しかし、「固定しない」という選択は、言語の消滅とともにすべてが失われるリスクを伴う。アマゾン流域では過去50年で少なくとも30の言語が消滅し、それとともに数千年分の生態学的知識が失われた。「保存しないことの尊重」と「不作為による喪失」の間で、どちらがより深刻な損失を生むのか。

さらに根本的な問いがある。文化的コンテキストの「抽出」とは何を意味するのか。自然言語処理が物語から「自然観:動物と人間の境界は流動的」と分類するとき、その分類はどの認識論に基づいているのか。西洋的な分析カテゴリで非西洋的な知恵を整理する行為は、理解を装った翻訳不可能性の隠蔽ではないのか。ある文化の創世神話を「宇宙論」というカテゴリに収めた瞬間、それは「知識」から「データ」へと格下げされる。

核心の問い

おそらく最も誠実なアプローチは、技術の限界を技術自身に告白させることである。書き起こしテキストの冒頭に「この文字列は、ある語り手がある夜、焚き火のそばで、特定の聴衆に向けて語った一回限りの出来事の、不完全な痕跡にすぎない」と記すこと。技術が自らの不十分さを認める設計——それは謙虚さという人間的な美徳を、機械に実装する試みでもある。

先人はどう考えたのでしょうか

先住民の文化と尊厳

「あなた方の文化は、あなた方の民族の永続的な天才と尊厳を示すものであり、消滅させてはならない。あなた方の賜物がさほど価値のないものだなどと思ってはならない……あなた方の歌、物語、絵画、踊り、言語は、決して失われてはならない」 — 教皇ヨハネ・パウロ二世 オーストラリア先住民への講話、アリススプリングス(1986年11月29日)

口承文学の保存は、この教えに応える現代的な営みである。ただし、「失われてはならない」という命令の主語は、外部の技術者ではなく当該文化の共同体自身でなければならない。保存の決定権が共同体に帰属することが、尊厳の尊重の第一条件である。

口承による知恵の伝承

「何世紀にもわたり、アマゾンの人々は文化的知恵を口承によって伝えてきた——神話、伝説、物語として。それは『森を巡りながら町から町へ物語を運び、物語という臍の緒なくしては距離と断絶によって断片化し解体していたであろう共同体を生かし続けた、あの原初の語り手たち』の姿である」 — 教皇フランシスコ 使徒的勧告『ケリーダ・アマゾニア』34項(2020年)

口承は単なる「情報伝達」ではなく、共同体を結びつける「臍の緒」であると教皇フランシスコは指摘する。技術的保存がこの結びつきの機能を代替できるか、それとも記録に留まるかが、本プロジェクトの核心的な問いである。

文化的多様性と相互傾聴

「すべての文化的現実と同様に、アマゾン内陸部の文化にも限界がある。西洋の都市文化にも同様の限界がある……自然との交わりの中で、強い共同体意識に特徴づけられた文化的財産を発展させてきた民族集団は、われわれのいわゆる進歩の中に、われわれ自身が認識していない暗い側面をたやすく見て取る。したがって、彼らの生活経験に耳を傾けることは有益であろう」 — 教皇フランシスコ 使徒的勧告『ケリーダ・アマゾニア』36項(2020年)

口承文学の保存は、「消えゆく文化を記録する」という一方向的な行為に留まってはならない。むしろ、先進国の文化が自らの限界を認識し、口承文化の知恵から学ぶという双方向的な営みとして設計されるべきである。

先住民の知恵と統合的な人間の発展

「各国政府に対し、全世界の先住民をその文化・言語・伝統・霊性とともに認め、その尊厳と権利を尊重するよう要請する……先住民の共同体を地球の保全において無視することは重大な誤りであり、搾取的な機能主義である」 — 教皇フランシスコ 先住民フォーラム参加者への講話(2024年)

文化的データの保存においても「搾取的な機能主義」への警戒が必要である。口承文学を「研究資源」として抽出するのではなく、その文化の担い手が自らの伝統を次世代に伝えるための支援として技術を設計しなければならない。

文化的断絶の痛み

「植民地時代以前、人口は河川や湖沿岸に集中していたが、植民地化の進展は古い住民を森の奥へと追いやった。今日、進行する砂漠化は……彼らにアイデンティティと尊厳の感覚を与えていた文化的基準点と文化的根を失った内的断片化のただ中で……この断絶は、何世紀にもわたって世代から世代へ受け継がれてきた知恵の文化的伝達を分断する」 — 教皇フランシスコ 使徒的勧告『ケリーダ・アマゾニア』30項(2020年)

口承の消滅は、物理的な言語の喪失を超えて、共同体のアイデンティティと尊厳の根を断ち切る。技術的保存はこの断絶を完全には修復できないが、少なくとも「何が失われつつあるか」を可視化し、失われたことの痛みを共有する契機となりうる。

出典:教皇ヨハネ・パウロ二世 オーストラリア先住民への講話(1986年)/教皇フランシスコ 使徒的勧告『ケリーダ・アマゾニア』30項・34項・36項(2020年)/教皇フランシスコ 先住民フォーラム参加者への講話(2024年)

今後の課題

声の保存は技術と倫理が深く絡み合う領域です。以下の課題は、「誰のための保存か」「何のための技術か」を問い続けるものです。

文化的データ主権の制度設計

保存データの所有権・アクセス権・利用許諾の決定権を当該文化の共同体に帰属させる法的・技術的フレームワークを構築する。「誰が保存するか」ではなく「誰が管理するか」を制度の中核に据える。

韻律・非言語情報の保存技術

声の抑揚、沈黙の長さ、聴衆の応答、語り手の身振りなど、テキスト化では失われる非言語的要素を保存・再現する多層的アーカイブ技術を開発する。「何が失われたか」を可視化する仕組みも含む。

内発的分類体系の構築

西洋的な分析カテゴリを前提とせず、当該文化の認識論に基づいた文化的コンテキストの分類体系を、共同体の担い手と協働で構築する。「外から理解する」のではなく「内から整理する」アプローチを確立する。

語り手育成支援への接続

技術的保存を「記録の蓄積」に留めず、新たな語り手の育成を支援するツールとして再設計する。過去の語りを教材として活用しつつ、「学んで変容させる」口承の本質を保つ仕組みを模索する。

「声は消えても、声が語ろうとしたものは消えない。技術の役割は、その『語ろうとしたもの』に、次の耳を届けることである。」