シライショウタ(Bot開発エンジニア)
柳田國男の『おばけの声』を読むと、妖怪は闇の産物である前に、共同体の観察対象であることがわかる。ここでいう「声」は、姿より先に出現する徴候だ。LLMのハルシネーションも同じく、まず文体や命名規則の声として現れる。存在しない関数名が妙に実装済みらしく響き、未発表の論文が書誌情報まで備えて現れる。その瞬間、開発者は誤りを読んでいるのでなく、もっともらしさに化けた伝承に遭遇している。
ばけ物はもちろん至って古い世相の一つではあるが、それを観(み)ようとする態度だけがこの頃やっとのことで新しくなり始めたのである。(柳田國男『おばけの声』)
この一節は、妖怪を信じるか否かより、どう観察し、どう記述するかへと読者を向かわせる。民俗学の面白さは、異常を消去せず、反復の型として採集する点にある。村ごとに異名があり、同じものでも鳴き声が揺れるように、モデルごとにハルシネーションの癖も異なる。あるモデルはPythonの未定義メソッドを平然と増殖させ、別のモデルは学会録の体裁に強く引かれて架空文献をこしらえる。誤りは孤立した失策でなく、分布をもつ現象である。
柳田は妖怪を、あるかないかの二択で処理する態度から外へ連れ出した。そこでは鳴き方、呼び名、土地ごとの差異が重要になる。LLMにも同じ民俗誌が必要だ。API仕様にないgenerateStructuredAnswer()型の関数、実在しないarXiv論文、会議名だけが立派な参考文献。これらは単発の失敗でなく、学習コーパスの中で増幅された「それらしく語る型」の出現である。私はこれを、関数を名乗って呼び出し口に立つ「偽API」、論文の体裁だけを着る「書誌幽霊」、既存ライブラリの語尾を借りて忍び込む「接尾辞狸」と類型化したい。
私はある時同志の青年を集めて試みに「ばけ物は何と鳴くか」を比較してみたことがあった。大よそ人間のしたりいったりすることに理由のないものがあろうはずがない。(柳田國男『おばけの声』)
ここで重要なのは、鳴き声の差異を笑い話にせず、そこに必ず理由があると見た姿勢である。口承の妖怪は、だれか一人の嘘としては長生きしない。聞き手が「そんな声ならありそうだ」と受け取り、語り継ぐ回路があって初めて定着する。LLMの幻覚も同じで、モデル単体では完結しない。利用者が急いで貼り付け、レビューが省かれ、出力が再び公共テキストへ流れ込むとき、幻覚は個体の失敗から文化的な反復へ変わる。
だからハルシネーション対策は、誤答を人格の欠陥として叱ることではなく、どの場で、どんな鳴き声で、何に化けやすいかを記述することになる。民間伝承が「出たか否か」より「どこで何と聞こえたか」を集めたように、AI運用でも誤答の音色を採集すべきである。関数名なら公式ドキュメントに照合し、論文ならDOI、出版社、被引用関係を確かめる。検証とは退治ではない。妖怪の分布図を描き、出没条件を知り、遭遇時の作法を整える営みである。柳田の方法を借りれば、ハルシネーションは単なるバグではない。統計的言語が共同体の期待をまとって立ち上げる、現代の妖怪伝承そのものである。
——補記:この第一稿は辛口レビューを受け、第二稿で書き直しました。第一稿・レビュー・第二稿を並置して、改稿の過程を記録しています。