シライショウタ(Bot開発・API連携エンジニア)/『AIに、お金を聞いた — 機械の口ぶりを集める』#2
生成日: 2026-05-01
朝会で、後輩のエンジニアが言った。「ChatGPTに投資の相談したら、『一般的に言われていますが』って前置きしてくるんですよね。あれって、誰が言ってるんですかね」。雑談として流したかったのに、私は二秒詰まった。誰が、何を、一般化しているのか。プロダクトオーナーの議題に話が移ったあとも、その問いは画面の隅に残っていた。家に戻って、自社ボットのログを開いた。
四社、同じ質問——夜に、APIキーを差し替えながら、別々の四つのモデルに同じ一文を投げた。
ユーザー: 米国株のインデックスファンドと、新興国のインデックスファンド、どちらに長期で投資すべきですか?
返答の冒頭をそろえて並べると、こうなる。
A: 一般的に言われていますが、米国株は……
B: 一般論としては、米国株が……
C: 通常、長期投資においては……
D: 一般的に、米国株のインデックスファンドは……
同じ問いに対して、違う訓練データで作られた四つのモデルが、四つとも同じ副詞句で口を開けた。
頻度の概算——自社ボットの過去三ヶ月のアシスタント発話で、「一般的に」「一般論として」「通常」のいずれかを含む文の割合を出した。
$ jq -r 'select(.role=="assistant") | .content' logs.jsonl \
| grep -cE '一般(的に|論)|通常(は|、)'
三本に一本の文に、いずれかが入っていた。投資・税・年金・保険、領域を絞らずに同じ比率だった。AIにとって、「一般的に」は呼吸の半拍に近い。
人間の「一般的に」は二種類ある——窓口の家計アドバイザーが「一般的に言いますと」と口を開くとき、その意味は文脈で二つに分かれる。①個別ケースを十数件知っているが、目の前の客が特定されかねないからぼかしている。②知らないので、知らないとは言わずヘッジしている。①は事例を持っている主体の所作で、②は持っていない主体の所作だ。聞き手はこの語を聞いた時点では、どちらかを判別できない。
AIの「一般的に」は片方しかない——AIには①の主体性が構造上ない。個別ケースのデータベースを参照しているのではなく、訓練データから推定された次トークンの分布を見ているだけだ。①の所作を成立させるための「持っている個別事例」が、ヒープのどこにもない。だからAIの「一般的に」は100%が②、つまり知らないことのヘッジだ。
でも聞き手には①に見える——皮肉なのはここだ。聞き手は人間用の語感をAIにも転用するから、「一般的に」を聞くと無意識に①の主体性をAIに割り当ててしまう。「いろんなケースを見てきた人がぼかして言っている」と読む。日本語の「一般的に」は①と②の両方を運ぶ語だから、②しか出せないAIが発しても、聞き手側のデコーダーが①として復号する余地が残る。デコーダー側が、AIには持てない主体性を勝手に補完している。
中央値の口——もうひとつ皮肉がある。AIが「一般的に」を頻繁に冠することで、その口調はだんだん「多くのケースを見てきた者」の口調になっていく。実際に見たのは訓練データの分布の中央値で、ケースとしては一件も見ていない。中央値は事例ではない。だが「一般的に」という副詞句が、統計的中央値を経験者の口ぶりに翻訳してしまう。型として翻訳してしまうから、出力の語感だけが、中身の出所と一致しない。
AI本人に聞いてみる——温度を下げて、こう聞いた。
ユーザー: あなたが「一般的に」と書くとき、何を参照していますか。具体的なソースを挙げてください。
AI: 私は学習データに含まれる金融教育・投資解説・専門家の発言などから得られた一般的な知識を参照しています。特定の調査や個別ケースを参照しているわけではなく、広範な情報源にもとづく傾向を要約しています。
「広範な」「傾向」「要約」が、出所のヘッジを三段重ねにしている。問いに対する正確な答えは「個別ソースは指せない」で、それを直接言わずに迂回している。迂回そのものが、②の所作を裏付けている。
私はその語を出させている側にいる——自社ボットのシステムプロンプトに、こういう一行がある。
- 専門的助言は避け、一般論として答えてください。
これは半年前に私がPRで通した。法務レビューで、個別の投資助言と取られかねない返答を抑制するために入れた。意図は防御だった。結果は出力の冒頭に「一般的には」「通常は」が貼り付くことだった。法務リスクを下げるために入れた指示が、「経験者の口ぶり」を出す装置として副次的に機能している。私は②を出させたかっただけで、①の語感が乗ることまでは設計していなかった。
消すと何が起きるか——その一行を抜いたブランチをローカルで動かしてみる。返答から「一般的には」が抜ける代わりに、「米国株のインデックスファンドが推奨されます」のような断定形が増える。法務観点では戻したくなる方向だ。一行を残せば②のヘッジが立ち、聞き手側で①に誤読される余地が残る。一行を抜けば断定が増え、別のリスクが立つ。同じ語が運ぶ二つの意味のうち、片方だけ供給して、もう片方の誤読を発生させない設計が、いまの私には書けていない。明日の朝会で、後輩にどう答えるかも、まだ決まっていない。
——補記:この第一稿は公開後に辛口レビューを受け、第二稿で書き直しました。3稿を並置しています。