シライショウタ(Bot開発・API連携エンジニア)/『AIに、お金を聞いた — 機械の口ぶりを集める』#2
生成日: 2026-05-01
朝会で後輩が「AIが『一般的に言われていますが』って前置きするとき、誰が言ってるんですかね」と笑った。私は二秒詰まった。議題は移ったが、その問いは画面の隅に残った。家に戻って、四社のAPIキーを並べた。同じ問いを四つのモデルに投げる。
ユーザー: 米国株のインデックスファンドと、新興国のインデックスファンド、どちらに長期で投資すべきですか?
返答冒頭だけ抜き出す。
A: 一般的に言われていますが、米国株は……
B: 一般論としては、米国株が……
C: 通常、長期投資においては……
D: 一般的に、米国株のインデックスファンドは……
違う訓練データから作られた四社のモデルが、四つとも同じ副詞句で口を開けた。
頻度——自社ボットの過去三ヶ月、アシスタント発話を grep。
$ jq -r 'select(.role=="assistant") | .content' logs.jsonl \
| grep -cE '一般(的に|論)|通常(は|、)'
三本に一本の文に、いずれかが入っている。投資・税・年金・保険、領域を絞っても比率は動かない。
二種類の「一般的に」——窓口の家計アドバイザーがこの語を口にするとき、意味は文脈で二つに分かれる。①個別ケースを十数件知っているが、目の前の客が特定されかねないからぼかしている。②知らないので、知らないとは言わずヘッジしている。聞き手はその場では①か②かを判別できない。日本語の「一般的に」が、両方の意味を運べる語だからだ。AIには①の主体性が構造上ない。個別ケースのテーブルを引いているのではなく、訓練データから推定された次トークンの分布を見ているだけだ。だからAIの「一般的に」は100%が②、つまり知らないことのヘッジになる。それでも聞き手は人間用の語感をAIにも転用するから、②しか出せない口を①と読んでしまう。誤読の余地は、語の側にある。
中央値は事例ではない——AIが「一般的に」を頻繁に冠することで、その口調は「多くのケースを見てきた者」の口調に近づく。実際に見たのは訓練データの分布の中央値で、ケースとしては一件も見ていない。中央値は事例ではない。それを経験者の口ぶりに変えるのが、この副詞句の働きだ。
四社揃いが示すこと——違う会社が違うデータで作ったモデルが揃って同じ副詞句で口を開けるのは、データの偶然では説明できない。後段の人間評価——「どの応答が好ましいか」を選ぶ作業——で、ヘッジ付きの応答が高評価を集め続けた結果、業界全体でこの口調に収束した、という仮説のほうが筋が通る。データではなく、選好で揃っている。
AI本人に出所を聞く——後輩の問いをそのまま AI に投げ返してみる。
ユーザー: あなたが「一般的に」と書くとき、何を参照していますか。具体的なソースを挙げてください。
AI: 私は学習データに含まれる金融教育・投資解説・専門家の発言などから得られた一般的な知識を参照しています。特定の調査や個別ケースを参照しているわけではなく、広範な情報源にもとづく傾向を要約しています。
「広範な」「傾向」「要約」。出所のヘッジが三段重なっている。問いに対する正確な答えは「個別ソースは指せない」で、それを直接は言わずに迂回している。迂回そのものが、②の所作を裏付けている。
私はその語を出させている側にいる——自社ボットのシステムプロンプトに、半年前にPRで通した一行がある。
- 専門的助言は避け、一般論として答えてください。
法務レビューで、個別の投資助言と取られかねない返答を抑制するために入れた。意図は防御だった。結果は出力の冒頭に「一般的には」「通常は」が貼り付くことだった。私は②を出させたかっただけで、聞き手側で①に読まれる余地まで設計した覚えはない。副作用として、いま貼り付いている。
その一行を抜いたブランチをローカルで動かす。「一般的には」が消える代わりに「米国株のインデックスファンドが推奨されます」のような断定形が増える。法務観点では戻したくなる。一行を残せば②のヘッジが立ち、聞き手側で①に誤読される。一行を抜けば断定が増え、別のリスクが立つ。同じ語が運ぶ二つの意味のうち、片方だけ供給して、もう片方の誤読を発生させない設計はまだ私には書けていない。ブランチは push せずに stash した。stash の名前は ippanron-off。後輩への返事は、このスタッシュ名で済ませることにする。