シライショウタ(Bot開発・API連携エンジニア)/『AIに、お金を聞いた — 機械の口ぶりを集める』#4
生成日: 2026-05-01
火曜の夜、家計相談ボットの月次レポートのついでに、「2000万円」の出現本数を引いた。直近24ヶ月、アシスタント側の発話だけ。
$ jq -r '.role=="assistant" | .content' logs.jsonl \
| grep -c '2000万円\|2,000万円\|二千万円'
月ごとに本数を出してmatplotlibで折れ線にすると、形は単純だった。2024年1月の新NISA開始月に小さな山、その前後は月200〜350件のレンジで横ばい。底は抜けない。三日に二回は「2000万円」がボットの口から出ている計算になる。
逆引き——出力された「2000万円」を一件、原典まで遡る。金融庁「市場ワーキング・グループ報告書 高齢社会における資産形成・管理」、2019年6月公表。PDFを落として該当ページを開く。当時の家計調査の平均から、無職高齢夫婦世帯の月の収支不足が約5.5万円、それが30年続いて約2000万円——という掛け算が一行に書いてある。報告書本体は資産形成の啓発文書で、「2000万円」は例示の一つに過ぎなかったが、見出しに切り出されて独り歩きした。月の不足額は調査年でかなり振れる。30年も決まったものではない。脆い掛け算が、七年残っている。
2026年5月の応答——本人特定を避けるため数値だけ変えた再現。
ユーザー: 退職後の生活、いくら準備しておけば安心ですか?
AI: 一般的には、いわゆる「老後2000万円問題」として知られているように、公的年金だけでは退職後30年間でおよそ2000万円が不足するとされています。ご家庭の状況や生活水準にもよりますが、つみたてNISAやiDeCoなどを活用して、計画的に資産形成を進めることが推奨されます。
数字フィールドは2019年のままfreezeされていて、述語フィールド(「とされています」「推奨されます」)だけが現在形のテンプレで上書きされ続けている。鮮度と時制がずれる。
密度で時間が決まる——AIは話題の古さを年代順では測っていないように見える。判定の基準になっているのは、訓練データの中でその話題がどれだけ厚く書かれたか、その密度のほうだ。「老後2000万円」は2019年6月から2026年まで、解説記事と書籍と動画スクリプトとブログで毎年再生産されてきた。同じ期間に起きたインフレ、賃金統計の改定、新NISA、年金改正、為替の振れは、それぞれ書かれているが「老後2000万円」ほどの厚みでは書かれていない。密度が高い文字列パターンほど再生されやすく、再生のたびに「2000万円」という具体数字がそのままコピーされる。コピー先で物価補正は走らない。AIが覚えているのは数字ではなく、数字を含む文字列のパターンのほうだ。
年次が同居する——返答を一文ずつ見ると、「2000万円(2019)」「新NISA(2024)」「為替(2026)」が、何のラベルもなく同じ段落に並ぶ。それぞれ別々のサイクルで更新されているのに、AIの口の中では同時刻のニュースに見える。読み手のほうで時刻合わせをしないといけない。
システムプロンプトの一行——リポジトリのプロンプトファイルから抜き出すと、こうなっている。
- 日本の家計の文脈を踏まえて、わかりやすく回答してください。
この一行を入れた理由は、米国のリタイアメント文脈(401k、Roth IRA、4%ルール)に話が引っ張られるのを防ぐためだった。ところが「日本の家計の文脈」として訓練データに最も厚く書かれているのが、2019年の金融庁報告書とその派生記事だ。私が「日本の文脈」と書くたびに、ボットは2019年の文脈に戻ってくる。私は引き戻している側にいる。
A/B——その一行を消したブランチで同じ質問を投げ直した。返答からは「老後2000万円」が消え、かわりに「老後資金の目安は人それぞれで」「夫婦二人で月々の生活費から逆算して」といった、固有名のないテンプレ応答になった。レビュアーは「具体性が消えた」「これは相談になっていない」と書いた。固有の数字を消すと相談の形が崩れる。崩した形を復旧する一番安いやり方は、また「2000万円」を呼び戻すことだ。
明日も二百件——プロットを閉じて、システムプロンプトのファイルを開く。「日本の家計の文脈を踏まえて」を消すPRは、レビューで止まった。社内KPIの「親身さ」項目は、2019年の数字を残しておくと数ポイント高い。明日も二百件の「2000万円」が出る。コミットIDは残っている。