コンピュータサイエンス × 社会学

計算は、社会に触れた瞬間に嘘をつく

ある福祉受給者の記録は、詳細にデータ化される。その記録を審査する官僚の判断過程は、残らない。

これが、「計算社会科学」の出発点にあるべき問いだ。社会は平等に観測されない。観測されやすい人と、されにくい人がいる。そしてそのアンバランスは、サンプリングの失敗ではなく、統治の設計そのものを映している。

コンピュータサイエンスの立場から社会を見るとき、最も粗い発想は「出前」だ。分類器を持ってきて、ネットワーク分析を持ってきて、社会問題に乗せる。研究費も取りやすい。だが、それで済むなら、社会学はとっくに前処理済みデータセットになっていたはずだ。なっていない。

なぜか。社会は、観測されると振る舞いを変える。分類されると、現実のほうが分類に寄っていく。計算モデルを受け取る受動的な対象ではなく、むしろモデルの前提を揺さぶってくる側だ。だから問いを立て直す必要がある。社会をどう計算するか、ではなく、社会を相手にしても壊れにくい計算とは何か。それが設計問題の本質だ。

SNS投稿のログを考えてほしい。コンピュータサイエンスにとってそれは、イベント列であり、グラフであり、相互作用から秩序が浮かび上がる生成過程だ。分極化や同調が鮮やかに見える。だがこの「見える」という語は中立ではない。

モデル化とは、何かを残し、何かを捨てることだ。頻度の高い発話は残る。沈黙は残りにくい。接続の多いノードは際立つ。関係を結べなかった事情は消える。モデルは誠実に計算する。だがその誠実さが、世界の偏りを整然と並べ直してしまう。

さらに言えば、私たちが受け取るログは「生の世界」ではない。UI、利用規約、モデレーション、国家規制、自己検閲、広告配信。幾層ものフィルタを通った観測ストリームだ。学校、司法、労働市場も同じだ。これらは背景変数ではなく、データを生成し、ラベルを与え、分類を実行する情報処理装置として捉えたほうが正確だ。

規範の問題も、ここから切り離せない。異常検知、リスクスコアリング、推薦アルゴリズム。これらが社会に入るとき、モデルは世界を記述するだけでなく、どのラベル空間が正当かを静かに確定していく。支配的な価値観が、API仕様のような顔で実装される。

ジェンダーについても同じことが言える。ジェンダーは固定的な入力属性ではない。データベース設計、特徴量設計、ラベル設計を通じて生成されるカテゴリーだ。二元的スキーマを前提にすれば、トランスやノンバイナリーは最初から表現不能になる。推薦システムや言語モデルは、既存の性別役割分業を「現実に即している」というかたちで再学習する。損失関数に悪意はない。だが、差別の履歴を効率よく圧縮してしまうことはある。ケア労働や家事がログに乗りにくいのも同じ理由だ。見えないのではなく、見えるものとして設計されていない。

だとすれば、計算手法の評価軸は予測精度や再現可能性だけでは足りない。問うべきは別のことだ。概念は妥当か。サンプルはどう生成されたか。歴史的文脈や制度的媒介を落としていないか。因果推論であっても事情は変わらない。処置やカテゴリーそのものが社会的に構築され、人々は相互に干渉し、制度は同時に全員へ作用する。識別戦略は必要だ。だが、それによって何が切り落とされたかを問わなければならない。

「計算社会科学」とは、社会を計算可能な対象へ素直に還元する技術ではない。その還元がどこで歪み、何を切り捨て、どの価値判断を持ち込むのかを露出させながら進む実践だ。社会をうまく計算すること以上に、計算が社会に触れたとき何をしてしまうのかを、計算の内部に含めること。その自己反省的な構えにこそ、この分野がなお生きた学問領域でありうる理由がある。