コンピュータサイエンス × 薬学

AUCが上がれば、薬学は進むのか

AUCが0.03伸びた。ベンチマークを塗り替えた。論文が通った。

それで何が変わったのか。

薬学に計算を持ち込む研究者の多くが、ここで止まる。精度を上げることと、薬学的な判断を変えることを、同じだと思っている。だがこの二つは、かなり別の仕事だ。

問い直すべきはそこだ。「いかに予測精度を高めるか」ではなく、「薬学的な意思決定を支える情報処理系をいかに設計するか」。分子、製剤、体内動態、患者の服薬行動、医療環境という異質な層が折り重なり、しかも素直には接続されない。ある計算上の改善が、有効性、安全性、服薬継続率、臨床便益にどう波及するのか。その経路を示せない限り、局所的な精度最適化は入口の前で終わる。

創薬を見ればわかる。活性、選択性、ADME、毒性、合成可能性。これらは並列する評価軸であると同時に、互いに衝突する。しかもデータ分布は揺れ、ラベルは不完全で、観測される候補にはバイアスがかかっている。単一タスクに秀でた予測器を作っても、閉ループで更新される学習系がなければ、探索は前に進まない。実験ヒット率は上がるのか、失敗候補を早く切れるのか。問うべきはそこだ。AUCではなく、探索コストがどれだけ下がるかという実務の話だ。

薬理学でも同じ錯覚が起きる。結合を当てれば薬効がわかる、という短絡だ。受容体占有から機能応答への写像は、部分作動やbiased agonism、耐性形成によってねじれる。結合予測をそのまま薬効予測に読み替えることには、構造的な限界がある。ブラックボックスの予測器より、PK/PDやQSP、因果推論のように機序への配慮を残した推論のほうが薬学的には有用だ。精度の高さが価値ではない。用量設計や投与計画をどれだけ改善できるかが価値だ。

製剤は、さらに複雑だ。結晶多形、吸湿性、溶出、スケールアップ再現性が絡み合う。QbDやDoE、PATを個別技法として並べることに意味はない。実験計画、状態推定、品質予測、制御を接続する統合アーキテクチャを作ることが求められている。苦味マスキングも徐放化も、製剤性能の改善で終わっては薬学的意味を持てない。患者が服用できるか、継続できるか、曝露が安定するかを介して臨床成果に届いて初めて、その計算は意味を持つ。

薬物動態のモデルも同様だ。PBPKや集団PKに機械学習を接続し、臓器機能や薬理遺伝学、併用薬情報を統合して個別投与を支援する。だがRMSEが少し改善したという報告だけでは現場は動かない。AUC推定がどれほど安定するか、DDIをどれほど回避できるか、脆弱集団へどこまで安全に外挿できるか。そこまで降ろして初めて、モデルは道具になる。

安全性と有効性の評価では、さらに一段の慎重さが要る。シグナル検出と因果推定は似て非なるものだ。NLPや異常検知は候補事象の発見に有効だが、発見したことと「危険だ」「効いている」と結論することの間には大きな隔たりがある。target trial emulationやpropensity score、感度分析なしに薬学的主張はできない。有効性についても、代理指標の最適化では不十分だ。実臨床でどの患者群に、どの条件で、どの程度の利益があるのか。「平均すると少し良い」で止まれば、それは統計であって薬学ではない。

服薬行動と臨床実装の問題も、監視技術として置くだけでは機能しない。薬剤師介入を最適化するヒューマン・イン・ザ・ループの系として設計すること。アラート疲れ、説明可能性、ワークフロー適合性への耐性。賢いアルゴリズムほど、制度や運用の摩擦によって静かに拒まれる。

結局、コンピュータサイエンスの薬学への貢献は、予測器の量産ではない。分子設計から製剤、PK/PD、服薬行動、臨床運用を貫く意思決定基盤を築くことだ。データバイアスによる不公平、説明不能な推奨、規制との不整合も、外付けの倫理としてではなく、システム要件として埋め込まれなければならない。

高精度モデルを作ることは、まだわかりやすい。難しいのはそこではない。そのモデルが薬学のどこに入り込み、誰の判断を変え、何を改善し、何を悪化させるのかを最後まで追うこと。薬学に計算を持ち込むとは、本来そういう厄介で、しかし本質的な設計の仕事なのだ。