森林を「一つ」と呼んだ瞬間、研究は始まっていない
「森林の炭素吸収量を機械学習で推定する」という論文タイトルを読んで、何かを理解した気になる。これが罠だ。
森林という言葉が、問いを殺している。
人工林と天然林は違う。流域管理と希少種保全も違う。枯死予測と来年の施業計画は、計算問題の顔をしているだけで中身は別物だ。「森林」という一語でまとめた瞬間、問いは粗くなる。そこから先の計算がいくら精巧でも、何かにぶつかっているわけじゃない。
本当に必要なのは何か。森林を木の集合として眺めることじゃない。異なるデータ生成過程と意思決定構造をもつ問題クラスの束として切り分けることだ。観測できるものが違えば推定の意味が変わる。管理目的が違えば評価も変わる。時空間スケールが違えば、昨日うまく動いたモデルが明日には空回りする。
アルゴリズムは、問いの立て方まで面倒を見てくれない。
人工林は比較的扱いやすい。収穫、更新、路網整備、労働力制約は人間の手の届く範囲にある。航空レーザや衛星画像で林分状態を観測し、最適化をつなげば、介入選択の枠組みも組みやすい。「見て、並べて、選ぶ」という流れが素直に機能する。
ところが天然林保全に入ると、部分観測、長期依存、高い不確実性が前景化する。林冠高を精度よく推定しても、それは入口に過ぎない。希少種の生息地、攪乱後の回復、種組成の変化を追うには、固定試験地との長期時系列が要る。何が起きているとみなせるか、を慎重に詰めなければならない。
流域管理はさらに別の問題だ。水源涵養や土砂災害リスクを考えるとき、森林だけ見ていては足りない。地形、土壌、植生が絡み合う。気候変動応答に至っては、枯死、火災、分布移動、回復遅延を含む非定常系として扱わなければ、学習時の性能は運用時の保証にならない。分布の変化はもはや例外ではなく、平常になりつつある。
ここに一つの混同がある。観測しやすいものと、科学的に重要なものは、一致しない。
リモートセンシングは強力だ。樹冠構造も地上部現存量も広域で迅速に捉えられる。だが実生加入、種間競争、菌根共生、土壌炭素動態、シカ食害は、現地観測なしには識別しにくい。見えにくいものほど、管理上は効いていることがある。
機械学習も似た問題を抱える。予測性能の向上には貢献するが、因果機構の同定とは別問題だ。精度のよい予測と正しい理解は一致しない。だから現況把握にはリモートセンシング、過程理解には長期固定試験地、介入効果の推定にはプロセスモデル、施策選択には意思決定支援、というように問いに応じて計算資源を配分する方が健全だ。すべてを一つのモデルに押し込めるより、役割分担を明示した方がいい。
炭素蓄積量も生物多様性の代理変数も、単一指標に縮約した途端に、きれいだが薄くなる。森林管理もまた、教科書的な最適化問題ではない。林道網、地形、所有界、価格、苗木供給、獣害、制度、合意形成に縛られた実装問題だ。求めるべきは単発の最適解ではなく、不確実性の下でも崩れにくく、運用可能な方策だ。
コンピュータサイエンスの役割は、森林を単純化して置き換えることではない。複雑で異質で、長期にわたり、観測しきれない森林システムに対して、制約と不確実性を消さずに残したまま、観測し、理解し、介入し、評価するための計算可能な足場をつくることにある。
控えめに見えて、実はかなり大きい仕事だ。