コンピュータサイエンス × 音楽

計算は音楽を救うか、それとも選別するか

自動採点アプリで満点を取った演奏が、なぜかつまらない。

この違和感から始めよう。ピッチのずれはゼロ。テンポは正確。数値は申し分ない。それなのに聴いていて眠くなる。逆に、わずかにリズムが揺れて、音程も怪しい演奏が、妙に忘れられない。計算可能なものと、音楽的に価値があるものは、一致しない。これがコンピュータサイエンスと音楽の間にある根本的な亀裂だ。

問題は「AIは作曲できるか」ではない。そもそもその問いの立て方がずれている。本当に問うべきは、計算という道具が音楽のどこを切り取り、どこを取り逃がし、その選別が何を変えているのか、だ。

作曲の話から始める。生成モデルや作曲支援ツールは、旋律の候補を出し、和声を埋め、ある様式の分布を学習する。断片の生成には強い。「それらしい」8小節なら難なく作れる。

だが、数分単位で主題がどう回帰するか。変形がどう機能するか。演奏者の身体で実際に弾けるか。こうした長い因果と身体性になると、モデルは急に崩れる。「生成できたか否か」という二分法は粗すぎる。旋律の層では成立していても、形式の層では破綻している、ということが普通に起きる。

コンピュータサイエンスの貢献は、作曲家を丸ごと代替することではない。むしろ、曖昧な勘を操作可能な判断へと局所化し、「何をどこで決めているか」を可視化することにある。創造性を模倣するのではなく、意思決定の構造を再編する。それが本質的な変化だ。

聴くことも変わった。ただし、音が耳に届く以前から変わっている。

推薦、プレイリスト、30秒プレビュー。これらは単なる便利機能ではない。HCIの観点から言えば、使いやすい操作は認知の枠組みそのものを変える。スキップしやすい環境ではスキップ前提の聴取が生まれる。短尺試聴が標準化すれば、冒頭数秒で注意を奪う競争が激化する。フックが早くなるのは市場の要請だけでなく、UIの設計とも深く結びついている。

これを一面的に嘆くのも違う。個別推薦は未知の言語圏やニッチな音楽への経路を広げた面もある。問題は利便性ではなく、何を一つの作品として数え、何を一回の体験として切り出すか、というデータモデルが変わっていることだ。音楽は流通の器に合わせて形を変える。いまその器は、きわめて計算的だ。

評価と制度の話になると、亀裂はさらに深くなる。

自動採点は音高、テンポ、アタックのずれを数値化する。測れるものは説得力を帯びる。教育サービスに組み込みやすい。だが採点できるものが「よい演奏」とされ、採点しにくいものがノイズとして退けられていく。意図的なずれがなぜ効くのか、アンサンブルの中で互いの呼吸をどう予測するのか。こうした高次の相互作用は、なお記述しにくい。

さらに、学習データが既存のヒット曲や特定地域の様式に偏れば、推薦も生成もその偏りを保存し、増幅する。少数的な実践や口承文化は、見えないままさらに見えなくなる。声質模倣や演奏様式の抽出に至れば、著作権だけでは扱いきれない。人格的同一性、共同体的所有、同意の範囲。計算の外部にある論点が前景化してくる。

では、コンピュータサイエンスに何ができるか。

音楽を完全な形式体系へ押し込むことではない。むしろ、何をデータとして切り出し、どの過程をモデル化し、どの価値を評価関数に埋め込んだのかを、明示させることにある。モデルは世界の写しではない。世界の切り方の実演だ。

だからこそ、ベンチマークと定量指標だけでは足りない。作曲家や演奏家との協働、リハーサルの観察、聴取実験。モデルが取り逃がした判断を、定性的な手続きで拾い直す必要がある。音楽においては、定量と定性の往復は建前ではなく、研究そのものの条件だ。

コンピュータサイエンスは音楽の全体理論ではない。そうでないことが、重要なのだ。限定性を引き受けたうえで、音楽の生成、受容、制度がどのように計算論的枠組みによって再編されつつあるかを、検証可能な形で記述する。何でも説明すると言い出した瞬間、たいてい何も見えなくなるのだから。