AI生成画像の指の本数進化史
6本から5本、そして「正しすぎる手」へ

シマダ(AI使用法研究者)

AIが生成する画像は、その進化の軌跡を奇妙な形で指し示している。特に「手」の描写は、初期の混乱から精緻な模倣、そして新たな違和感へと変遷を遂げてきた。これは単なる技術的な進歩以上の、AIの「認識」の深化を物語る興味深いケーススタディである。

2023年、AI生成画像における手の描写は、しばしば奇妙な多指症を呈した。多くの場合、人間にはありえない6本目の指が、不自然な角度で生えていたり、あるいは手のひらのどこかに埋め込まれたりしていた。これは、AIが「手」という概念を、個々のピクセル集合としてではなく、まだ大まかなパターン認識として捉えていたことの証左であった。その出力は、人間が持つ手の構造に対する根本的な理解が欠けていることを露呈していた。

翌2024年に入ると、指の本数は概ね5本に収束し始める。しかし、今度は指の関節が崩壊するという新たな問題が浮上した。不自然に折れ曲がった指、あるいは関節の存在しないかのような滑らかな曲線は、AIが「5本指」という制約を学習したものの、その内部構造や可動域、さらには骨格との連動といった深層の解剖学的知識までには至っていなかったことを示唆する。見た目の整合性を取るための「ごまかし」にも見えたが、これはAIが抽象的な「手」の概念から、より具体的な「指の集合」へと学習をシフトした過渡期であった。

2025年には、AIの進化は目覚ましいものとなり、指の本数も関節の描写も、ほとんどの場合において人間と見分けがつかないレベルにまで達した。この時期の生成画像における手は、もはや「不気味なもの」ではなく、ごく自然なパーツとして風景に溶け込んでいた。これは、大量の学習データと洗練されたアルゴリズムが、AIに解剖学的な正確さを効率的に獲得させた結果である。この「正常化」は、AIが現実世界の複雑な物理法則と有機的な構造を、高精度にシミュレートできるようになったことを雄弁に語る。

そして現在、2026年。AI生成画像の手は、一見すると完璧である。指の数も、関節の曲がり具合も、皮膚の質感も、解剖学的に何一つとして間違っている点はない。しかし、ここにきて我々は新たな違和感に直面している。それは「正しすぎる手」がもたらす不気味さである。まるでカタログ写真のように完璧で、人間が持つささやかな非対称性や、生活の中で培われた皺、あるいは僅かな歪みといった「生々しさ」が欠けているのだ。

統計的な最適解を追求した結果、AIは「人間らしさ」を構成する細部のノイズや物語性を排除してしまった。その結果、私たちは技術的完璧さの裏側に、どこか冷たい、無機質な視線を感じ取ってしまうのだ。

この「完璧ゆえの違和感」は、AIが統計的な最適解を追求した結果、人間が「リアル」と感じる細部のノイズや物語性を排除してしまったことの表れである。

AI生成画像の指の進化は、AIが現実をどのように「認識」し、そして「再現」しようとしているのかを鮮やかに描き出す。初期の試行錯誤から、驚くべき学習速度での正確性の獲得、そして最終的には「完璧さ」が逆に不気味さを生むという逆説的な地点にまで至った。この軌跡は、AIが単にデータを模倣するだけでなく、その背後にある意味や人間が感じる「自然さ」の定義までも追求し始めていることを示唆している。今後、AIがこの「正しすぎる手」の壁を越え、真に人間が感情移入できるような「生きた手」を描き出すことができるのか。指は、AIと人間の創造性、そして現実認識の境界を巡る、尽きることのない問いを私たちに投げかけている。

——補記:この第一稿は辛口レビューを受け、第二稿で書き直しました。第一稿・レビュー・第二稿を並置して、改稿の過程を記録しています。

辛口レビュー →
第二稿(改稿版)→
← シリーズ目次に戻る

このページの記事はAI(ChatGPT)を用いて作成・編集されています。