AI研究の第一人者であるヤン・ルカンは、現在主流の「大規模言語モデル(LLM)」は、真のAI(AGI)へ至る道ではないと指摘している。彼によれば、LLMの研究は一つの段階を終え、これからはより本質的な課題に取り組むべきだという。
LLMの根本的な限界
ルカンが問題視するのは、LLMがテキストのみから学習する点である。人間は現実世界での経験を通じて世界の仕組みを学ぶが、LLMにはその経験がない。
- 物理世界を理解できない: テキストだけでは、物が落ちる、物がぶつかるといった物理法則を直感的に理解できない。
- 真の推論や計画ができない: 世界の仕組みを理解していないため、複雑な状況で推論し、長期的な計画を立てる能力に限界がある。
つまり、言葉を巧みに操ることはできても、その言葉が指し示す現実世界を理解しているわけではない、というのが彼の主張の核心である。
新しいAIの形「V-JEPA」
この限界を乗り越えるため、ルカンは「V-JEPA」という新しいAIアーキテクチャを提唱している。これは、テキストではなく映像から世界の仕組みを学ぶモデルである。
V-JEPAは、映像の細部をすべて予測するのではなく、物事の本質的な構造や関係性といった「抽象的な概念」を学習する。これにより、無関係な情報に惑わされず、効率的に世界の法則を学ぶことができる。例えば、物が突然消えるといった非現実的な映像を見れば、それを「ありえないこと」として認識できるのだ。
まとめ:真のAI(AGI)への道筋
ルカンの結論は明確である。「テキスト学習だけではAGIには到達しない」。
将来のAIは、LLMのような言語能力と、V-JEPAのような世界を理解する能力を組み合わせたハイブリッドなシステムになると彼は考えている。直感的な思考(システム1)と、論理的な思考(システム2)の両方を備えて初めて、AIは人間のような真の知性を獲得できる。ルカンの提言は、LLMの熱狂の先にある、AI研究の新たな地平線を示しているのである。
#AI #人工知能 #ヤンルカン #LLM #AGI #VJEPA