大模型是“思维AI”,可帮助机器人获得了重大的智能提升! 人工智能大模型允许机器人以以前无法实现的方式执行复杂的多步骤任务。 谷歌DeepMind发布了一对人工智能(AI)模型,使机器人能够以以前不可能的方式执行复杂的一般任务和推理。今年早些时候,该公司发布了Gemini Robotics的第一次迭代,这是一种基于其Gemini大型语言模型(LLM)的人工智能模型,但专门用于机器人。这使得机器能够在物理空间中推理和执行简单的任务。被称为Gemini Robotics 1.5和Gemini Robotic ER 1.5的新型号极大地扩展了原始版本处理多步“长期”任务的能力,是机器人在现实世界用例中帮助人们的重要里程碑。 谷歌指出的基线示例是香蕉测试。最初的人工智能模型能够接收一个简单的指令,比如“把香蕉放在篮子里”,并引导机器人手臂完成该命令。在这两种新型号的驱动下,机器人现在可以选择水果,并根据颜色将它们分类到单独的容器中。在一次演示中,一对机械臂(该公司的Aloha 2机器人)将香蕉、苹果和酸橙准确地分类到三个颜色合适的盘子里。AI大模型
大模型让机器人学会“思考”!谷歌新模型实现多步任务突破
哇侯选评汽车
2025-10-11 08:50:09
0
阅读:1