未来的奇迹:ChatGPT与人形机器人的融合将会是怎样的强大?
在ChatGPT的发布之前,就有一家英国公司Engineered Arts将其人形机器人Ameca与GPT3相结合,实现了它可以自由地和工程师对话。我们之前介绍过能够做表情的机器人,这就是Ameca及其不同版本,它因其丰富且超逼真的人类表情而引起了大量关注,比如皱眉、眨眼、瞪眼,咧嘴笑等等。
当Ameca接入GPT3后,它便能与工程师们自由地聊天。那么如果Ameca接入ChatGPT会发生什么呢?这可能会是一个逆天的变化。
除了控制机械臂和空中无人机之外,微软还将ChatGPT集成到必应搜索引擎中,并在技术论文中描述了一系列设计原则,以指导语言模型解决机器人任务。微软表示,尽管ChatGPT可以做很多事情,但它仍然需要一些帮助来进行编程。
为了有效地将ChatGPT用于机器人的应用,研究人员构建了一个由以下步骤组成的流程:
首先,他们定义了一个高级机器人函数库,该库可以特定于感兴趣的场景,并且可以映射到现有的低级实现,这样 ChatGPT 就可以推断它们的行为。
接下来,他们为ChatGPT构建一个提示符,该提示符描述了任务目标,同时还标识了库中可用的高级函数。该提示符还包含关于约束信息,以及如何组织响应。
用户在回路中评估 ChatGPT 的代码输出,要么通过直接分析,要么通过模拟。
在对生成实施方案进行迭代后,如果用户满意,则代码可以部署到机器上。
例如,在一个例子中,微软使用ChatGPT来控制手臂操作。在这个场景下,它使用对话反馈教会模型如何将最初提供的API组合成更复杂的高级功能,由自己编码。此外,还有尝试让它控制一架空中的无人飞行车辆,将长列表API命令提供给它,然后发出指令,让它以各种方式控制无人飞行车辆。这包括要求识别饮料罐,如椰水和可口可乐罐,以及导航结构仅根据prompt基本API编写代码。
这些例子展示出,当人们把强大的AI能力加到人类创造力上时,我们可能能见证前所未有的创新和革命性变革。在不远未来,我们或许能够看到这种结合带来的实际应用,使我们的生活更加智能化、高效化,而这一切都离不开那些不断探索并推动技术边界的人们的手脚。