在ChatGPT的发布之前,一家英国机器人公司Engineered Arts已经将其人形机器人Ameca接入了GPT3,实现了与工程师自由对话的功能。Ameca因其丰富且超真实的人类表情而受到关注,如皱眉、眨眼、瞪眼和咧嘴笑等。
当Ameca接入了ChatGPT后,它是否会真正逆天?这是我们所能想象到的最具悬念的一幕。
除了与人类对话,ChatGPT还被集成到必应搜索引擎中,并被用于控制机械臂和空中无人机。微软在OpenAI上投入了数十亿美元,以扩展ChatGPT的功能。最近,他们发布了一份技术论文,描述了一系列设计原则,可以用来指导语言模型解决机器人的任务。
尽管如此,微软指出,为了让ChatGPT控制提示LLM成为可能,还有几个挑战需要克服,比如提供完整而准确的问题描述,以及确定正确的可允许函数调用和API集。此外,还需要使用特殊参数来偏向答案结构,为有效地将ChatGPT用于机器人的应用程序研究人员构建了一个由以下步骤组成的流程:
首先,他们定义了一个高级机器人函数库,这个库可以特定于感兴趣的场景,并且可以映射到现有的低级实现,这样 ChatGPT 就可以推断它们的行为。
接下来,他们为 Chat G PT 构建一个prompt,该提示符描述了任务目标,同时还标识了库中可用的高级函数。prompt 还可以包含关于约束信息或者 Chat G PT 应该如何组织其响应。
用户在回路中评估 Chat G PT 的代码输出,要么通过直接分析,要么通过模拟,可以使用自然语言向 Chat G PT 反馈答案质量和安全性。
在对 Chat G PT 生成实施方案进行迭代后,当用户满意时,将代码部署到机器上。
例如,在一个实验中,微软研究人员利用 Chat G PT 控制一台手臂执行堆叠块等操作。这项技术甚至能够从内部知识库回忆起微软标志,以SVG代码形式“绘制”标志,然后使用学习到的技能找出哪些现有的动作可以构成它物理形式。
此外,还有一次尝试是在无人飞行车(UAV)上运用这种技术。在给予长提示列出计算命令之后,可要求它以各种方式控制无人飞行车。这包括请求识别饮料,如椰水或可乐罐。此外,由于prompt基本API编写导航代码结构,无需进一步说明即可完成任务。
这些例子展示出了当 Ameca 接入到了强大的 AI 功能时,它不仅仅是一个拥有丰富表情的人形机器,而是一个具有自主决策能力并能够协同工作的人工智能代理。那么,我们又能期待什么呢?只有时间才能揭开这个谜团。但一件事是明确的:未来的科技革命正在悄然发生,而且看似不可思议的事情正在变得可能。