行业资讯

未来的交互ChatGPT与人形机器人的奇妙融合将会是怎样的场景

在ChatGPT的发布之前,英国一家名为Engineered Arts的公司已经将其人形机器人Ameca接入了GPT3,实现了它可以自由地跟工程师对话。Ameca因其丰富且超逼真的人类表情而受到广泛关注,如皱眉、眨眼、瞪眼和咧嘴笑等。

如果Ameca能够接入ChatGPT,那么它可能会发生什么?也许它真的能逆天变魔术。

ChatGPT以其强大的信息整合和对话能力震撼了全球,它可以生成符合人类理解的响应,并主要用于生成文本、翻译信息、进行计算和解释内容。微软在OpenAI上投入了数十亿美元,并将ChatGPT集成到了必应搜索引擎中,还将其功能扩展到控制机械臂和空中无人机。

微软最近发布了一份技术论文,描述了一系列可用于指导语言模型解决机器人任务的设计原则。研究人员表示,为使机器人控制提示LLM提出了几个挑战,如提供完整而准确的问题描述,以及确定正确的可允许函数调用和API集。

为了有效地使用ChatGPT来控制机器人的应用,研究人员构建了一个由以下步骤组成的流程:

首先,他们定义了一个高级机器人函数库,这个库可以特定于感兴趣的场景,并映射到现有的低级实现。

接下来,他们为ChatGPT构建一个prompt,该提示符描述了任务目标,同时还标识了库中可用的高级函数。

用户评估 ChatGPT 的代码输出,要么通过直接分析,要么通过模拟。

在对 ChatGPT 生成的实施方案进行迭代后,如果用户满意,可以部署代码到机器上。

例如,在一个例子中,微软研究人员使用 Chat G PT 来控制手臂操作。在这个过程中,它使用对话反馈来教会模型如何将最初提供给它们 API 组合成更复杂、高级功能,由 Chat G PT 自己编码。此外,该模型还能用木块搭出微软标志,而且能够根据内部知识回忆起 SVG 代码形式“绘制”标志,然后利用学到的技能找出哪些现有动作可以形成物理形式。

此外,还有尝试让 Chat G PT 控制一架空中无人飞行车辆。首先,他们给予 Chat G PT 一长串提示列出它可以编写以控制无人飞行车辆计算命令。在之后,可要求指示该语言模型以各种方式操作,无论是要求识别饮料罐还是仅仅根据基本 API 编写导航代码结构。这一切都表明,将来我们或许能够见证这样的人工智能与机械结合体成为可能,即不仅能进行复杂交流,还能执行实际任务,而这一切都基于他们所学到的知识和经验。

你可能也会喜欢...