

一种名为“KnowNo”的新训练模式旨在通过教会机器人在指令不明确时寻求我们的帮助来解决这个问题。与此同时,它确保他们只在必要时寻求澄清,尽量减少不必要的反反复复。其结果是一个聪明的助手,试图确保它了解你想要什么,而不会打扰你太多。
谷歌DeepMind的研究科学家曾安迪(Andy Zeng)帮助开发了这项新技术,他表示,虽然机器人在许多特定场景中可能很强大,但它们往往不擅长需要常识的广义任务。
例如,当被要求给你带一杯可乐时,机器人需要首先理解它需要进入厨房,寻找冰箱,并打开冰箱门。通常,这些小步骤必须手动编程,否则机器人就不知道人们通常把饮料放在厨房里。
这是大型语言模型(llm)可以帮助解决的问题,因为它们包含了很多常识性知识,Zeng说。
现在,当机器人被要求带一杯可乐时,一个对世界有广义理解的LLM可以生成一个逐步指导,让机器人遵循。
llm的问题是,没有办法保证它们的指令能够被机器人执行。也许这个人的厨房里没有冰箱,或者冰箱门把手坏了。在这种情况下,机器人需要向人类寻求帮助。
KnowNo通过将大型语言模型与量化置信度的统计工具相结合,使这成为可能。
当给出一个模棱两可的指令,比如“把碗放进微波炉里”时,KnowNo首先使用语言模型生成多个可能的下一步动作。然后,它创建一个信心分数,预测每个潜在选择是最佳选择的可能性。