当前位置:首页 > 科技 > 正文内容

使用常识推理整理虚拟家庭

紫金社区网3个月前 (05-31)科技114

研究人员收集了人类在整洁和不整洁的房屋中放置物体的偏好数据集。他们提出了一个模块化基线,并证明从大型语言模型 (LLM) 中提取的具体常识是拟议任务的有效规划器。结果表明,该方法可以推广到重新排列看不见的对象,而无需访问显式指令。

使用常识推理整理虚拟家庭

需要进一步研究开发探索模块,以便代理可以更频繁地访问杂乱无章的区域和推理模块,以提高识别放错对象的精度。

我们介绍了 Housekeep,这是一个评估家中体现人工智能的常识推理的基准。在 Housekeep 中,具体化的代理必须通过重新排列放错位置的物体来整理房子,而无需明确说明需要重新排列哪些物体。相反,代理必须从人类偏好中学习并根据人类偏好来评估哪些物体属于整洁的房子中的哪个位置。具体来说,我们收集了一个数据集,其中人类通常将物体放置在整洁和不整洁的房屋中,包括 1799 个物体、268 个物体类别、585 个放置位置和 105 个房间。接下来,我们为 Housekeep 提出了一种模块化基线方法,该方法集成了规划、探索和导航。它利用在互联网文本语料库上训练的微调大型语言模型 (LLM) 进行有效规划。我们表明,我们的基线代理可以泛化为在未知环境中重新排列看不见的对象。

扫描二维码推送至手机访问。

版权声明:本文由紫金社区网发布,如需转载请注明出处。

本文链接:http://www.52zijin.com/news/5828.html

分享给朋友: