跳到正文

ThinkVLN

一个置顶的视觉语言导航项目,探索指令跟随、子任务分解和上下文感知的具身智能体。

克劳德·莫奈,普尔维尔悬崖步道

ThinkVLN 是我早期具身智能工作最主要的公开痕迹:当指令、观测、局部记忆和不断变化的世界状态并不完全对齐时,导航智能体应该如何推理。

在这个站点上,它现在排在多智能体系统工作之后,但它仍然影响我理解状态、记忆和评测的方式。