Turing

图灵是西图自主研发的视觉-语言-动作(VLA)大模型,一个面向终身学习的通用 AI 系统。随着图灵在真实世界中不断积累经验、习得新技能,其性能持续进化——驱动着日益精密、自适应的运动控制能力。

turing Process Flow
Pre-Training

预训练

图灵打通了人类示教与机器人执行之间的桥梁。海量第一人称视角的人类数据教会系统理解复杂的交互意图,高保真机器人轨迹数据确保精准的运动控制。统一的 VQA 信号注入丰富的视觉-语言上下文,从根本上化解精度与感知之间的核心矛盾。

Dual-System

双系统联合训练与推理

双系统,一颗心。系统一(认知)负责推理——理解任务、规划策略、做出决策。系统二(执行)负责行动——通过基于扩散模型的控制,将意图转化为即时、流畅的运动。二者协同,实现认知与执行的完美统一。

MoE

混合专家模型 (MoE)

按需调度的智能引擎:路由器为每个输入即时选择最合适的专家——只激活所需、恰在所需之时。这种稀疏的 Top-K 激活机制释放了专业化的潜能而无需线性扩展,赋予 MoE 超级能力:以最小计算成本获得最大模型容量。

On-policy DAgger

在策略 DAgger

启发式 DAgger 恢复数据扩展方案:通过将系统初始化至人工设计的故障状态,启发式 DAgger 高效获取恢复数据,主动捕获失败经验,无需等待自然故障发生。这一方法以零机器人时间成本实现了训练数据的多样化扩展。