|
(一) 岗位职责 1. 构建机器人多模态数据采集、清洗、标注体系,设计面向具身智能的仿真与真 实世界数据闭环体系,建立从“场景采集 → 清洗标注 → 模型训练 → 机器 人验证 → 失败案例回流”的自动化闭环系统,驱动算法持续迭代。 2. 负责具身多模态大模型(VLA)的预训练、后训练与微调(SFT/RLHF),开发高 效训练框架,优化强化学习、模仿学习及多任务模型在机器人场景的部署性能。 探索小样本学习、仿真到真实(Sim2Real)迁移、自适应训练等前沿技术,解 决 Sim-to-Real 的迁移鸿沟,利用合成数据弥补真实数据的不足,提升模型泛 化能力。 3. 数据采集全链路:主导遥操作(Teleoperation)数据采集平台的搭建与优化, 包括动捕设备选型、3D 重建环境搭建、采集软件的研发,确保数据质量与泛化 性。 4. 具身基础模型训练:负责具身多模态大模型(VLA)的预训练、后训练与微调 (SFT/RLHF)。熟悉模仿学习(Imitation Learning)和强化学习(RL)在机 器人控制中的应用。 5. 管理数据平台与算力资源,确保训练效率与安全性。 6. 负责数据采集与训练团队的建设与组织管理。 (二) 能力要求 1. 5 年以上数据工程和大模型、世界模型平台搭建与训练经验,有机器人数据集构 建或具身智能数据闭环搭建经验者优先。 2. 深入理解大模型训练技术(Transformer、扩散模型、RLHF 等),熟悉 PyTorch、 TensorFlow、PyTorch/TensorFlow/JAX 等主流框架,有大规模集群训练经验(多 机多卡)。 3. 熟悉机器人仿真环境(Isaac Sim、Mujoco、Gazebo)搭建、对抗训练及 Sim-to-Real 方法。 4. 具备大规模机器人数据集(如 RLBench、DexNet)构建或大模型训练优化经验。 5. 熟悉边缘计算部署、模型压缩及实时推理优化技术(TensorRT、量化、剪枝等), 具备模型训练到部署的完整链路能力。 6. 熟悉具身智能算法(VLA、RT-2/RT-X、Octo、Diffusion Policy 等),了解模 仿学习、强化学习(PPO/SAC)、世界模型基本原理。 7. 有鲁棒与自适应控制如滑模控制及其变体(NTSMC)、结合神经网络的自适应控 制等方面的能力和经验。 8. 有混合质量数据学习提升了数据利用效率和策略的鲁棒性的能力和经验。 9. 具备数据清洗、增强、存储、自动化标注、版本管理(如 Pandas、Spark、WebDataset) 的全过程能力。 10. 有团队搭建与管理经验优先,包括数据团队、标注团队、训练团队的组建与管理。 ★重点能力:①Sim-to-Real 能力;②AI 模型场景落地能力。 |