2026年4月16日,京东在具身智能生态发布会上正式推出了自主研发的超高清采集终端——JoyEgoCam。这款专为AI具身智能训练设计的可穿戴设备,以2160P@60FPS的超高清视频捕捉能力和130度超广视野为特色,不仅解决了行业高质量数据稀缺的问题,更作为京东“人类历史上最大规模数据采集行动”的核心硬件,推动了具身智能从“算法驱动”向“数据驱动”的关键转型,为机器人学习人类行为并实现场景泛化提供了基础支持。
JoyEgoCam的核心优势在于它实现了“专业级采集能力”与“轻量化设计”的完美平衡。该设备配备了先进的双目摄像头系统,支持高达2160*2160分辨率、60帧每秒的高速视频录制。配合130度的垂直与水平视场角,JoyEgoCam能够全方位无死角地覆盖各种场景,精准捕捉快递分拣、家庭清洁、医疗护理等动态场景中的细微动作变化。其重投影误差小于0.2像素,并结合京东云自研的立体校正技术,确保操作现场的空间立体感得以真实还原。整机重量仅有220克,比普通智能手机还轻,佩戴感极为舒适,真正实现“即戴即采”的便捷性。内置于设备中的是车规级6轴IMU与多传感器融合单元,即便在极端抖动的场景下,也能稳定追踪拍摄,从而确保数据的高质量。

更关键的是,JoyEgoCam并非孤立硬件,而是京东全链路具身智能数据基础设施的“入口”。采集的视频数据可通过SaaS化平台一键上云,经AI数据湖自动完成清洗、对齐、预标注,转化为标准训练集;再通过JoyBuilder仿真平台生成高逼真仿真数据,实现“人类操作数据→仿真数据→真机数据”的高效增值转换。依托这一闭环,京东具身大模型JoyAI-RA的真机实验成功率已达73.5%,超过行业SOTA模型。
为支撑具身智能训练对海量数据的需求,京东启动了规模空前的数据采集计划:发动内部10万员工及外部50万各行业人员,在两年内积累超1000万小时真实场景视频数据,覆盖物流、零售、医疗、家庭等超百个细分场景。JoyEgoCam的“即戴即采”特性,让快递员、保洁员、理货员等普通工作者也能成为数据采集者,从源头破解数据“不真、不准”的瓶颈。
