风尚咨询

“读心”AI问世!得克萨斯农工大学推出OmniPredict,可预判人类行为意图

2025-12-18
在当今人工智能技术不断取得突破的环境下,得克萨斯农工大学(Texas A&M University)的研究团队最近发布了一项引人注目的成果——一款名为“OmniPredict”的新型人工智能系统。这个系统展示了卓越的“读心”能力,不仅能够准确地识别人类当前的动作,还可以通过多模态分析,实时预测接下来的行为意图。这一进步,标志着人工智能从“被动感知”向“主动理解”的重要转变。
传统的AI系统通常只能识别人类当前的动作,比如“行走”“站立”或“挥手”。而OmniPredict则有所不同,它不仅能够识别这些动作,还能预测接下来的行为。通过整合视觉信息、环境线索、身体姿态和眼神方向等多方面的数据,OmniPredict成功构建了一个能够深入理解人类行为的复杂模型。其核心技术是多模态大语言模型(MLLM),这一技术赋予AI类似人类的推理和情境判断能力。
在实际测试中,OmniPredict展现出卓越的预测性能。例如,在道路场景中,系统不仅能识别行人是否站在路边,更能通过其身体前倾角度、视线方向、脚步微动等细微信号,判断其是否有意过马路,甚至能区分“准备穿越”“犹豫等待”或“仅驻足观望”等不同意图。即便在行人被部分遮挡、光线昏暗或仅通过眼神与车辆互动的复杂情境下,系统依然保持了高达67%的预测准确率,较当前最优模型提升了10个百分点。
这一能力的实现,源于OmniPredict对“行为背后逻辑”的深度挖掘。项目负责人斯里坎特·萨里帕利(Srikanth Saripalli)博士指出:“我们不再只是分析像素,而是在解读行为的‘为什么’。”系统将人类动作解构为穿越意图、视线遮挡、动作连贯性、注视焦点等关键维度,从而实现对复杂社会互动的精准建模。
OmniPredict的应用前景极为广阔。在自动驾驶领域,车辆若能提前预判行人意图,将极大提升道路安全,减少事故风险。在智慧安防、应急救援、军事侦察等高风险场景中,该技术可帮助决策者提前识别潜在威胁或救援需求。此外,在人机协作、智能零售、心理健康监测等领域,也具备巨大的拓展潜力。

最新文章

谷歌携手三星发布Gemini AI智能眼镜:重塑免手交互新体验

智能

 

阅读14089

全新丰田海拉克斯震撼登场:硬派皮卡再进化

汽车

 

阅读13260

苹果2026秋季战略大洗牌:iPhone 18 Pro携八大升级亮相,首款折叠机定档9月

数码

 

阅读10842

比亚迪储能温控技术再升级:新专利授权助力提升电池安全性

汽车

 

阅读13886

公有云大模型Token服务性能测评结果即将公布

数码

 

阅读19754

京ICP备2025103387号-2