“读心”AI问世！得克萨斯农工大学推出OmniPredict，可预判人类行为意图

2025-12-18

在当今人工智能技术不断取得突破的环境下，得克萨斯农工大学（Texas A&M University）的研究团队最近发布了一项引人注目的成果——一款名为“OmniPredict”的新型人工智能系统。这个系统展示了卓越的“读心”能力，不仅能够准确地识别人类当前的动作，还可以通过多模态分析，实时预测接下来的行为意图。这一进步，标志着人工智能从“被动感知”向“主动理解”的重要转变。

传统的AI系统通常只能识别人类当前的动作，比如“行走”“站立”或“挥手”。而OmniPredict则有所不同，它不仅能够识别这些动作，还能预测接下来的行为。通过整合视觉信息、环境线索、身体姿态和眼神方向等多方面的数据，OmniPredict成功构建了一个能够深入理解人类行为的复杂模型。其核心技术是多模态大语言模型（MLLM），这一技术赋予AI类似人类的推理和情境判断能力。

在实际测试中，OmniPredict展现出卓越的预测性能。例如，在道路场景中，系统不仅能识别行人是否站在路边，更能通过其身体前倾角度、视线方向、脚步微动等细微信号，判断其是否有意过马路，甚至能区分“准备穿越”“犹豫等待”或“仅驻足观望”等不同意图。即便在行人被部分遮挡、光线昏暗或仅通过眼神与车辆互动的复杂情境下，系统依然保持了高达67%的预测准确率，较当前最优模型提升了10个百分点。

这一能力的实现，源于OmniPredict对“行为背后逻辑”的深度挖掘。项目负责人斯里坎特·萨里帕利（Srikanth Saripalli）博士指出：“我们不再只是分析像素，而是在解读行为的‘为什么’。”系统将人类动作解构为穿越意图、视线遮挡、动作连贯性、注视焦点等关键维度，从而实现对复杂社会互动的精准建模。

OmniPredict的应用前景极为广阔。在自动驾驶领域，车辆若能提前预判行人意图，将极大提升道路安全，减少事故风险。在智慧安防、应急救援、军事侦察等高风险场景中，该技术可帮助决策者提前识别潜在威胁或救援需求。此外，在人机协作、智能零售、心理健康监测等领域，也具备巨大的拓展潜力。

“读心”AI问世！得克萨斯农工大学推出OmniPredict，可预判人类行为意图

最新文章