卡内基梅隆大学研究团队近日在 AI 推理领域取得突破性进展,其研发的新型算法让机器具备了类似侦探的高效分析能力,大幅提升了复杂场景下的推理效率。

研究团队提出了一种全新的训练方法,叫做”元强化微调”(Meta Reinforcement Fine-Tuning,简称MRT)。这种方法的核心思想是教会AI在每一个思考步骤中都要有所进展,就像训练一个侦探不仅要破案成功,还要确保每次调查行动都能获得有价值的信息,朝着真相更近一步。
页码:下一页

数码
阅读10213
数码
阅读18358
数码
阅读15924
数码
阅读10549
数码
阅读11359