美团近日正式发布并开源其最新大语言模型——LongCat-Flash,该模型基于混合专家模型(MoE)架构,拥有5600亿参数。MoE架构通过将模型划分为多个专家模块,实现了高效的计算资源利用。

LongCat-Flash创新性引入“零计算专家”机制,仅需激活约5%的参数即可实现卓越性能,在多项基准测试中表现亮眼,同时以超低推理成本与高速响应引领行业效率革新,为AI技术落地开辟新路径。
页码:下一页

数码
阅读11758
数码
阅读17237
数码
阅读19863
数码
阅读13622
数码
阅读11725