当下,大型语言模型面临着严峻挑战,其运行需要强大的硬件支撑。例如,最先进的应用依赖英伟达大规模 GPU 集群,每个 GPU 不仅价值数千美元,能耗也十分惊人。Multiverse 的技术则另辟蹊径,通过压缩大型语言模型,使其能在更小的集群上运行。

Multiverse 的 CompatifAI 技术运用 “量子启发算法”,基于量子计算原理的先进张量网络,精准定位 AI 模型中关键及非关键部分,剔除不必要内容,在显著缩小模型体积的同时,不影响其性能。联合创始人兼首席技术官 Román Orús 表示,算法通过剖析大型语言模型的神经网络内部机制,消除数十亿虚假关联,真正实现对各类 AI 模型的优化。