Gemini 2.5 Pro 在技术上实现了重大突破。它能够深入剖析问题,并非简单重复训练数据,而是像人类思考般逐步推理。在编程、数学和科学等领域的实际基准测试中,它超越了 GPT – 4、Anthropic 的 Claude 等领先模型,在 GPQA 等评估中成绩优异。其内存优势也十分突出,拥有 100 万个 token 的上下文窗口,远超 GPT – 4 的约 12.8 万个 token 和 Claude 3 的约 20 万个 token,且计划翻倍至 200 万。这意味着它可处理整本书籍、大型代码库或数据集,对话时不会丢失线索。