技术核心在于将推理过程内化为模型权重:每次思考的“思维步骤”被提炼并反馈至训练机制,使模型学会识别高效思路,摒弃无效逻辑。旗舰版671B模型在推理任务中超越DeepSeek R1,仅用60%的推理链即达成同等性能;在MMLU、GSM8K基准测试中,其表现与Qwen、Claude等顶级模型比肩。

开源策略方面,开发者可通过HuggingFace下载模型,并借助TogetherAI等API接口调用。企业用户可切换“标准模式”或“深度思考模式”——后者允许模型在内部反思后输出更精准答案,兼顾效率与准确性。Deep Cogito声称,训练所有模型的总成本不足350万美元,较OpenAI同类模型节省超97%开支。