中国大模型的‘瓦特时刻’：深度求索和月之暗面引领技术突破

author 2025-01-31 共52人围观，发现0个评论

近日，中国AI公司深度求索和月之暗面分别发布了其最新的推理模型DeepSeek-R1和Kimi k1.5，在全球AI领域引发轰动。这两款模型被认为是与OpenAI的GPT-o1性能相当的“满血版”，Kimi k1.5更是具备视觉思考能力的多模态模型。

此次发布被许多业内人士看作是中国大模型技术追赶OpenAI的重要一步，象征着大模型这台“蒸汽机”正在寻找属于自己的“瓦特时刻”。DeepSeek和Kimi的模型都使用了强化学习技术，大幅提升了推理效率并降低了资源需求，这与瓦特改进蒸汽机的思路异曲同工。

Kimi k1.5尤其引人注目，其“Long2Short”训练方案在算力和性能之间取得了平衡，解决了以往模型在精简后能力下降的问题，并在多个任务中超越了GPT-4o和Claude 3.5 Sonnet等模型。

更值得关注的是，月之暗面在短短三个月内连续三次突破，迭代速度惊人。这种密集的创新迭代，凸显了中国大模型领域蓬勃发展的态势。

与此同时，中美两国在大模型领域的竞争日益白热化。中国在大模型基础设施建设和模型能力建设上已经抢占先机。未来，中国大模型有望在全球AI领域占据领先地位，而大模型的“瓦特时刻”，也将是中国大模型赢得话语权的时刻。