近日,中国AI公司深度求索和月之暗面分别发布了其最新的推理模型DeepSeek-R1和Kimi k1.5,在全球AI领域引发轰动。这两款模型被认为是与OpenAI的GPT-o1性能相当的“满血版”,Kimi k1.5更是具备视觉思考能力的多模态模型。
此次发布被许多业内人士看作是中国大模型技术追赶OpenAI的重要一步,象征着大模型这台“蒸汽机”正在寻找属于自己的“瓦特时刻”。DeepSeek和Kimi的模型都使用了强化学习技术,大幅提升了推理效率并降低了资源需求,这与瓦特改进蒸汽机的思路异曲同工。
Kimi k1.5尤其引人注目,其“Long2Short”训练方案在算力和性能之间取得了平衡,解决了以往模型在精简后能力下降的问题,并在多个任务中超越了GPT-4o和Claude 3.5 Sonnet等模型。
更值得关注的是,月之暗面在短短三个月内连续三次突破,迭代速度惊人。这种密集的创新迭代,凸显了中国大模型领域蓬勃发展的态势。
与此同时,中美两国在大模型领域的竞争日益白热化。中国在大模型基础设施建设和模型能力建设上已经抢占先机。未来,中国大模型有望在全球AI领域占据领先地位,而大模型的“瓦特时刻”,也将是中国大模型赢得话语权的时刻。