中美差距到底有多大?梁文锋毫不避讳、一针见血地回答:“表面上中国 AI 与美国可能仅有一两年的技术代差,但真实的差距是原创和模仿之差。如果这个差距不改变,中国永远只能是追随者,所以有些探索是逃不掉的。” 梁文锋说表面上中国AI跟美国就差一两年,但核心问题是原创能力弱,大多在模仿。他在一次访谈中提到,中国企业很多时候是拿美国的开源框架优化调整,比如Transformer这种底层架构基本都来自国外,国内团队就在上面做本土化改进。这就好比别人发明了轮子,咱们就造更好的车子,但轮子的原理不是咱们的。拿DeepSeek来说,他们的模型在中文处理上很强,能精准抓本土表达,但底子还是靠国外路径。要是美国突然收紧开源,中国就容易卡住脖子。他强调,有些原创探索必须硬着头皮上路,不然永远被动。行业里不少人认可这点,因为美国在基础创新上领先,比如谷歌的AutoML能让AI自己设计模型,图像识别准确率高出人工1.2%,效率翻倍。 再看具体差距,美国AI已经在往更深层走,比如斯坦福的虚拟实验室项目,AI能独立组队搞研究,甚至在疫苗设计上给出新方案,效果比人类好。中国这边多停在应用层,像把大模型接进办公软件或电商,提高效率是真,但没触及核心算法创新。梁文锋自己就是个例子,他的DeepSeek团队搞出了MLA架构和DeepSeekMoESparse结构,这些能大幅降计算量和显存用量,训练成本才557.6万美元,对比OpenAI的7800万美元,性价比高多了。但他没自夸,而是提醒大家别被表面繁荣骗了。行业问题在于有些公司太急,国外一出新功能就跟风抄,靠流量赚钱,不愿砸钱搞基础研究。原创需要时间和钱,可能几年没回报,但一旦成就能拉开距离。 DeepSeek的V3模型就是原创实践的成果,这个模型参数规模大,但训练效率高,在数学、代码和中文问答上超过ChatGPT-4o。2025年发布后,直接登顶苹果中国和美国免费APP下载榜,甚至在美国区压过ChatGPT。基准测试显示,V3在AIME数学题上准确率达93.1%,Codeforces评分2386,跟GPT-5一个水平。但成本低得多,这证明了中国团队在资源有限下也能高效创新。梁文锋坚持开源,公布训练细节,想带动整个生态。他觉得中国有大市场、人才和资本,只要转向原创,坚持长期投入,就能缩小差距。反观美国,他们的生态更注重从0到1的突破,像DeepMind的AlphaFold在蛋白质预测上革命性进步,中国还需追赶。 不过,中国AI也不是一无是处,DeepSeek的突破就显示出潜力。V3模型用更少的计算力达到前沿性能,这在全球AI赛道上震动了华尔街。一些分析说,这反映中美差距在缩小,中国从单纯模仿转向部分创新。但梁文锋警告,别太乐观,原创能力还是短板。拿数据看,美国AI专利申请量领先,中国虽多但质量不高,很多是应用型。专家指出,中国自2018年后在AI研究主题上跟美国时间差消失,但原创深度不足。像DeepSeek这样的公司,正在推动从模仿到创新的转变,但需要更多企业跟上。 后续发展看,DeepSeek没停步,2025年后推出V3.2版本,进一步提升推理和代理任务,在基准上匹配甚至超Gemini 2.5 Pro。2026年初,梁文锋署名论文提出mHC架构,解决大规模训练不稳定,只增6.7%成本就提升性能2-3%。公司团队扩到几百人,继续开源,国际影响力大增。DeepSeek的R1和R2模型陆续上线,强化多模态处理,用户反馈在实际场景中响应更准。这不只是一家公司的故事,而是中国AI整体趋势,从依赖国外开源转向自建生态。梁文锋领导下,DeepSeek成了关键力量,推动本土从追随到自立。 美国有硅谷生态,风险投资青睐基础研究,中国则市场驱动强,但原创投入少。报告显示,中国AI投资多去应用,基础研发占比低。美国从2017年后在创新上拉开,但中国正赶上,像DeepSeek用低成本训出高性能模型,证明效率优势。一些观点说,中国AI已从模仿阶段进入创新,但差距还在。梁文锋的话提醒大家,正视问题才能进步。 行业现象是,有些企业抄近路,国外模型一火就模仿变现,不搞底层。DeepSeek反其道行,坚持深耕算法,才做出能抗衡的产品。梁文锋认为,承认差距不是坏事,而是起点。中国AI要想领跑,就得跨原创坎,这坎绕不开,只能冲过去。未来看,随着更多像DeepSeek的公司崛起,中国能在核心技术上突破。
