昨晚饭局上,一位DeepSeek核心工程师酒后直言:梁文锋能入选《自然》2025全球十大科学人物,靠的不是颜值,而是干了件颠覆AI圈的大事——用29.4万美元训出DeepSeek-R1模型! 要知道,OpenAI这类巨头训顶尖模型,光算力就砸数千万美元,而DeepSeek算上基础模型600万美元研发投入,总成本还不到同行零头,性能却能媲美OpenAI的GPT-4 Turbo。这背后是他们独创的“多头潜在注意力”机制,把显存占用压到传统模型1/10,在华为昇腾芯片上成本直降70%。 更绝的是梁文锋的格局,他信奉“AI是全人类基础设施”,不仅公开R1完整权重和技术细节,连53页核心文档都全盘托出。全球10万+开发者蜂拥加入,MIT、非洲贫困实验室都能免费用,腾讯、阿里也跟着搞开放合作。 如今DeepSeek估值飙到1.05万亿元,不过得纠正个小错:它是仅次于字节跳动的中国第二大独角兽,不是满帮。 从浙大高考状元到量化大佬,再到AI颠覆者,梁文锋用开源打破行业壁垒,让初创公司看到希望。这份共享精神,才是中国AI领跑全球的底气! 梁文锋用29.4万美元训出顶尖模型,颠覆了“AI=烧钱堆算力”的行业惯性。其核心不仅是技术创新,更在于以开源打破垄断、用低成本降低行业门槛。 这提醒行业:中国AI要领跑,需跳出“模仿-烧钱”循环,靠底层创新重构规则,用开放生态汇聚全球力量——这才是科技突破的可持续路径。 对此,各位朋友怎么看,留言讨论讨论吧!
