微博刚发的新模型,有点东西啊参数才15亿,数学测试反超了6710亿的DeepSeek R1。主要是训练只花了7800美元,跟那些烧几百万的模型比,性价比高拉满了。所以说,搞AI不一定非要疯狂堆参数,找对方法其实更管用。当然也不是说小模型就全面碾压了,复杂任务可能还是大模型更强。AI研发正在变聪明,不再只是比谁参数多,而是比谁方法巧。未来,说不定真就是“四两拨千斤”的时代了。

微博刚发的新模型,有点东西啊参数才15亿,数学测试反超了6710亿的DeepSeek R1。主要是训练只花了7800美元,跟那些烧几百万的模型比,性价比高拉满了。所以说,搞AI不一定非要疯狂堆参数,找对方法其实更管用。当然也不是说小模型就全面碾压了,复杂任务可能还是大模型更强。AI研发正在变聪明,不再只是比谁参数多,而是比谁方法巧。未来,说不定真就是“四两拨千斤”的时代了。

作者最新文章
热门分类
科技TOP
科技最新文章