元旦当天,DeepSeek发表了梁文锋署名的重磅论文,提出了一种「mHC(流形约

飞荷看科技 2026-01-02 10:33:53

元旦当天,DeepSeek发表了梁文锋署名的重磅论文,提出了一种「mHC(流形约束超连接)」的新架构,在27B参数模型上,仅增加约6.7%的训练时间开销,即可实现显著性能提升。去年Deepseek横空杀出,拉开了2025中国AI的大幕,看来今年还是要继续引领2025年的AI春季暴动。

0 阅读:0
飞荷看科技

飞荷看科技

感谢大家的关注