【东吴电子陈海进】DeepSeek-V3.2-Exp发布,长文本AI效率跃升,产

丹萱谈生活文化 2025-09-30 05:49:10

【东吴电子陈海进】DeepSeek-V3.2-Exp发布,长文本AI效率跃升,产业链协同加速 📕事件:北京时间9月29日,DeepSeek-V3.2-Exp 发布。 📍DeepSeek-V3.2-Exp 模型发布:长文本效率显著优化。 DeepSeek正式推出V3.2-Exp模型,作为迈向新一代架构的关键中间步骤。新版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,在几乎不影响模型输出质量的前提下,大幅提升长文本训练和推理效率,并已在官方App、网页端、小程序同步更新。价格方面,DeepSeek对API价格进行超过50%的下调。模型与论文均已在HuggingFace等平台开源,同时开放了TileLang与CUDA两类GPU算子以支持社区快速迭代。 📍寒武纪与昇腾实现适配、软硬件协同优化推理性能。 👉寒武纪已在第一时间实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源码,开发者可在寒武纪软硬件平台率先体验新模型。 👉昇腾同样在开源发布即完成BF16模型部署,128K长序列下可实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新引入的算子,昇腾完成流水优化,并推出相关编程体系以简化算子开发。 🧧投资建议 #云端算力 继续强call国产算力五大天王【寒武纪】【海光信息】【芯原股份】【盛科通信】【兆易创新】 风险提示:市场竞争,需求,地缘政治风险等

0 阅读:5
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注