[CL]《Diffusionisacoderepairoperator

爱生活爱珂珂 2025-08-19 06:17:32

[CL]《Diffusion is a code repair operator and generator》M Singh, G Verbruggen, V Le, S Gulwani [Microsoft] (2025)

Diffusion模型在代码修复领域展现新潜力，通过迭代去噪latent表示，实现“最后一公里”修复与训练数据生成。

• 机制创新：Diffusion模型非一次性生成，而是逐步逆转加噪过程，后期步骤的离散token变化类似于微小修复，能精准定位并改正代码错误。

• 双重应用：

1️⃣ 直接修复：对损坏代码注入噪声后继续扩散逆转，模型自动修复语法错误，Python与Excel修复率达56.4%-68.2%。

2️⃣ 数据生成：从扩散中抽取中间“损坏-修复”代码对，生成多样性和复杂度更高的训练数据，提升下游模型修复性能2.5%-3.5%。

• 多语种验证：实验覆盖Python、Excel公式和PowerShell命令，展示跨语言适用性与修复效果。

• 技术架构：基于CodeFusion，结合Transformer编码器与解码器，训练过程中融合连续表示与离散token交叉熵损失，确保生成代码语法正确且语义合理。

• 性能对比：在小型模型（约6000万参数）下超越Codex等传统模型，展现强大潜力。多噪声水平投票策略进一步提升修复准确率。

• 长尾问题缓解：扩散模型无需人工规则即可生成真实感强、覆盖广泛的错误样本，解决传统数据生成器泛化不足和训练数据匮乏难题。

• 未来方向：结合执行反馈与更大规模模型，潜力巨大；当前限制包括仅支持较短代码片段及缺少语义上下文信息。

Diffusion模型不仅拓宽了代码自动修复的技术边界，也为合成训练数据提供了高质量新路径，是代码智能辅助的重要里程碑。

更多详情👉 arxiv.org/abs/2508.11110

代码修复扩散模型程序生成机器学习人工智能

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

Naveen Naidu彻底从Claude Code转向了Codex，分享日常工

2

Google机器学习工程师面试真题拆解：KV Cache内存爆炸，如何诊断与优化

3

Karpathy 最新项目震撼发布！不到 8000 行代码，完整实现了从训练到推

4

[人人能懂] 从攻防博弈、意念注入到思维诊断你有没有想过，在AI安全的攻防战中，

5

[CL]《Verifying Chain-of-Thought Reasonin

6

[LG]《The Potential of Second-Order Optim

7

[LG]《Design Principles for Sequence Mode

8

[LG]《Transmuting prompts into weights》H

9

[LG]《The Attacker Moves Second: Stronger

10

早！[太阳] 早安

热门分类

科技TOP

1

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

2

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

3

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

4

10月份即将发布的新手机，看看有没有你喜欢的？

5

华为Mate70Pro在某多多上面百亿补贴的价格才四千多？敢不敢买？看上m

6

屏下摄像头直屏、电池最大8000mAh、骁龙8EliteGen5、最大24G

7

哦豁，REDMIK系列提速了。

8

今年mate80是不是还是走mate70路线，11月发布，前期缺货，过几个月供应

9

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

10

台积电创始人张忠谋再次语出惊人，他说：“如果美国想扼杀他们，中国真的无能为力！”

科技最新文章

1

目前华为手机段位榜顶级:MateX6、Mate70Rs非凡大师高端：Mat

2

iPhone17的音质确实强，低音饱满，硬件领先。大家先看iPhone17的扬

3

果然，荣耀一出手就是王炸！

4

我预感红米k90可能会卖爆！这外观设计颜值一点不输小米17系列，再加上旗舰级别

5

苹果这是啥情况？用AppleMusic播放陈奕迅《孤勇者》，一到3分40秒“

6

老美开心了，终于让英伟达倒闭了！刚刚英伟达总裁黄仁勋对外宣布：中方市场份额降

7

2025大杯旗舰汇总，谁是zui强Pro？下半年机圈又是卷疯了啊，各家旗舰都

8

华为Mate80系列11月28号发布？

9

华为Mate80Pro备案颜色曝光自从苹果以换壳为本之后，机圈发布会还值得期待的

10

魏思琪任小米中国区市场部总经理据新浪科技报道，10月17日，小米集团副总裁、CM