[CL]《OnCode-InducedReasoninginLLMs》A

爱生活爱珂珂 2025-09-30 06:57:38

[CL]《On Code-Induced Reasoning in LLMs》A Waheed, Z Wu, C Rosé, D Ippolito [CMU] (2025)

大型语言模型（LLMs）为何“读代码”更聪明？一项覆盖5大模型家族、10编程语言、3,331次微调实验的系统研究揭示了关键：

• 代码结构比语义更关键，尤其在数学和代码任务上，格式破坏（如空白删除）比注释混乱影响更大。

• 抽象表达（伪代码、流程图）同样有效，且用更少token，甚至能提升推理表现，说明模型不依赖具体语法，而是抓取底层结构。

• 模型对表面模式极具鲁棒性，即使代码被故意破坏或注释误导，仍能保持竞争力。

• Python语法更利于自然语言推理，低级语言如Java、Rust则助力数学推理，体现语言风格对任务的适配性。

• 代码数据比例越高，整体推理表现越好，数学任务对此尤为敏感。

心得：

1. 结构化信息是提升推理的核心，简洁明确的代码框架比冗长注释更重要。

2. 适当抽象能减少训练成本，维持甚至提高模型理解和生成能力。

3. 多语言代码混合训练优于单一语言，丰富表达助力模型泛化。

想深挖如何设计训练数据、提升模型推理力？详见研究全文🔗arxiv.org/abs/2509.21499

大语言模型代码推理机器学习人工智能模型微调

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

[LG]《The Sum Leaks More Than Its Parts:

2

[LG]《LiMuon: Light and Fast Muon Optimiz

3

[CL]《Shutdown Resistance in Large Langua

4

[CL]《Scaling Agents via Continual Pre-tr

5

早！[太阳] 早安

6

大型多模态模型进入个性化时代，如何用3-5张图像精准定制专属理解与生成能力？•

7

大语言模型（LLM）正在重新定义推荐系统的边界，显著提升效果同时避免在线推理延时

8

文颜：一款专为多平台内容创作者设计的 Markdown 排版美化工具，极大提升文

9

AI助力软件交付正从代码生成迈向全生命周期优化，真正实现快速、安全与高可靠。新书

10

AI正重塑软件开发，程序员角色正从“编写代码”转向“引导AI协作”。新书《Bey

热门分类

科技TOP

1

微信员工回应新iPhone提示空间不足早之前就有网友出现这个问题，要是还解决不了

2

OPPOFindX9的屏幕，由两条顶级产线共炼：第一条，OPPO独家定制行业

3

翻开王腾过去从业史，在好几家手机品牌都干过，在OPPO从2008年一直到2016

4

离职前，OPPO产品经理莫妮卡与客户网友的同框合影照。莫妮卡不仅漂亮清爽，还亲切

5

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

6

重磅！华为公布多颗新昇腾芯片9月18日，在华为全连接大会2025上，华为轮值

7

4499起步倒不算意外，但小米17Pro是4999起步倒是挺意外的。骁龙8

8

这么一比，谁说FindX9不好看的...OPPOFindX9的官方外观

9

iPhone17，终于亮相。今年的颜色都还不错呀，造型就是跟16基本一样。屏

10

一张X300和X200Promini的背面对比图，可以看到X300的大圆镜头比

科技最新文章

1

不得不说现在的手机更新速度是真的快……我的Magic7到手还没捂热乎，Magic

2

刚看了下10月的新机发布安排，真的是太密集了。10月13日vivoX300

3

荣耀Magic8Pro的真机外观图也释放出来了，感觉整体跟Magic7Pro

4

又一次定价失误的话，友商可不给你任何机会。华为M80要是再飘可就不好说了，产

5

余承东今天是双喜临门，不仅获得晋升，出任IRB主任，鸿蒙系统5终端装机量

6

米17PM：「7500mAh」「6.9英寸」「厚8mm」米15Pro：「61

7

一张X300和X200Promini的背面对比图，可以看到X300的大圆镜头比

8

刚刚在小米之家亲自感受了一下17系列实话实说17系列太有质感了！手感也超级

9

5年过去了，华为旗舰首发依然没有涨价。5年过去了，从mate40到现在的Ma

10

关于华为Mate80系列大家更期待什么？1、麒麟90302、HarmonyO