英伟达暗示小模型才是未来英伟达小模型四两拨千斤大模型OUT,小模型才是智能体的未

量子位看科技 2025-08-18 20:10:02

英伟达暗示小模型才是未来英伟达小模型四两拨千斤

大模型OUT,小模型才是智能体的未来!

这可不是标题党,而是英伟达最新论文观点:

在Agent任务中,大语言模型经常处理重复、专业化的子任务,这让它们消耗大量计算资源,且成本高、效率低、灵活性差。

相比之下,小语言模型则能在性能够用的前提下,让Agent任务的执行变得更加经济灵活。【图1】

网友的实测也印证了英伟达的观点:当6.7B的Toolformer学会调用API后,其性能超越了175B的GPT-3。

7B参数的DeepSeek-R1-Distill推理表现也已胜过Claude3.5和GPT-4o。【图2】

那么,小模型是如何“四两拨千斤”,放倒大模型的?下面具体来看:

0 阅读:0
量子位看科技

量子位看科技

感谢大家的关注