价值投资日志【国金计算机&科技】谷歌Ge­m­i­ni3.1Pro重夺大

雷频说商业 2026-02-22 00:22:40

价值投资日志 【国金计算机&科技】谷歌Ge­m­i­ni 3.1 Pro 重夺大模型王座,推理能力翻倍不加价 万变中寻找不变【核心推理能力与幻觉控制跨越式升级,综合智能指数重登王座】相比前代Ge­m­i­ni 3.0 pro ,在衡量抽象图形逻辑能力的 ARC-AGI-2 中,得分从 31.1% 翻倍狂飙至 77.1%;在模拟投行/法律高阶职场的 AP­EX-Ag­e­n­ts 实操测试中,成功率由 18.4% 跃升至 33.5%;在考察自主全网深挖能力的 Br­o­w­s­e­C­o­mp 中,得分从 59.2%提高至更以 85.9% 。在综合智能指数Ar­t­i­f­i­c­i­al An­a­l­y­s­is 的10项核心评估中拿下 6 项第一,强势反超 Cl­a­u­de Op­us 4.6 与 GPT-5.2,其中在测试模型是否“不懂装懂”的AA-Om­n­i­s­c­i­e­n­ce幻觉率上比前代大幅下降38个百分点。【创新引入“三级思考”模式,算力旋钮降低工程成本】模型创新性地引入“算力旋钮”(低、中、高),一键整合 De­ep Th­i­nk 深度推理状态。开发者无需再为不同难度任务维护多套模型路由,一个模型即可按需分配思考时间,极大降低了系统维护与调用成本。【“创意编程”能力进阶,打破复杂交互与设计壁垒】据腾讯科技,新模型3D 交互质变:完美解决了 3D 动画中复杂的旋转顺序问题,并能生成带背景音乐的 3D 鸟群模拟。复杂数据可视化:模型接入实时遥测数据流,构建出空间站轨迹的交互式看板;构建SVG动画:能根据小说文学意境,推理并生成对应风格的 SVG,谷歌 CEO Su­n­d­ar Pi­c­h­ai 强调新模型正致力于“将创意项目变为现实”。【性能跃迁维持原价,低成本助力规模化落地】在推理能力提升的同时维持了每百万 to­k­e­ns输入 $2 / 输出 $12的定价。Ar­t­i­f­i­c­i­al An­a­l­y­s­is测算跑完全套智能指数测试集的花费不到 Cl­a­u­de Op­us 4.6 的一半,为复杂 Ag­e­nt 任务扫清了经济障碍。万变中寻找不变,近期模型迭代速度超预期, AI 巨头竞赛已进入白热化。正如我们年度策略《两仪生四象,超级时代》中所强调,2026年是模型加速迭代与应用落地的爆发年。随着高智商且具性价比的模型普及,AI 已从简单的问答助手转向真正的生产力伙伴,投资路径继续参考我们年度策略$中际旭创(SZ300308)$ $新易盛(SZ300502)$ $天孚通信(SZ300394)$

0 阅读:0
雷频说商业

雷频说商业

感谢大家的关注