SebastianRaschka用单个JupyterNotebook从零开

蚁工厂 2025-11-24 10:37:40

Sebastian Raschka用单个Jupyter Notebook 从零开始实现 Olmo 3 github.com/rasbt/LLMs-from-scratch/blob/main/ch05/13_olmo3/standalone-olmo3.ipynb“用纯 PyTorch 重新实现 Allen AI 的 Olmo 3 7B 和 32 模型,而不依赖其他外部 LLM 库”。当然这里的“实现”指的不是指从头开始训练生成这个模型,而是在不依赖特定模型库的前提下,利用 PyTorch 原生算子重构 OLMo 3 的神经网络计算图(Computation Graph),并通过自定义的Key Mapping Logic,将预训练的 FP16/BF16 权重张量正确加载到该计算图中,从而构建出一个功能等价的推理引擎。

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注