RAGAnything代码来了全模态RAG突破文本局限
RAG-Anything代码,更新了!
前情提要:这是港大黄超团队开源的一套多模态RAG框架,能一站式处理文档里的文字、图表、表格、公式、图像等各种内容,让AI真正“看懂”复杂文档。()
而就在最近,RAG-Anything更新了一系列代码示例。
场景举例:
- 科研论文:支持复杂图文+数学公式混排,能把表格和图的结论提炼成一句话解释。
- 财务报告:能抓出Excel里的关键数据表,结合正文自动总结业绩趋势。
- 教学内容:上传PPT+手写板书截图也能提问回答,“这个图讲了什么”“这个公式怎么算”都不在话下。
安装方面,可以用PyPI直接装,也支持uv环境一键拉库。
项目地址:github.com/HKUDS/RAG-Anything