港大新作：多模态RAG，支持图、文、表、公式等8种文档格式

charles

本公众号主要关注NLP、CV、LLM、RAG、Agent等AI前沿技术，免费分享业界实战案例与课程，助力您全面拥抱AIGC。

RAG-Anything能处理和查询包含文本、图像、表格、公式等多模态内容的复杂文档的图RAG。

是在LightRAG基础上扩展的，LightRAG也真是火爆17.8K星了。

RAG-Anything继承了LightRAG架构，整体如下：

港大新作：多模态RAG，支持图、文、表、公式等8种文档格式

文档解析阶段

集成 MinerU 文档解析框架
自动识别并提取文档中的文本块、图像、表格、公式等异构元素，保持元素间的语义关联关系。
支持PDF、Office文档系列（DOC/DOCX/PPT/PPTX/XLS/XLSX）、图像等主流格式的统一处理与标准化输出。

多模态内容理解与处理

通过自主分类路由机制实现异构内容的智能识别与优化分发。
自动识别、分类并将不同内容类型路由至优化的执行通道。
通过专用处理流水线实现文本和多模态内容的并发执行。这种方法在保持内容完整性的同时最大化吞吐效率。

多模态分析

为自定义和新兴内容类型提供可配置的处理框架
通过插件架构实现新模态处理器的动态集成
支持专用场景下处理流水线的运行时配置

高精度解析复杂数学表达式和公式
提供原生LaTeX格式支持以实现与学术工作流的无缝集成
建立数学方程与领域特定知识库间的概念映射

对表格和结构化数据格式进行系统性解释
实现数据趋势分析的统计模式识别算法
识别多个表格数据集间的语义关系和依赖性

图像分析和内容识别
视觉语义生成上下文感知的描述性标题
提取视觉元素间的空间关系和层次结构

视觉内容分析,包括：
结构化数据分析
数学表达式解析
可扩展模态

创建多模态知识图谱

多模态实体提取：将重要的多模态元素转换为结构化知识图谱实体。该过程包括语义标注和元数据保存。
跨模态关系映射：在文本实体和多模态组件之间建立语义连接和依赖关系。通过自动化关系推理算法实现这一功能。
层次结构保持：通过”归属于”关系链维护原始文档组织结构。这些关系链保持逻辑内容层次和章节依赖关系。
加权关系评分：为关系类型分配定量相关性分数。评分基于语义邻近性和文档结构内的上下文重要性。

多模态检索

向量-图谱融合：集成向量相似性搜索与图遍历算法。该方法同时利用语义嵌入和结构关系实现全面的内容检索。
模态感知排序：实现基于内容类型相关性的自适应评分机制。系统根据查询特定的模态偏好调整排序结果。
关系一致性维护：维护检索元素间的语义和结构关系。确保信息传递的连贯性和上下文完整性。

https://github.com/HKUDS/RAG-Anything/tree/main

推荐阅读

效率提升30%，Token减少 98%！LightPROF加速GraphRAG落地
港中大&华为云联合突破！首次提出GraphRAG统一框架
DeepSeek过度思考「自省式推理」登顶多跳问答榜” data-itemshowtype=”0″ linktype=”text” data-linktype=”2″>清华ReaRAG，严防Deepseek过度思考「自省式推理」登顶多跳问答榜
微软再放大招！成本直降99.9%！：LazyGraphRAG「实时分析」秒级落地！
Alibaba首创：多模态混合检索+多智能体RAG
GraphRAG性能拉胯，DeepSearcher开箱即用
Alibaba新年首秀RAG，千万别错过~
GraphRAG落地难，微软工业级RAG+Agent实施方案
必读！RAG好用的3种Router
1.2kStar RAG2.0具备超长记忆，实现全局检索

前沿技术新闻资讯

AI Agent 的发展：能力、技术架构和软硬件形态

2025-7-1 12:37:15

前沿技术新闻资讯

ZeroSearch：在不进行搜索的情况下激励大语言模型的搜索能力

2025-7-1 13:47:40

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

购物车

优惠劵

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部