腾讯最新开源了一款基于LLM的文档理解检索工具:WeKnora,可专门用来处理结构复杂的多模态文档

WeKnora可从PDF、Word、图片等不同文档中提取结构化内容,并将其整合到统一的语义视图中

基于LLM理解文档上下文,可以实现精准问答和多轮对话

可以用来构建企业知识库、科研文献分析助手、医疗知识助手、法律法规助手,或者构建知识图谱等

其模块化架构,包括文档解析、向量化处理、检索引擎和大模型推理等,每个组件可以配置扩展

github:https://github.com/Tencent/WeKnora

image.png

image.png

image.png