在 AI agent、智能助手与长期记忆需求不断增长的背景下,仅靠传统的检索增强生成 (RAG) 已难以应对“动态数据 + 历史语境 + 时序变化 + 实时更新 + 长期记忆”的复杂需求。Graphiti 正是为了解决这一类问题而设计,它提供一个实时、可增量更新、具备时序语义与图结构查询能力的知识图谱引擎,使 AI agent 能够理解、记住历史并推理变化。
项目地址:https://github.com/getzep/graphiti
一、Graphiti 的定位与设计目标
Graphiti 的核心目标是:
支持动态、不断变化的数据源,无论是用户交互、业务系统数据、外部结构化或非结构化数据,都能持续接入并构造成知识图谱。
维护事实与关系的历史语义,不仅记录当前状态,还保存信息生效或失效的时间,支持点时间查询与历史追溯。
提供高效混合检索,既支持语义检索,也支持关键词和基于图的关系搜索,实现灵活高效的查询。
面向 AI Agent 和智能助手设计,使 agent 能基于图谱记忆、推理、状态管理及跨会话上下文保持。
可扩展、高性能、生产就绪,支持大规模数据、并行处理及多个数据库后端。
Graphiti 由 getzep 开源,以 Apache-2.0 许可发布,为开发者提供灵活可控的时序知识图谱基础设施。
二、Graphiti 的核心组成与关键特性
1. 时序知识图谱模型
Graphiti 不仅存储实体和关系,还为每条关系附加时间元数据,包括事实有效时间和摄入时间。这使得 Graphiti 支持“点时间”查询,例如查询过去某个时间点的状态或历史偏好。
2. 实时增量数据摄入
Graphiti 支持持续将新“episode”注入图谱,无需重建整个图谱。它对新数据和旧数据的合并、冲突与失效处理机制保证图谱的一致性和时序正确性。
3. 混合检索机制
Graphiti 提供多种检索方式,可混合使用:
语义检索:将文本或结构化输入向量化,用于语义相似性查询。
关键词全文检索:进行传统关键词匹配。
图搜索/图算法:利用实体关系、图拓扑结构进行多跳推理。
结合重排序或图距离融合语义与文本,实现更精准结果。
4. 自定义实体类型与灵活本体设计
Graphiti 支持开发者定义域特定实体、关系和结构化 schema,适合业务场景自定义知识图谱结构,例如 CRM 客户实体、订单实体、事件实体等。
5. 可扩展性与多后端支持
Graphiti 支持多种数据库后端,如 Neo4j、FalkorDB、Kuzu、Amazon Neptune 等。用户可根据基础设施、规模和性能要求选择不同数据库,并支持并行处理、多节点分布式部署。
三、Graphiti 与传统 RAG / 文档检索方法的优势
动态数据处理能力:Graphiti 支持实时增量更新,不需批量重建索引。
历史追溯与时间语义:支持时序查询,能够回溯过去状态。
结构化 + 语义 + 图结合能力:支持图结构、实体关系、多种检索方式,为复杂推理提供基础。
可扩展与灵活本体设计:适合不同领域定制复杂知识结构。
适合智能 agent / 长期记忆系统:能够保持跨会话、跨工具的记忆与状态跟踪。
四、典型应用场景
AI 助手 / 聊天机器人 / 对话代理:让 agent 拥有记忆,记录用户偏好、历史对话和长期信息。
企业业务系统整合与历史状态管理:整合 CRM、工单系统、日志系统等,实现跨系统查询和状态推理。
多模态 / 多来源数据融合:统一构建结构化与非结构化数据图谱,同时支持全文、语义和关系检索。
长期记忆 / 历史数据分析:适合金融、客户关系、审计、医疗记录、事件追踪等场景。
自动化 agent / 工作流 agent:基于图记忆执行跨工具任务,实现监控、通知和跨系统操作。
五、优势与潜在挑战
优势:
支持实体、关系、时序、全文、语义和图检索的混合能力
灵活支持自定义本体、多后端和企业级扩展
动态更新,无需批量重建
面向 agent memory、智能助手和多数据融合场景
开源协议友好,社区活跃
潜在挑战:
需要合适的图数据库后端和基础设施维护
初始学习曲线较高,需要设计实体、关系和本体
实时性和数据一致性要求高时,需要处理并发、事务和索引策略
极大规模数据可能需要分片和性能优化
六、总结
Graphiti 是一个面向 AI Agent 和复杂系统的时序知识图谱引擎,突破了传统 RAG 静态文档限制。它支持动态数据摄入、历史语义、混合检索、图结构和自定义本体设计,并可扩展到企业级部署。对于构建具有长期记忆、推理能力、多数据源融合和时间维度理解的智能系统,Graphiti 是一个强大的基础设施选择