概念

知识图谱(Knowledge Graph, KG):将知识进行结构化表示。具体来说,知识图谱是一种以实体(Entity)和关系(Relation)为核心的语义网络,通常以三元组 (head entity, relation, tail entity),即 ⟨h, r, t⟩ 的形式表示结构化知识。

核心组成

  • 实体(Entity):现实世界中具有唯一标识的对象,如人、地点、公司等。
  • 关系(Relation):实体之间的语义连接,如“属于”、“位于”、“担任”。
  • 属性(Attribute):实体的静态信息,如“出生日期”、“公司市值”。
  • 本体(Ontology):定义实体类别、关系类型及其约束的元知识结构。

发展

大模型时代之前:知识图谱是主力军

在传统NLP时代(大约2010-2020),模型的表达能力有限,缺乏世界知识、语义理解和推理能力。此时知识图谱被广泛用于补足模型缺陷:

任务 知识图谱的作用
语义搜索 弥补关键词搜索的不足,实现“概念级”搜索
问答系统 结构化知识可支持精确匹配和逻辑推理
对话系统 用于保持上下文一致性,引导对话流程
推荐系统 提供“语义关联”的物品推荐路径

🔧 技术特点:

  • 依赖大量人工/半自动构建
  • 常与规则系统、逻辑推理、图数据库(如 Neo4j)结合
  • 强调显式语义建模与可解释性

大模型时代之后:知识图谱成为增强模块

从2020年起,GPT、BERT、T5等大模型逐渐成为NLP核心技术,具备了知识记忆和语言理解能力,这改变了知识图谱的定位。

大模型不再依赖知识图谱来“表达知识”,但知识图谱依然发挥关键辅助作用:

新任务场景 知识图谱的新作用
RAG(检索增强生成) 知识图谱可作为精确语义检索源,提高LLM回答准确性
知识注入(Knowledge Injection) 将KG中的知识融入大模型表示中,提升对低频或稀疏知识的理解
知识校验与纠偏 为大模型生成内容提供事实检查、增强可解释性
对话Agent结构规划 在多轮对话中,KG用于理解实体之间的语义路径和对话意图管理
Few-shot Prompt Design 从KG中提取结构化样例或提示,辅助prompt工程