RiverMao

从未来再见

知识图谱与图数据库Neo4j--Part01

River / 2024-11-16


知识图谱

{ 此Part较枯燥, 看不下去可以直接看Part02–> 知识图谱与图数据库Neo4j–Part02 }

1. 什么是知识图谱

  1. 基本概念: 知识图谱是一种结构化的语义知识库, 用于快速描述物理世界中的概念及其相互关系. 它通常以图形结构的方式来直观展示实体(对象, 事件, 状况或概念)及其关系. 知识图谱的基本组成为: “实体—->关系—->实体”三元组, 这些信息常常存储在图形数据库中.
  2. 直观描述: 知识图谱本质为存储实体之间的复杂关系,并让资源更易于计算,理解和评价
  3. 目前的应用:
    • 搜索结果优化
    • 电商智能推荐与智能客服
    • 金融风控分析
    • 公安情报分析与反欺诈
    • 自然语言分析
  4. 组成: 知识图谱由模式层和数据层两部分组成. 1).模式层: 存储着经过提炼的知识 2).数据层: 存储着事实

2. 知识图谱的原始数据类型和存储方式

  1. 原始数据结构: 知识图谱的原始数据结构一般来说有三类:
    • 结构化数据(关系型数据库, 链接数据等)
    • 半结构化数据(XML, JSON, 百科等)
    • 非结构化数据(图片,音频,视频等)
  2. 存储方式:
    • 通过RDF(资源描述框架)这样的存储格式来存储, 比如Jena
    • 使用图数据库来存储, 常用的有Neo4j

下一Part介绍Neo4j: Part02