知识图谱与图数据库Neo4j--Part01
River / 2024-11-16
知识图谱
{ 此Part较枯燥, 看不下去可以直接看Part02–> 知识图谱与图数据库Neo4j–Part02 }
1. 什么是知识图谱
- 基本概念: 知识图谱是一种结构化的语义知识库, 用于快速描述物理世界中的概念及其相互关系. 它通常以图形结构的方式来直观展示实体(对象, 事件, 状况或概念)及其关系. 知识图谱的基本组成为: “实体—->关系—->实体”三元组, 这些信息常常存储在图形数据库中.
- 直观描述: 知识图谱本质为存储实体之间的复杂关系,并让资源更易于计算,理解和评价
- 目前的应用:
- 搜索结果优化
- 电商智能推荐与智能客服
- 金融风控分析
- 公安情报分析与反欺诈
- 自然语言分析
- …
- 组成: 知识图谱由模式层和数据层两部分组成. 1).模式层: 存储着经过提炼的知识 2).数据层: 存储着事实
2. 知识图谱的原始数据类型和存储方式
- 原始数据结构: 知识图谱的原始数据结构一般来说有三类:
- 结构化数据(关系型数据库, 链接数据等)
- 半结构化数据(XML, JSON, 百科等)
- 非结构化数据(图片,音频,视频等)
- 存储方式:
- 通过RDF(资源描述框架)这样的存储格式来存储, 比如Jena
- 使用图数据库来存储, 常用的有Neo4j
下一Part介绍Neo4j: Part02