当前位置:首页 > 娱乐

pronoun 产品经理的知识图谱入门实操

知识地图总结了知识地图的构建。用户可以使用自然语言查询相关信息,这更符合人们的思维方式,从而帮助用户更快地找到所需信息。目前,除了搜索引擎,知识地图还广泛应用于社会、金融、教育、医疗等领域。接下来,我们详细介绍了知识地图的技术要点。

1.1什么是知识图谱

人工智能的最终目的是让计算机以人类的思维方式解决问题,实现智能化,解放人类的脑力,让人们的生活更加便捷高效。虽然自20世纪90年代以来,互联网技术已经蓬勃发展了30年,但计算机的能力远远没有达到人们期望的智能水平。根本原因在于计算机存储和使用数据的方式与人们思考问题的方式有本质区别。

目前以网页为主要载体的互联网信息是由字符串、数组等半结构化数据类型组成的超文本链接。对于计算机来说,任何用文字表示的信息都是由0和1组成的二进制字符串,区别只在于文本存储的大小空。文字表达的语义信息是计算机无法理解的。

然而,人们可以从不同的单词中解释不同的信息,因为人们可以理解不同单词的不同含义,并且可以根据一些规则推理单词之间的关系。

举一个简单的例子,当我们读到文字“他儿子今年出生”时,可以推断出文字中的“他”应该有妻子,也就是他儿子的母亲,他儿子现在的年龄是0岁。虽然这个信息没有用文字表达清楚,但是可以从常识中推断出来,我们称之为“知识”。

那么,计算机有没有可能理解这些词的真正含义,像人类一样通过知识来理解和推理这些信息呢?

万维网之父蒂姆·伯纳斯·李曾经说过:“我有两个梦想:第一个是连接世界上的每一个人。现在这个梦想已经通过互联网实现了,第二个梦想是连接世界上的一切。这个光荣的使命就交给语义网了。”

到目前为止,这项技术已经经历了语义网络、本体、语义网络、链接数据和知识地图几个阶段。

2012年,谷歌首次将知识地图技术应用于搜索引擎,以提高其搜索能力。以前不使用知识地图技术时,用户搜索某个信息,搜索引擎会将搜索到的关键词与网站的文字进行匹配,根据匹配程度显示相应的网页信息。所以,如果用户想知道一个问题的答案,却不知道该搜索答案的关键词是什么,往往就找不到自己想要的结果。

但引入知识地图后,引擎会根据知识地图显示相关信息,用户可以使用自然语言进行搜索。搜索引擎分析用户的问题后,根据知识图谱查询相应的结果。从此,知识地图在产品中的应用正式开始。

现在各大搜索引擎都会根据知识图谱显示搜索内容。比如在百度搜索“中国首都”,搜索结果会直接显示与“北京”相关的百度百科信息,如图。

通过知识地图的构建,用户可以使用自然语言查询相关信息,更符合人们的思维方式,从而帮助用户更快地找到所需信息。目前,除了搜索引擎,知识地图还广泛应用于社会、金融、教育、医疗等领域。接下来,我们详细介绍了知识地图的技术要点。

1.2对象、实例和RDF知识表示

首先,我们需要知道如何描述一个“知识”。在前一章中,我们提到了数据有三种类型,即名义数据、注册数据和连续数据。但并不是日常生活中的所有事情都可以用这三种数据类型来描述,比如一个人,一张图片,一个视频。这些东西应该怎么描述?这里用的是面向对象的概念。

对象是什么?我们刚才提到的一个人,一张照片,一个视频,都可以称之为物体。该对象包含各种属性,如一个人的姓名、年龄和身高。每个人都有这些属性,但是属性的值可能不同。当我们可视化属性的值时,我们可以定义一个特定的人,例如张三,那么张三被称为这个对象的一个例子。

如图所示:

对于对象,如果它们之间存在包含关系,则称为父类对象和子类对象。比如把人看成一个客体,可以进一步细分为男性和女性,那么人就是男性的父客体,男性就是人的子类客体,张三就是男性子类客体的一个例子。如图所示:

了解了对象、类、实例之间的关系之后,就可以进入知识地图的话题——知识表示。按照Web技术领域的权威标准组织W3C规定的知识地图描述标准,所有的知识都要用资源描述框架(rdf)来描述,并定义其他与知识地图相关的技术,如图:

RDF中的r表示任何具有统一资源标识符(URI)的资源,如页面、图片、视频等。,d表示属性,即特征和资源的关系,f表示模型和描述语法。简单来说,每一个RDF知识表达都可以以主谓宾语句的形式出现,比如{中国,首都是北京},其中“中国”和“北京”是两个实体,“首都是”则表示两个实体之间的关系。

在RDF中,总是有两个实体以及两个实体之间的关系,所以RDF也被称为三元组,如图:

需要注意的是,每个RDF实体都必须由一个唯一的URI来标识,但是RDF也允许空白节点的存在,实体资源也可以允许匿名资源的存在,也就是说它们不标识具体的资源,而只标识资源的类型作为连接其他实体的桥梁。

RDF虽然是知识地图的基石,但是它描述事物的能力非常有限。根据RDF的定义,我们可以发现RDF三元组中的两个实体具有唯一的身份,因此它们缺乏概括和抽象的能力,不能定义和描述同一类别的事物。比如我们可以用RDF来形容北京是中国的首都,但是如果要总结所有国家与首都的关系及其属性,仅靠一个实例的RDF是无法实现的。

知识的泛化能力对于知识地图的智能化至关重要。只有具备总结抽象知识的能力,才能覆盖更广的知识范围。那么如何解决RDF的这个问题呢?

前面我们解释了父类、子类和实例之间的关系。对于RDF来说,知识可以通过相似的结构来概括,这就是我们接下来要讲的本体语言——RDFS和OWL。

1.3 RDFS和OWL本体语言

RDFS是最基本的本体语言,其中S代表Schema,可以表示一些实例的抽象属性。具体来说,表中显示了包含的核心词汇:

比如我们可以用。如图,中国是国家的例子,北京是城市的例子,城市和国家都是区域的子类。RDFS能够清楚地区分类与实例之间的层次关系,并通过类之间的关系推断出更多的知识。

在这个例子中,我们可以推断出一个国家的首都是某个城市的知识,这样我们就可以概括出所有国家和首都城市的关系。这种知识的泛化是语音智能答疑产品中非常重要的技术,我们将在后续文章中详细讲解智能答疑产品。

虽然RDFS可以表达一些简单的语义,但在更复杂的场景中,RDFS的语义表达能力太弱,其表达知识的能力仍然存在缺陷,缺乏许多共同特征。

例如,对于局部值域的属性定义:RDFS通过rdfs:range定义属性的值域,它是全局的,但当属性应用于某些特定的类时,不能表达特殊的值域限制;无法指示是否有多个类;实例和属性是否等价;无法指示多个类是相交的还是互斥的;无法约束某些属性值的值范围;不能说有些属性是传递性和功能性的。

由于RDFS不能很好地满足知识表示的要求,W3C于2002年发布了OWL(网络本体语言),作为RDFS的扩展,并将其作为语义网中本体表示的推荐语言。目前OWL已经迭代到OWL2,原OWL也叫OWL1。

与RDFS相比,OWL扩展了很多描述属性,弥补了RDFS的不足,如增加了等价声明、传递关系声明、对称性、数值约束等。以下是主要的核心描述词:

除了上面的列表,OWL还有很多属性描述词。构建知识图谱时,需要知道这些属性词,并具备相关领域的专业知识,才能正确描述知识的特征。如果需要了解更多OWL相关描述,可以通过W3C官方文档查看。

2.知识地图构建过程2.1知识建模

知识地图可以分为两种类型:通用知识图(GKG)和特定领域知识图(DKG)。行业知识图又称领域知识图,因为它使用的场景是一个特定的领域。虽然都是知识地图,但是在知识表示、知识获取、知识应用等方面都有很大的不同,如下表所示。

第一,从知识广度来看,一般知识图谱涵盖的知识范围很广,主要涵盖日常生活中的常识性问题。比如Google搜索引擎的知识地图,就是一张涵盖所有领域的通用知识地图,2012年发布时包含了5亿多个实体,10亿多个关系。典型的中文通用知识图谱是复旦大学知识工场实验室开发维护的大型通用领域中文百科知识图谱(CN-Dbpedia)。该项目包含900多万个实体信息和6700多万个三重关系,在问答机器人、智能玩具、智能医疗和智能软件领域产生了3.5亿个API调用。

行业知识图谱的广度通常比较窄,一般只覆盖某一专业领域的相关知识。目前除了搜索引擎和语音助手使用的知识地图,大部分知识地图项目都是行业知识地图。典型的应用有,比如美国Palantir公司的政府领域知识地图,GeoNames的全球地理知识地图(数据库中有近200种语言的1100万个地名和200万个别名),中国包括中医养生和中医美容在内的中医知识服务系统,如图。

第二,从知识深度来看,一般知识图谱的层次体系一般都比较浅,通常没有太多的知识泛化,这与一般知识图谱获取知识的方式有关,也与一般知识图谱的使用场景有关,大部分都是基于一个特定的实体。然而,行业知识图谱的层次体系普遍较深。比如,在电子商务领域的商品分类中,服装的分类不仅仅是上衣和下装那么简单,各种款式、时尚元素、款式和材质都可能构成不同的类别。

再次,从知识粒度来看,一般的知识地图粒度一般比较粗,而行业知识地图粒度一般比较细。在一般知识图谱中,知识的基本单位一般是一个完整的文档或资源,比如一篇文章、一首歌、一段视频等等。但是对于行业知识图,需要的粒度要根据不同的业务划分成更细的粒度。以教育领域的知识图谱为例,一个数学公式、一节语文课中的一句话、一个英语单词,都可能构成一个独立的知识实体,以满足学生个性化学习的需求。

由于通用知识地图和行业知识地图的应用场景差异很大,这两种知识地图的知识获取方式有显著差异。对于知识获取方法,根据人类参与程度的不同,可以分为自上而下和自下而上的方法。

具体来说,大多数行业知识地图采用自上而下的知识获取方法,由领域专家手工整理归纳知识,编辑成知识地图的数据结构。

这种方法的优点是能够满足产品专业、权威知识的要求。比如医学领域的知识图谱对专业知识有严格的要求,必须由具备相关能力的专家进行编辑。同时,手工编辑也可以将知识地图设计的概念和范围限制在可控范围内。

比如实体“古龙”如果在文学的知识图谱上,代表一个作家,但如果在美容化妆品的知识图谱上,则代表一种香水。如果不限制知识图谱的应用范围,很可能会产生歧义。

专家参与编辑使得行业知识图谱具有较高的准确性,但也带来了诸多弊端。第一,人工成本高。通常,需要建立一个专家团队来编辑知识地图。团队成员需要同时具备领域知识和计算机知识。劳动力市场上能符合条件的人很少,劳动力成本居高不下。

根据相关数据,谷歌编辑一个RDF三元组的平均人工成本为0.8美元。如何在一个项目中做到成本与效果并重,是每一个制作知识图谱的产品经理都应该思考的问题。

另一个缺点是行业知识图谱中可能存在多个数据编辑器或数据源,导致数据格式不一致。这个数据术语叫做多源异构数据。如何制定相关规则,将不同格式的数据转换成统一的格式,也是产品经理在定义数据处理规则时需要考虑的问题。

通用知识地图大多采用自下而上的方法获取知识,基于现有的行业标准数据库,或者从现有的优质数据源中提取知识本体和本体之间的关系,主要用于搜索、推荐、问答等业务场景。

由于它强调知识的广度,数据主要来自互联网上的公共信息,很难生成完整的整体本体层进行统一管理。然而,由于知识获取的高度自动化,一些新概念和新关系可以很好地被覆盖。

从知识应用的角度来看,一般知识图谱的知识相对稀疏,因此知识推理链较短。一般来说,推理操作都是基于一两步的上下文推理。超过这个就容易产生语义漂移,使推理结果变得无关紧要,人工智能就变成了人工智障。而行业知识图谱的推理链可以更长,更适合需要复杂推理计算的场景。

2.2结构化和半结构化知识获取

知识是从不同的来源和不同结构的数据中提取出来的,并存储在知识地图中。这个过程叫做知识获取。从知识来源来看,大致可以分为三类,即结构化数据转换、半结构化数据抽取和非结构化文本数据抽取。

比如,[李明]怕高妈妈在家寂寞,就[他]把家里的电视搬走了。

指示代词

比如【很多人想为孩子创造一个美好的世界】,【这个】可以理解,但不完全正确。

有明确的描述(明确的描述)。

例如,[贸易制裁]似乎是美国政府在对华关系中使用的大棒。然而,这根棍子真的像美国政府希望的那样有效吗?

回指消解的基本原理是先构造一个先行候选集,然后从多个候选中选择一个。代表性的方法是霍布斯在1998年提出的朴素霍布斯算法,它是一种基于解析树的搜索,可以通过遍历橙子的语法数来判断单词之间是否可以互相替换,另一种参考消解方法是Grose和Sidner在1983年提出的Center Theory。

这种方法认为文本中的描述应该是连贯的,通过语义连贯可以找到文本中的相关实体。但这两种方法只适用于指称代词和被指称代词距离较近的回指情况,在实际应用中有一定的局限性。

目前,回指消解的最新研究成果是2017年的端到端神经共指消解。其基本原理是找出一个句子中已经出现的所有命名实体和代词,构造它们所在句子的特征向量,计算词与词之间的特征向量,然后将代词和实体成对匹配,计算共指匹配的分值,从而实现回指消解。

虽然回指消解问题经历了多年的研究和发展,但到目前为止,大部分研究成果仍然是关于回指的,没有更好的全自动回指消解技术和方法,需要专家学者进一步研究。

(4)关系抽取

识别实体之间的语义关系是知识抽取的核心任务。只有通过关系把实体联系起来,形成RDF三元组,才能形成知识网络。比如王思聪是万达集团董事长王健林的独子,可以提炼出两套三重例子(王思聪,父子关系,王健林)和(万达集团,董事长,王健林)。

关系抽取的最早任务可以追溯到1998年。当时,触发词作为关系识别的基础,然后填充关系模板槽,提取文本中的具体关系。比如将关键词“Chairman”构造成X这样的模板,董事长为y,随着机器学习算法和深度神经网络算法的发展,越来越多的研究将关系抽取作为一项分类任务。

比如采用半监督学习的自举方法,反复迭代“模板生成→实例提取”的过程。首先给出一个种子实体的文本集,例如,然后从文本中提取包含种子实体的文本,例如,以便提取这个关系,然后用新发现的关系模板提取更多新的三重实例,X的所有大写以Y的格式匹配..在这个过程中,会发现除了资本,X和y之间可能还有其他关系,通过反复迭代,不断提取新的实例和模板,直到再也找不到合格的关系位置。

这种方法的优点是构建成本低,适合大规模的知识库构建。同时可以发现一些非手工定义的隐藏关系。但是在实际使用中存在很多问题。最常见的问题是迭代过程中容易出现噪声例子和模板,出现语义漂移,导致准确率低。

还有一点就是关系不是手工定义的,导致关系语义不规范。同一关系可能有多种不同的表达方式,例如“资本是”也可以表示为“资本位于”、“设定为资本”等。这些表达其实是同一种关系。如何对这些自动发现的关系进行聚类是目前尚未解决的问题。

关系抽取的质量决定了知识地图中知识的规模和质量。除了上述基于模板匹配和半监督学习的方法,使用监督学习的管道和LSTM-RNN算法也是流行的方案。

(5)事件提取

事件抽取可以看作是关系抽取的增强版本,它以结构化的形式呈现文本中的事件。事件提取的第一步是识别事件及其类型,然后识别事件中涉及的属性,最后确定每个元素与事件本身之间的关系。

以金融领域的投融资领域知识图谱为例,实际抽取的过程是先定义一个事件的触发词,即在事件引用中最能代表事件发生的词,通常是动词或名词。然后定义事件的主体元素及其相应的属性。然后根据属性找到对应的值。如图。事件的触发词是“融资”,事件的主体是“自由”。与该活动相关的属性包括融资轮次、募集资金、主要投资者、后续投资者和投资前估值。

事实上,事件的主体与其他属性之间可以构建一对多的多元关系,如上图所示,本质上由六个三元组组成。每三重的主体是触发事件,谓词是融资事件的属性,客体是提取的价值。

我们知道知识地图可以分为一般知识地图和领域知识地图,事件提取也可以分为适用于一般知识地图的开放领域事件提取和适用于领域知识地图的有限领域事件提取。上述金融领域融资事件的提取是一种有限域事件提取。

对于领域有限的事件提取,由于目标明确,通常会提前定义目标事件的类型和每种类型包含的具体事件元素,并给出一定量的人工标注数据作为训练集特征,然后进行模式匹配或机器学习。

开放领域的事件提取主要基于无监督方法和分布式假设理论,因为在事件识别之前,可能的事件类型和事件结构是未知的。也就是说,如果候选事件触发器或候选事件元素具有相似的上下文,这些候选事件触发器往往会触发相同类型的事件。

总之,虽然从非结构化文本数据中提取知识已经经历了多年的发展,但每个子任务中仍有许多未解决的问题有待专家学者进一步研究。

提示:在一些关于自然语言处理的研究报告中,实体提取和实体消歧相遇并被称为实体链接(Entity Linking),或者实体链指的是任务。

2.4知识融合

我们上面已经介绍了知识地图的各种数据源,但是从这些数据源中提取的知识是广泛的,知识的质量可能是混合的,可能有数据的重叠部分,所以需要融合知识,统一和规范来自不同数据源的知识,形成高质量的知识库。在不同的文献中,知识融合可能有不同的名称,如本体对齐、本体匹配、实体对齐等,本文称之为知识融合。

知识融合主要有三种类型:

第一种是同一个实体有多种不同的表达方式,例如鲁迅原名是周树人,字豫才,对于这些不同的名称都需要规约到同一个实体下。另一种是同一种表达在不同的语境下可能指代的是不同的实体,即一词多义,例如“苹果”有可能是指美国苹果公司,也有可能是指水果。第三种是跨语言的知识融合,同一个实体在不同的语言或地区可能有不同的命名,例如腾讯公司的英文是Tencent。

在实践中,知识融合是数据预处理不可缺少的一部分。知识融合的质量直接决定了知识库的质量和知识地图项目的成功。

最基本的知识融合方法是知识卡融合,即上述百科网站的信息框信息。不同的百科网站可能对同一实体的描述不同,因此可以在不同的百科网站中搜索和查询同一实体,并将查询信息合并到一个规范化的知识卡中,完成知识融合。

但是对于绝大多数的知识融合来说,并不是知识卡的融合那么简单。我们知道不同的本体实例是由它们自己的属性决定的。如果两个不同的实体具有相同或相似的属性,那么我们可以根据一定的规则来融合这些实体。因此,需要判断实体是否是同一个实体,实体的属性是否相似。属性的相似性决定了实体的相似性。

知识融合的过程通常分为四个步骤:数据预处理、数据预分组、属性相似度计算和实体相似度计算。

数据预处理

统一不同数据源的数据,比如去掉标点符号,洗掉脏数据等。这一步通常需要手动完成,相关方法可以参考前一章的数据预处理部分。

数据预分组

这一步主要是为了加快知识融合的效率,降低计算的难度。如果不进行分组,后续的实体比较过程将需要大量的计算。常用的数据分类方法可以按照产品经理指定的类型进行分组,也可以通过无监督聚类或者机器学习的监督分类进行分组。

属性相似度计算

根据不同的数据类型需要不同的方法。如果融合的数据对象是纯字符串类型的数据,我们可以使用levenshtein距离,这是一种度量两个字符串相似度的算法,指的是插入、删除、替换等操作的最小次数。两个字符串之间,需要从字符串A转换到另一个字符串b,操作越少,两个字越相似。

如果要融合的数据是集合类型,可以用jaccard相似系数计算,公式如下:

两个集合A和B的交集元素个数在A和B并集中的比值称为jaccard系数。jaccard值越大,相似度越高。如果两个集合完全一致,则相似度为1。相似余弦相似度也可以用来计算集合类型数据。

如果是整个文档类型的数据,可以通过TF-IDF算法找出文档的关键词,然后通过余弦相似度计算关键词集的相似度来判断文档的相似度。另外,词袋模型也可以用来计算文档的相似度。我们将在接下来的章节中详细解释这两种方法。

实体相似度计算

这是知识融合的第四步,也是最后一步,常用的方法是聚类和聚合。聚类算法在前面关于K-means聚类的章节中有详细的描述。在计算实体的相似性时,K-means聚类通常与Canopy聚类结合使用。Canpy聚类的特点是不需要预先指定k值。除了这两种聚类方法,层次聚类和相关聚类也可以用来计算实体的相似度。

另一种计算实体相似度的方法是利用聚集算法,根据属性相似度的结果计算相似度的得分向量,然后根据机器学习的分类算法,如logistic回归、决策树、支持向量机等。

3.实际案例:Protégé构建漫威英雄关系图

知识地图技术刚刚起步。目前业界还没有通用的本体编辑工具。大多数需要构建知识地图的项目都需要先开发一套知识地图本体编辑软件工具,然后在此基础上构建地图。

在本章中,我们将使用斯坦福大学医学院生物信息学研究中心基于Java语言开发的本体编辑和知识获取软件Protégé,该软件主要用于构建语义网中的本体。虽然不支持多人协同编辑,但它是目前比较成熟的开源知识地图编辑工具,包括地图生成、可视化和知识推理的全过程。而且软件本身是开源的,可以根据源代码对软件进行适当的修改,以满足公司项目的需要。非常适合产品经理了解知识图谱的相关技术原理。Protégé主界面如图。

3.1构建本体

首先,我们需要建立一个本体。打开Protégé软件时,默认会打开“活动本体”菜单栏。在这个菜单下的“本体IRI”输入项中,会有一个默认的本体前缀名称。我们可以将其更改为用户定义的名称,就像为变量设置变量名一样。这里我设置为“http://www。KnowledgeGraph.com ",如图。

如果要创建新的本体,请单击文件菜单栏下的新建选项。

3.2建筑等级

在我们构建本体之后,单击实体选项卡来编辑本体。首先,选择选项卡下的“类”选项卡以创建新类。如图,在这个页面中,左边是所有的类,类之间的对应关系以树形结构显示。如果选择了左边的一个类,可以在右边设置这个类的相关描述。我们可以看到一个名为owl:think的类已经存在,它是所有类的默认父类。

点击选择东西,点击左上角图标创建子类,在弹出菜单的名称输入项中设置子类的名称。在这里,我们输入“电影”,然后点击确定。然后选择新创建的电影类,点击中间的图标创建兄弟类。我们将兄弟类的名字设置为“character”,在character类下构建两个子类,分别命名为“man”和“woman”,从而完成类的创建。

当然也可以在相关类上点击鼠标右键,在弹出菜单中选择“添加子类”和“添加同级类”,创建子类和同级类。效果和点击按钮一样。

如果您想删除一个类,只需选择该类,然后单击最右侧的图标将其删除。

3.3设置类之间的关系

我们已经创建了四个类,现在我们可以在这四个类上设置一些属性。在这种情况下,男人和女人是互斥的,一个人的实例只能是男人或女人中的一个,所以我们可以用“不相交于”属性来描述它。

选择女性,然后单击“不相交于”属性右侧的加号按钮,从弹出菜单中选择男性,然后单击确定完成关系的创建。同样的操作,我们可以把人物和电影设置为互斥类,如图。

3.4建筑对象属性

选择“对象属性”选项卡,进入编辑对象属性的页面,与“类”页面非常相似,但区别在于主题颜色不同。左边已经有一个默认的“owl:topObjectProperty”属性。单击左上角的按钮或鼠标右键创建子属性,并在弹出的输入框中输入属性的名称。

我们可以创建一个“主演”属性。创建后,单击右侧“设计”中“域”选项右侧的加号按钮。在弹出的菜单中,选择左侧的“主演”,选择右侧属性对应的类别,选择“角色”,然后点击确定,即可将主演与角色关联,表示主演的主体一定是某个角色,如图。

接下来,设置属性的取值范围,点击“范围”选项右侧的加号按钮,将“主演”的取值范围设置为“电影”,点击确定。

这样,我们就完成了一个对象属性的构造,将用于后续的知识推理,如图。

3.5构建数据属性

选择“数据属性”选项卡,进入数据属性编辑页面。左边已经有了默认的“owl:topDataProperty”属性。单击左上角的按钮或鼠标右键创建一个子属性,并在弹出的输入框中输入属性的名称。

我们可以创建一个“英雄名”属性来表示超级英雄的头衔。创建完成后,点击“Deion”右侧“Range”右侧的加号,选择“内置数据类型”选项卡,选择“xsd:string”,点击“确定”,将该数据属性的取值范围限定为一个字符串,设置后如图。

3.6施工实例

点击“个人”选项卡进入实例编辑页面,点击左上角图标新建一个实例,在弹出菜单中输入实例名称“小罗伯特·唐尼”,点击“确定”完成实例创建。我们继续以同样的方式创作《斯嘉丽·约翰逊》《钢铁侠1》《复仇者联盟1》的三个实例。

选择“小罗伯特·唐尼”的实例,点击右窗口中“类型”的加号按钮,在弹出的界面中选择“类层次”标签,然后从类中选择“人”,表示该实例属于人的类。

然后在右侧“属性断言”的设置窗口下,点击“对象属性断言”右侧的加号按钮,弹出菜单中会出现两个输入框。左侧需要输入对象属性,右侧需要输入其他实体。我们在左边输入“主演”,在右边输入“钢铁侠1”,点击OK完成一个三联体的创建。

之后,您需要设置实例的数据属性。点击“数据属性断言”右侧的加号界面,在弹出的菜单左侧选择英雄名的属性,然后在右侧填写具体的属性值,以表示电影中这个角色的英雄名。这里我们填写“钢铁侠”,点击确定,最终设置结果如图。

按照同样的操作流程,也设置了“斯嘉丽·约翰逊”的属性,“钢铁侠1”的类型设置为“电影”,但是“复仇者联盟1”的类型先保留为空,看看如何让Protég自动判断这个实例的类别,实现知识推理。

3.7知识推理

单击顶部菜单中的“创建者”菜单,选择“隐士”选项,然后再次单击“创建者”菜单,您会发现“凝视创建者”已成为可选选项。当你点击这个按钮时,系统会自动推理和计算知识。计算完成后,我们选择“复仇者联盟1”的实体,并发现其类型已被设置为“电影”

如图所示,在我们定义小罗伯特·唐尼和斯嘉丽·约翰逊主演《复仇者联盟1》之前,主演的范围是一部电影,所以我们可以推断《复仇者联盟1》是一部电影。

3.8地图集的可视化

选择顶部标签下的移植选项,移植菜单将被添加到顶部。切换到此菜单,单击左侧的类名,在画布中显示该类图标。如果类有子类或实例,图标上会出现一个加号。双击带加号的图标,向下钻取并展开以查看所有类和实例。将鼠标移动到该行上,以显示由该行表示的关系名称。通过鼠标拖动图标,可以直观地查看本体之间的关系

这篇文章最初是@黄汉兴发表的,大家都是产品经理。未经允许,禁止复制

标题图来自Unsplash,基于CC0协议

1.《pronoun 产品经理的知识图谱入门实操》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《pronoun 产品经理的知识图谱入门实操》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/1073840.html

上一篇

破冰者剧情介绍

下一篇

破案子的电视剧

黑龙江地图 「地图视界」黑龙江省行政区划沿革(1949~1999)

  • 黑龙江地图 「地图视界」黑龙江省行政区划沿革(1949~1999)
  • 黑龙江地图 「地图视界」黑龙江省行政区划沿革(1949~1999)
  • 黑龙江地图 「地图视界」黑龙江省行政区划沿革(1949~1999)

匕首枪 特种兵的利刃——国产QSB11式匕首枪真实体验

  • 匕首枪 特种兵的利刃——国产QSB11式匕首枪真实体验
  • 匕首枪 特种兵的利刃——国产QSB11式匕首枪真实体验
  • 匕首枪 特种兵的利刃——国产QSB11式匕首枪真实体验

春天的拼音 小学一年级语文必须掌握的拼音、汉字、组词知识归纳,快收藏!

拼写 基础知识复习 声母23个,韵母24个,16个音节作为一个整体识别。 注意 分四声。标准曲:“有A放手,无A找O,e,I,U,后面标。” 音节 音节是声母、韵母和声调的组合。 (1)当最后的“u”和首字母“j,q,x,y”拼在一起时,去掉“u”头上的两点,如“ju”。 (2)人或物等特殊...

H&M商品下架 连地图都搜不到了!

  • H&M商品下架 连地图都搜不到了!
  • H&M商品下架 连地图都搜不到了!
  • H&M商品下架 连地图都搜不到了!

python多行注释 整理了27个新手必学的Python基础知识点

凯叔讲故事官网 "凯叔讲故事"盗版泛滥 知识付费背后的盗版黑洞-乐易知识产权

凯叔讲故事官网 "凯叔讲故事"盗版泛滥 知识付费背后的盗版黑洞-乐易知识产权

刚刚完成5000万美元Series C融资的儿童内容教育品牌“凯舒评书”,让业界看到了儿童内容的潜在市场空,但也难以逃脱各种盗版侵权的“后续”。经调查发现,很多网站都出现了打着“内容共享”旗号的各种侵权链接,“凯叔评书”的付费内容被打包低价出售,或者关注相关账号免费发送。同时,一些平台提供破...

正常人呼吸频率每分钟多少次 健康素养知识100问,大家快来看看自己答对了多少?

  • 正常人呼吸频率每分钟多少次 健康素养知识100问,大家快来看看自己答对了多少?
  • 正常人呼吸频率每分钟多少次 健康素养知识100问,大家快来看看自己答对了多少?
  • 正常人呼吸频率每分钟多少次 健康素养知识100问,大家快来看看自己答对了多少?

平安银行网上银行登录入口 【期货基础知识】平安银行网上银行银期绑定 开通流程[亲测有效]

  • 平安银行网上银行登录入口 【期货基础知识】平安银行网上银行银期绑定 开通流程[亲测有效]
  • 平安银行网上银行登录入口 【期货基础知识】平安银行网上银行银期绑定 开通流程[亲测有效]
  • 平安银行网上银行登录入口 【期货基础知识】平安银行网上银行银期绑定 开通流程[亲测有效]