知识图谱在智能制造领域的研究现状及其应用前景综述.pdf

pdf,计算机与AI
文档页数:24
文档大小:116.92MB
文档格式:pdf
文档分类:计算机与AI
上传会员:
上传日期:
最后更新:

知识图谱在智能制造领域的研究现状 及其应用前景综述

张栋豪刘振宇郏维强刘惠谭建荣!(1.浙江大学计算机辅助设计与图形学国家重点实验室杭州310027:2.信雅达系统工程股份有限公司浙江省重点大数据研究院杭州310053)

摘要:数据和知识是新一代信息技术与智能制造深度融合的基础.然而,当前产品设计、制造、装配和服务等过程中,数据及知识的存储大多以传统关系型数据库为基础,这导致了数据及知识的瓦余性和搜索及推理的低效性.近年来,知识图谱技 术飞速发展起来,它本质上是基于语义网络的思想,可以实现对现实世界的事物及其相互关系的形式化描述.该技术为智能制造领域数据及知识的关联性表达和相关性搜索推理问题的解决带来了可能性,因此其在智能制造的实现过程中扮演着越来越重要的角色.为了给知识图谱在智能制造领域的应用提供理论支撑,总结了知识图谱领域的研究进展:同时探索了知识图谱在智能制造领域的3大类应用方向,共15小类应用前景,分析了在各个应用前景上与传统方法的不同之处,应用过程中所需要使用的知识图谱相关技术以及实施过程中所待突破的关键技术,希望可以为进一步展开针对知识图谱在智能制造领域 的研究提供启发,同时为相关企业针对知识图谱的实际应用提供参考:最后以数控车床故障分析为案例,验证了知识图谱在智能制造领域应用的有效性.

关键词:知识图谱:研究综述:语义网络:智能制造中图分类号:TP301

A Review onKnowledge Graph andItsApplicationProspects to IntelligentManufacturing

ZHANG Donghao′LIU ZhenyuJIA Weiqiangl.2LIU HuiTAN Jianrong2. Key Research Institute for Big Data of Zhejiang Province Sunyard System Engineering Co. Ltd. (1. State Key Laboratory of CAD&:CG Zhejiang University Hangzhou 310027;Hangzhou 310053)

pu op u u jo dap o ao ssq a po pe pasqymanufacturing However the storage of data and knowledge in the processes of product design manufacturing assembly and service is mostly based on relational database which brings data redundancy and inefficiency of searching and reasoning. Recently knowledge graph technology based on the ida of semantic network has developed rapidly. It can achieve the description ofreal-world things and their relationships which provides a mean for the corrlation representation of data and knowledge and a solution of the relevane searching an resoing problm in the are of ineligent mafacturing Theref it plays an incrasinglimportant role in the realization of intelligent manufacturing. In onder to provide the theoretical support for the application ofknowldge gaph a review abt th rerh staus of kwlde gaph is pvi. At the m tme tr majr alicats fknowlede gaph in te arfnteliget mafacuring are exlored nling a ttal f 15 mall licati ppets. Amng thm to g pu ps oqn squ a uds pd u pdq pp a oq differences pared with traditional methods the knowledge graph technology to be introxduced and the key technologies to be d po u su ud p um po

about thlth falealsis is ue tverify theerity of thewldegah tare fintligt mfcti.Key words: knowledge graph: literature review: semantic network;: inteligent manufacturing

知识的关联、认知、理解与推理.因此,如何从元余的数据与知识文本中抽取有用信息,如何有效表何有效利用数据的关联性与知识的关联性实现高效 达数据之间的内在关联与知识之间的内在关联,如的信息检索与信息推理,是当前实现智能制造目标的核心瓶颈之一.

0前言

物联网、云计算、人工智能等新一代信息技术的迅猛发展,带来了制造业的新一轮突破,推动着制造系统向智能化方向发展,驱动着未来制造模式的创新,其中数据和知识是实现制造业与新一代信息技术融合的基础,是实现智能制造的保障. 方面,产品在其生命周期的各个阶段将会产生海量工业数据和知识:另一方面,工业数据和知识是制造领域的信息化进程的必备资源,其中蕴含了大造、装配、服务等生命周期过程中数据以及知识的 量有用的模式.然而,当前制造领域产品设计、制存储大多以传统关系型数据库为基础,余性较高、分布分散、关联性较弱且储量相对较小,强调对数据以及知识的检索却较少从语义层面研究数据以及

知识图谱(Knowledge graph,KG)来源于谷歌下络的思想,是一种有向图结构的语义知识库,用于 一代智能语义搜索引擎技术.其本质上基于语义网以符号形式描述物理世界中的概念及其相互关系,其应用服务架构如图1所示,在知识图谱内部,数据和知识的存储结构为三元组,形如(s p,o)或p(s o),其中s和o为知识图谱中的节点,分别 代表了主语实体知识和宾语实体知识,P为知识图谱中的边,代表了从s指向o的关系知识(谓语).

图1基于知识图谱的应用服务架构

知识图谱具有如下3种特点:①数据及知识的存储结构为有向图结构.有向图结构允许知识图谱有效地存储数据和知识之间的关联关系:②具备高配算法,实现高效的数据和知识访问:③具备智能 效的数据和知识检索能力.知识图谱可以通过图匹化的数据和知识推理能力.知识图谱可以自动化、智能化地从已有的知识中发现和推理多角度的隐含知识.

引擎、智能问答等发挥了重要作用,同时也已经在多个领域进行初步应用,比如:金融、电商、医疗等.许多国际著名企业也已经开始探索知识图谱时,在智能制造领域,西门子于2018年提出了他们 的应用,比如谷歌、微软、IBM、苹果等.与此同在知识图谱领域的规划:博世公司于2019年构建了底盘系统控制相关数据的大型知识图谱,以提供有效地数据访问.然而国内的机械行业针对知识图谱的探索却有些许不足.在研究过程中以及与多

目前,知识图谱技术已经在互联网领域如搜索

家机械相关企业的交流中发现,当前知识图谱在智能制造领域应用过程还存在以下不足.

(1)缺乏对知识图谱理论的深入认识.目前知识图谱相关理论与技术在迅速发展,但是智能制造领域的专家大多对该技术缺乏深入的了解,无法有效管理和应用知识图谱中的数据及知识.

(2)知识图谱相关技术在智能制造领域的优势不明晰.目前知识图谱在智能制造领域的应用处于起步阶段,针对产品设计、制造、装配、服务等过程所带来的优势不是很明确,且在知识图谱应用于智能制造领域过程中可能遇到的问题尚不明确.

(3)知识图谱相关技术在智能制造领域的应用场景模糊.当前企业对知识图谱在智能制造领域的应用前景有所疑问,不确定知识图谱技术在产品设计、制造、装配和服务等过程的切入点和切入方式.

术不明确,目前在通用领域上的知识图谱的研究角 (4)知识图谱在智能制造领域落地所需要的技度十分广泛,但是针对智能制造领域各个应用场景,所需要使用的知识图谱相关技术类别却还不是很明晰.

度学习的知识图谱相关技术需要构建一定量的有标 (5)智能制造领域相关数据缺乏.目前基于深签数据集,目前通用领域的相关数据集比较多,而智能制造领域的相关数据却比较缺乏.

造领域的知识图谱技术的研究进展.同时从应用出 针对以上问题,本文总结了可以应用于智能制发,探索了知识图谱在智能制造领域的3大类应用方向,共15小类应用前景,分析了在各个应用前景上与传统方法的不同之处,应用过程中所需要的知识图谱技术以及实施过程中所待突破的关键技术, 为后续知识图谱在智能制造领域的进一步落地提供理论支撑和方法参考.

1智能制造领域知识图谱研究进展

谷歌在2012年最早提出了知识图谱的概念,当时主要用于从多来源数据中增强搜索引擎的结果.与传统的关键词匹配搜索相比,基于知识图谱简明智能的搜索结果,如图2中所示的谷歌关于 的语义搜索可以更好地理解用户的问题,提供更加“3D打印”的搜索结果.图中可以看到,搜索界面不止返回了与3D打印相关的页面链接,更重要的是在知识图谱的帮助下在侧边栏显示了各个打印技联信息.用户可以根据这些信息快速定位到自己的 术的发明时间、3D打印公司以及3D打印材料等关

搜索目标,同时也可以拓展了解技术的更多相关信知识库迅速发展,如Freebase、Wikidatal、 息.自从知识图谱提出以后,各种基于知识图谱的DBpedial等.但是上述这些知识库中所存储的均是通用领域的知识,当前针对智能制造领域的知识图谱型知识库依然十分缺乏.

图2关于3D打印技术的谷歌搜索结果

达智能制造领域数据和知识的属性以及数据和知识 智能制造领域的知识图谱型知识库可以用于表之间的内在关联.智能制造领域知识图谱与通用领域知识图谱在架构上基本相同,不同之处在于其还具有以下4点特性:①存储智能制造领域数据与知识:其中存储了产品设计过程、工艺过程、加工过 程等产品全生命周期的数据与知识:②面向智能制造领域应用场景和问题:以提高产品设计和生产过程的效率和质量为目标,处理产品全生命周期遇到的问题:③可解释性及精度要求高:可解释性要求便于人类专家对其推理结果进行验证和理解,而其 精度影响了企业各个制造任务的运作效率和质量:④资源少且专属性强:难以从网上获取大量的数据及知识,主要根据制造企业的特点及企业自身积累的数据与知识,构建专属的知识图谱.

由于知识图谱具有强大的知识表示和推理能力,该技术在提出后迅速获得学术界和业界的广泛关注.当前智能制造领域知识图谱的相关研究主要集中在五大方面,分别是:智能制造领域知识的形技术、智能制造领域知识推理技术、智能制造领域 式化表达方法、智能制造领域知识图谱的自动构建间答技术及智能制造领域个性化推荐技术.下面将简要介绍上述技术的研究进展,为后续智能制造领域应用前景的探索提供参考.

1.1智能制造领域知识的形式化表达方法

将知识图谱技术应用到智能制造领域中,首先

需要实现领域知识的形式化表达,即在多模态数据术.下面将简要介绍这三个细分领域的常见步骤以要求下实现机器可以理解的知识表达方式.在智能 制造领域知识的形式化表达方向中,所涉及的关键技术手段包含了谓词逻辑知识表示方法2、框架式知识表示方法、基于语义网络的知识表示方法、基于本体的知识表示方法5等.相比较面言, 基于本体的知识表示方法能够保证知识传递和共享过程中知识理解的唯一性,可以满足知识类型多样、语义关系复杂的要求,已成为智能制造领域知识表示的主要方法之一6.知识图谱作为本文的重点分析对象,也是以本体作为模式层的知识表达与存储 方法,其利用本体所定义的概念和关系的形式化描述,表征实例化后实体的类型与实体之间的关系.

目前基于本体的智能制造领域知识表示方法的知识,CHHIM等发展了联合两类知识的本体, 代表性工作有:针对产品设计过程知识和制造过程并尝试将其应用于知识重用过程:针对工艺设计知识,郭鑫等考虑工艺知识特点及领域范围,提出基于本体的工艺知识管理逻辑架构:针对制造业领域全生命周期知识,刘航等基于本体提出多层结构化、维度化的表示:针对协同设计知识,BOCK 次、多维度的知识表达模型,实现制造业领域知识等探索了结合本体和基于模型技术进行协同设计的方法.

表示方法获得了广泛的研究,研究范围涉及到了设 可以看出,当前基于本体的智能制造领域知识计过程、制造过程等多维度的本体的创立,为后续知识图谱的自动构建提供了基础.在企业实际应用过程中,可以以现有学者构建的本体作为基础,以提高企业知识本体构建的效率.然而,现有研究中 所构建的本体往往细节度不高,应用过程需根据实际的企业需求进行拓展.

1.2智能制造领域知识图谱的自动构建技术

涉及到的关键技术有:命名实体识别、关系抽取、 在智能制造领域知识图谱自动构建过程中,所实体对齐等.其中命名实体识别用于从智能制造领域非结构化的文本中抽取到预定义的本体所实例化的实体:而关系抽取用于抽取智能制造领域非结构化文本中所蕴含的实体对在本体中定义的关系类 别.通过上述两个技术方法,可以自动化地以管道式的方式构建智能制造领域知识图谱三元组.然而由于实际智能制造领域知识图谱的构建过程很可能会产生多个知识图谱(如产品设计知识图谱、设备故障知识图谱、工艺过程知识图谱等),为了实现多个 知识图谱之间的融合推理,还需要引入实体对齐技

1.2.1命名实体识别

1.2.2关系抽取

及代表方法,以为后续企业应用过程中选择合适的 方法提供参考.

基于深度学习的命名实体识别方法一般而言,维稠密矢量:而后使用深度神经网络编码语句的上 首先使用词嵌入算法,将语句中的词组表示为低下文信息:最终解码上下文信息获取每一个词组的序列标签.

其中具有代表性的工作有:HUANG等提出termmemory,Bi-LSTM)编码语句的上下文信息, 了使用双向长短期记忆网络(Bidireetionallong short而后使用条件随机场(Conditionalrandomfield,CRF),限制输出序列的连接形式,其模型结构如图3所示(图中采用BIO标注方法):QIU等22使用同时提升模型的运行速度:YAN等2改进 空洞卷积加强模型对语句上下文信息的编码能力,Transformer模型,引入相对距离驱动的注意力机制,提高Transfommer模型在命名实体识别中的表现.在智能制造领域,刘宇飞等将迁移学习技术应用至数控系统领域专业文献的命名实体识别过程,解决 了专利文献少标注的问题.

图3Bi-LSTM-CRF 模型

可以看出,该领域已经取得了一定的进展,且于后续实现精确化的智能制造领域知识图谱的自动 已经在多种语言和多种场景上进行应用,这将有助构建以及用户问句的语义解析.然而智能制造领域相关数据缺乏,需要更加深入地发展基于无监督学习、半监督学习与迁移学习的命名实体识别技术.

目前基于深度学习的关系抽取技术中,研究最广泛的便是基于远程监督假设的关系抽取技术.远程监督假设最早是由MINTZ等提出,它假设当两个实体存在关系,则同时包含这两个实体的语句均表征了该实体对的该关系的部分信息,因此,可 以使用包含这两个实体的文本语句来学习该关

系的内在模式.基于远程监督假设的关系抽取技术嵌入;CAO等将图卷积神经网络与注意力机制引能够以很小的成本获得大量的关系抽取数据,可以入实体对齐任务中,用于获取表征知识图谱中实体 分布的相连实体的重要性权重.

限制关系类别空间,还能够降低部分数据噪声.

该类型方法的代表性工作有:ZENG等提出使用卷积神经网络获取词汇与语句级别的信息,而后实现实体之间关系类别的预测,图4展示了文中 上下文信息的编码方式:SOROKIN等”使用了长短期记忆网络联合编码一个句子中的多个实体对之间的关系,实现多实体对的关系预测:为了引入多粒度的语言信息以及外部的语言知识,LI等提出务:为了强化上下文信息的编码过程,BILAN等[2] 了多粒度晶格框架,实现了中文文本的关系抽取任将自注意机制引入到关系抽取任务.在智能制造领域,LENG等依据大量制造关系的社交交互上下文,帮助决策者抓住跨企业制造业需求能力匹配的决策支持信息.

图5统一低维语义空间实体对齐方法

可以看出,当前基于深度学习的实体对齐技术主要关注于多语言环境下知识图谱的实体对齐技术,对多领域环境下知识图谱的实体对齐技术研究 相对较少,面在智能制造领域知识图谱的构建与融合过程中,更加常见的是多领域环境的情况.相比于多语言环境,多领域环境下实体的分布将更加多变,对实体对齐技术提出了更高的要求.

1.3智能制造领域知识推理技术

目前大部分的知识图谱都是由人工或者半自动方式构建,知识图谱内无法包含的知识,大量实体之间的隐含关系没有被充分挖掘出来3.与此同时,知识图谱中还隐式表征了实体用智能制造领域知识图谱结构数据中所蕴含的隐 关系之间所具有的逻辑规则.为了充分挖掘和利式知识,智能制造领域知识推理技术逐步发展起来.该技术包含了知识图谱补全技术以及逻辑规识或识别错误的知识. 则推理技术,旨在根据已有的知识推理出新的知

图4卷积神经网络上下文信息编码

可以看出,目前存在大量学者在该领域研究,场景.当前该领域已经获得了一定的进步,为后续 以提高模型在该任务上的表现或拓展该领域的应用知识图谱自动构建与用户意图分析打下了良好的基础.然面智能制造领域对关系抽取的精确性要求以声[3、长尾关系等问题的解决提出了更高的 及相关数据集标注成本,对现有研究中的数据噪要求.

1.2.3实体对齐

1.3.1知识图谱补全

当前基于深度学习的实体对齐技术主要为基于知识图谱嵌入的实体对齐技术,该技术可以同时考 虑实体表面字符串的相似度、知识图谱中实体的分布相似度以及实体在多语境情况下的语义相似度.

由于从智能制造领域非结构化文本中抽取得到的知识图谱存在实体或关系缺失现象,知识图谱补测与节点分类.如图6所示,链接预测技术主要 全技术迅速发展起来.知识图谱补全涉及到链接预用于依据实体在智能制造领域知识图谱中的分布情况,推断两个实体之间存在的隐含关系:面节点分类主要用于给定智能制造领域知识图谱中的主语实 体与关系,推断出在知识图谱中对应的宾语实体.在实际操作中,链接预测与节点分类的方法十分类似,通常将头尾实体和关系嵌入到一个低维的矢量空间,面后使用深度神经网络训练一个评分模型,给出每个三元组在该知识图谱中出现的置信度.

其中代表性的工作有:CHEN等(3-34首先为每个知识图谱计算嵌入,然后使用一组对齐实体的较 小种子集来计算多语言知识图谱的过渡矩阵,为每个嵌入的跨语言对应对象提供过渡:ZHU等提出了一种通过联合嵌入进行实体对齐的选代方法,将实体和各个关系编码到统一的低维语义空间,其对嵌入的实体对齐的自举方法,选代地将可能的实体 齐计算方式如图5所示:SUN等提出了一种基于对齐标记为训练数据,以学习面向对齐的知识图谱

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。

投稿会员:匿名用户
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)