HealthAidKB:Extracting Procedural Knowledge of Health Care from Web Communities

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhaoleiBCB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用机器可读的人类知识来赋予计算机权力一直是人工智能的长期目标。通过知识收集的进步,这一目标取得了巨大进展。在过去几十年中,自动知识库构建引起研究团体的广泛关注,并在以实体为中心查询应答方面取得重大进展。知识图谱因存储有关常见实体的事实,自然成为语义搜索核心。如今,公开可用的知识图提供数百万个实体(例如人,组织,位置以及诸如书籍,音乐等创意作品)以及数十亿个有关实体的陈述(例如谁在哪里学习,哪个国家拥有哪个首都,或哪个歌手演奏哪些首歌)。但用户查询需要过程知识而不是实体相关事实情况下,当前知识图没有足够的资源来满足用户需求。另一方面,关于现实世界许多常识性知识是以过程或动作序列形式出现。来自搜索日志的查询分析研究表明,大量的用户查询涉及面向任务查询。不幸的是,大多数正在使用的知识图谱和常识知识库都缺少这些知识。为增强语义搜索和其他智能应用程序的功能,计算机需要超越实体并包含对日常对象,人类活动等世界属性的更广泛理解。这项工作着重于收集过程知识而不是面向任务的查询应答。“如何使用指压法来阻止恶心”或“如何自然地帮助消化”就是此类查询的例子。为回答这些问题,我们提出并实现了 HelthAidKB:卫生保健的过程知识库。这项研究工作的主要目的是构建一个针对机器可读域的高精度过程知识库,其中包含来自Web社区的任务框架,并将其用于下游应用程序,例如语义搜索,搜索任务建议,查询扩展等。本文的主要贡献如下:(1)我们已经建立了一个医疗保健计划知识库,即HealthAidKB.为了构建HealthAidKB,我们在网上使用专家策划的半结构医疗资源。我们开发了一系列方法,使用开放信息提取工具通过接入在线社区提取过程知识。首先,我们使用网络爬网技术从在线社区中提取针对该领域的知识。为此,我们开发了 python爬虫。爬虫结果将作为Open IE工具的输入,用以提取结构化知识,这将为我们提供任务框架。提取的任务通过分类归纳和进一步的属性提取在管道中处理,以增强结构化知识。管道中的知识组织阶段具有聚类方法.用于根据任务要解决的问题相似性将任务框架规范化为聚类。为此,我们实现了层次化的聚合聚类技术。由此产生的专有技术知识库HealthAidKB包含超过71K个任务框架,这些任务框架按层次结构进行分类;并可以用于许多应用程序,例如语义搜索,数字个人助理,人机对话和计算机视觉。我们的知识库综合评估显示出很高的准确性。(2)为展示我们知识库的有用性,我们进行了两个实验:(i)面向任务的查询应答,以及(ii)在外部相关案例中搜索相关YouTube视频以进行面向任务的查询。对于第一个问题,我们研究了面向任务的查询是否可以从我们的过程知识库中获得增益。为此,我们设计了检测面向任务查询的方法并开发了使用查询扩展概念来回答面向任务查询的搜索任务建议方法。我们使用知识库HealthAidKB中任务框架的属性进行查询扩展和子任务挖掘。我们通过从AOL查询数据集中收集的查询评估结果。与参照系统相比,搜索任务建议评估的结果显示出更高的准确性。第二个实验评估我们的知识库在外部使用方面的有效性。在YouTube查找相关视频时,我们使用一个用例场景来评估对知识库的外部评价。为此,我们从知识库中嵌入的YouTube视频构建真实的数据集,以衡量检索到的相关视频的覆盖率。与基准系统相比,针对基本事实的外部评估结果也显示我们系统有更好的表现。(3)我们的程序知识库HealthAidKB可免费发布以供公众访问。
其他文献
近二十年来,不确定多智能系统的一致性控制问题已经成为控制科学研究领域的一个热点问题,尤其是基于逼近器的分布式控制受到了学者们的广泛关注,获得了大量理论研究结果,但是仍然有一些公开的问题值得进一步的研究和讨论.本文将针对已有工作中广泛存在的全局一致性控制问题进行研究.研究思想来源于单个系统全局稳定性,万能逼近器作为一个前馈补偿器来描述不确定非线性动态,依靠领导者信号作为输入信号来逼近不确定非线性动态
Web 2.0时代的到来,在线社交网络应用迅速普及,大量用户涌入在线社交网络平台发表见解、分享生活,产生了大量用户生成内容。这些数据对于提高搜索服务的质量与体验具有重要意义。在此背景下,旨在利用社交网络数据优化搜索结果,提升搜索服务用户满意度的社会化搜索引擎应运而生。然而,已有社会化搜索引擎研究仍然存在4个问题:(1)检索资源大都集中于特定的在线社交网络平台,导致信息检索查全率不高;(2)被动响应
大数据时代的到来不仅给数据的处理速度提出了更高的要求,也让价值信息的安全存储成为了重要挑战。忆阻器有着简单的器件结构、简洁的制备工艺、较低的功耗以及较高的集成度,对于实现海量数据存储、克服冯·诺依曼瓶颈、构建存算一体式计算模式具有重要意义。与此同时,物理瞬态形式的电子器件能够在外界的刺激触发下实现物理形态和器件功能的部分或全部消失,其在绿色电子,可植入医疗以及安全电子等领域具有重大的应用价值。因此
网络构成了复杂系统的基础,从脑网络到计算机通信网络,从运输基础设施到在线社会系统,从生物系统到金融市场;在现实世界中,所遇到的大多数系统都是复杂的系统。这些系统具有复杂的拓扑特征,这意味着它们在元素之间的连接拓扑结构既不限于对称排列,也不是可预测的(纯随机的)。学者将这些系统称为复杂的网络。复杂的网络代表着无数的现实世界系统,其中部分系统是人造的,一个较为常见的例子即为Internet和语义Web
电离层化学物质释放是电离层理论研究的重要组成部分,是人工调控和应用电离层空间环境的有效手段之一。本文基于电离层不稳定性理论,研究了电离层化学物质释放的不稳定性效应,并有针对性的讨论了影响电离层不稳定性发展的关键因素。利用线性增长率理论可以从原理上分析化学物质释放的不稳定性触发效应,但线性理论对应不稳定性发展的早期阶段,只能部分判断电离层不规则体的形成概率。因此,需要能够反映不稳定性线性和非线性阶段
人类社会发展史表明,每一次依人类智慧和文明的进步而发生的科学技术革命,都在不同程度上推动人的存在方式变化与人类社会发展。进入二十一世纪后,以人工智能、大数据、云计算、区块链和新一代通信网络信息技术为代表的新技术革命的融合和发展,推动人类社会进入了一个被称为“工业4.0”的第四次工业革命时期,我们正处于这一历史阶段。“现实”就是人与人类的当下的存在,就是我们的本质在当下的显现。从科学技术革命对于人类
近年来,随着电子设备功能和性能的不断提升,电子设备的体积越来越小,装配的元器件数量越来越多,器件运行功率越来越大,导致热流密度和安装密度急速攀升。因此,对电子设备的热控制能力提出了越来越高的要求。微通道换热以其结构紧凑、换热效率高、工程实现性好等诸多优点,作为一种高效的换热形式被海内外研究者们广泛关注。微通道换热结构形式多样不胜枚举,以蛇形微通道换热结构和带有翅片的微通道换热结构散热效果最理想。本
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像技术凭借其全天时、全天候以及高分辨的独特优势,在军事和民事领域都扮演着重要的角色。ISAR通过对空间、空中和海洋目标进行高分辨成像,为非合作目标的分类和识别提供了有力的技术支撑。为了满足越来越丰富的应用需求,ISAR正朝着多功能、多维度和精细化的方向发展。工作模式和系统结构的多样化,以及目标运动的复杂化
汽车数量的迅速增加导致全球能源消耗和温室气体排放量不断增大,如何减少能源消耗和碳排放量成为汽车工业面临的一个重要挑战。诸多学者正致力于研究的以减小车辆能耗为目的的新技术主要专注于对车辆本身的改进和控制,而把道路坡度作为影响车辆能耗的外部因素。不同于现存的许多方法,本文从优化道路坡度的角度研究降低车辆能源消耗的方法和技术。本论文主要贡献如下:本文提出了在车辆按照既定速度曲线行驶的条件下减少其总能耗的
人脸表情识别技术是一个涉及到心理学、生物学、计算机学等等多门学科的交叉产物,由于人脸表情识别研究具有极高的应用价值和研究意义,近十年来,一直是人工智能领域的一个研究热点。得益于硬件技术的提高和深度学习技术的发展,人脸表情识别研究对象已经从实验室控制表情样本转移到了自然场景表情图像,同时也促进了人脸表情识别相关应用市场的蓬勃发展。反过来讲,迅猛发展的应用市场又对人脸表情识别研究提出了更高的要求,例如