基于模式和投影学习的领域概念上下位关系自动识别研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:LINGBAOLAOLI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]实现对领域概念上下位关系的自动识别,以解决领域本体自动化构建中领域概念间语义关系的自动获取和确立问题.[方法]将传统无监督的基于模式的方法和当前先进的有监督的基于投影学习的方法有机结合起来,应用于领域概念上下位关系自动识别,并进行了实验研究.[结果]能识别出领域概念的上位词集合,在医学领域的识别精度为0.88,通用领域的识别精度为0.83,在评估基准集BLESS上的平均精度为0.850[局限]受句法歧义、语料集质量等影响,模型精度尚未达到峰值,存在错误识别的情况.[结论]可发现同一概念词的不同意义的上位词,对低频词和命名实体也具有较好识别效果.未来可考虑从对高频顶层上位词进行适当减权、提升有监督语料集的质量等方面进行优化.
其他文献
【目的】探索共享平台中不同主体的信息线索及其线索一致性对用户购买决策的影响机制。【方法】以线索一致性理论为基础,从房客文本线索(UGC)和房东图片线索(MGC)角度构建模型,利用爬虫技术在共享住宿平台网站上获取相应房源数据,研究信息线索一致性对消费者购买决策的影响。【结果】UGC的文本线索和MGC的暖色调图片显著正向影响用户购买决策,UGC与MGC的信息线索一致性程度对用户购买决策具有显著正向影响
  以核桃加工下脚料核桃壳部分或全部代替常用培养料中木屑、玉米芯进行刺芹侧耳(Pleurotus eryngii)(杏鲍菇)栽培研究.试验结果表明,使用核桃壳代替玉米芯的配方1(木屑34%、
  香菇(Lentinula edodes)是世界上产量第二的栽培食用菌,同时是我国产量居于第二的重要栽培食用菌,也是我国大宗出口食用菌种类.但是由于多年的分散生产和自身无性繁殖的特
会议
  微生物产物是新药及其先导结构的一个重要来源。随着现代生物工程技术的发展,虽然对尚无法分离培养的微生物也可以不经分离而从基因组DNA水平探索其代谢产物,但可分离培养
  开展食用菌白化现象的研究可选育出性状优良的新品种.蛹虫草(Cordyceps militaris)的商业化人工栽培已经有二十多年,生产品种中以橙红色子实体为主,其他品种鲜有报道.蛹
  美味冬菇(Panellus edulis),肉质肥厚、细嫩清香、富含蛋白质、多种维生素及矿物质等,产品既可干品上市又可鲜品上市,是我国东北地区著名的名贵食用菌,近些年来已经能够进行
  我国是香菇(Lentinula edodes)驯化栽培最早的国家,也是香菇的第一大生产国和出口国。但在我国香菇菌种市场上,同物异名和同名异物现象严重,"盗舨"品种随处可见,育种者权
会议
  作为一种常见的食药用真菌,蛹虫草(Cordyceps militaris)的相关研究越来越多。而在继代培养过程中,菌株容易发生退化现象, 主要表现为不再产生主要具药用价值的子实体,给
近日,发表在Proceedings of the National Academy of Sciences上的一篇文章中,来自英国和爱尔兰的研究人员使用数据科学和网络理论共同解开了《权利的游戏》所改编自的小说
期刊
[目的]从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示.[方法]基于文献中代表主题概念的术语、概念等关键词和分