【摘 要】
:
目前,汉语并列结构的研究对标注语料的依赖较强,无法利用未标注语料中的语义信息,且未引入半监督学习方法.该文以条件随机场为基本框架,提出了一种基于半监督学习的并列结构
【机 构】
:
昆明理工大学 信息工程与自动化学院,昆明650500
论文部分内容阅读
目前,汉语并列结构的研究对标注语料的依赖较强,无法利用未标注语料中的语义信息,且未引入半监督学习方法.该文以条件随机场为基本框架,提出了一种基于半监督学习的并列结构识别方法.从未标注语料中训练出词向量继而提取无监督特征,同时引入语言学特征进行对比实验,考察不同特征对并列结构识别效果的影响.实验表明,无监督特征的融入能提高并列结构的识别效果,使F值达到85.75%,语言学特征和无监督特征结合后的F值为85.77%.说明语言学特征对结果的影响甚微,而无监督特征的引入可以减少人工选取特征的工作量,并将语义信息以较简洁的方式融入识别模型中.
其他文献
于2017—2019年的5月至11月对烟台养马岛贝类养殖区进行水质监测,分析了该贝类养殖区近三年来的营养盐含量变化,并对该海域的有机污染状况进行评价,探讨其营养盐的潜在富营养化水平。结果表明,调查期间养马岛贝类养殖海域的溶解氧、化学需氧量、无机氮和活性磷酸盐均符合国家一类海水水质标准;该海域为氮限制的贫营养化水平;有机污染指数评价分析显示该海域水质状况以良好和较好为主;硝酸盐与铵盐呈显著的正相关;水温分别与溶解氧、亚硝酸盐呈显著负相关。总体而言,养马岛贝类养殖区符合国家养殖区水质标准,营养盐含量基本正常,
知识图谱能够将风险管理领域大数据资源组织为结构化的知识系统,并融合深度学习技术推动风险管理智能化的发展.将知识图谱应用于风险管理领域,研究如何整合多源异构数据,构建满足风险领域特定需求的知识图谱,以提升风险管理能力,成为风险管理领域知识图谱研究的主要任务.文章首先概括了风险管理领域知识图谱体系框架,然后从知识表示、知识抽取、知识融合与知识推理等方面归纳风险管理领域知识图谱构建技术的现状,最后总结知识图谱在风险识别、预警及防控等方面的应用进展,并分析知识图谱在风险管理领域应用的未来发展趋势.已有风险管理领域
运用定量投喂的方法研究不同性状饵料对波纹龙虾(Panulirus homarus)生长性能的影响差异性。试验选用一批规格相近、体长9.10~9.84 cm、体重50.30~62.25 g的波纹龙虾苗600只,分为2组,A组投喂半熟化贝肉,B组投喂新鲜贝类,在室内水泥池进行120 d的生长试验,每15天通过对不同组随机抽取的50只波纹龙虾进行特定生长率、体长增长率、体重增长率、饵料转化率及存活率等参数差异性的分析,优选养殖波纹龙虾的最佳饵料。结果表明:A组和B组的特定生长率分别为(0.86±0.04)%和(
决策粗糙集模型是当前粗糙集理论的研究热点.然而目前决策粗糙集中的属性约简大多基于决策代价视角而构建,为了同时兼顾约简结果的决策代价和分类精度,本文通过融合属性子集的分类性能,在混合型信息系统下提出一种邻域互信息熵的决策代价属性约简算法.文中首先在混合型信息系统下提出邻域信息熵、邻域联合熵和邻域条件熵,并进一步地推导出了邻域互信息熵和邻域条件互信息熵;然后将邻域互信息熵理论融入邻域决策粗糙集的决策代价属性约简中,提出一种邻域互信息熵的混合型数据决策代价属性约简算法,该属性约简选择出的属性子集可同时兼顾决策代
水产动物源胶原蛋白具有很好的生物相容性、可吸收性、促进细胞生长、止血等多种优点,是医用敷料极佳的制备原材料来源之一。本文介绍了几类以水产动物源胶原蛋白为原料的医用敷料及其促愈效果,探讨了水产动物源胶原蛋白在医用敷料应用领域未来的研究方向,为后续的深入研究工作提供参考依据。
服务需求预测是实现主动服务推荐的重要基础.如何实现用户服务需求的动态预测已经成为智能服务领域亟需解决的关键问题之一.针对这一问题,本文构建了一种注意力机制增强的深度交互神经网络模型(Attention Mechanism Enhanced Deep Interaction Network,AM EDIN),并基于AM EDIN提出了一种情景感知的服务需求动态预测方法.该方法首先通过AM EDIN模型的交互单元,自适应地捕获不同场景和服务需求之间的交互关系,从而显式的建模不同场景对服务需求的影响;之后,合并
以高效率调度车间作业程序为目标,提出基于改进布谷鸟搜索算法的车间作业调度优化算法.首先构建车间作业调度优化数学模型,设置约束条件,根据约束条件,将加工耗时最短的目标
对复杂问题的处理一直是开放域问答(Open Domain Question Answering,ODQA)的一个难点,回答复杂问题需要分析问题及其相关的词法、句法和语义内容,该过程需要同时建模命名实
引文推荐旨在根据指定查询信息从海量数据中挖掘出与之最相关的若干文献,是一件有重要意义且极具挑战性的工作.引文推荐不但与文献的内容相关,文献间的引文关系、文献和出版社关系、文献和作者关系等,在引文推荐中也起重要作用.本文提出一种基于异质信息网络表示学习的引文推荐算法.首先,利用文献的内容信息,以及文献中的不同类型节点之间的相互关系构建异质信息网络;接着,对每个论文节点进行采样,对其先后进行元路径游走和随机游走,生成混合随机游走序列;最后,使用skip-gram模型获得节点的嵌入向量,计算相似性获得相应的文献
研究建立了苯系物7种组分(苯、甲苯、乙苯、对二甲苯、间二甲苯、邻二甲苯、苯乙烯)及内标氟苯的气相色谱-三重四极杆串联质谱仪分析方法的多级反应监测(MRM)模式。在确定前级离子的条件下,采用产物离子扫描模式对苯系物的定性及定量产物离子进行筛选,并对各离子对的碰撞能量进行优化,得到了丰度较高、特异性好的产物离子及最适碰撞能量。优化得到的MRM模式对苯系物进行分析时,具有较高的灵敏度和稳定性,能更准确地对苯系物进行定性及定量,为今后开发复杂基质中苯系物残留的日常检测方法奠定了基础。