基于细粒度特征的话题句识别方法

来源 :计算机应用 | 被引量 : 5次 | 上传用户:hello0306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程。实验结果表明,该方法减少了候选话题句的个数,提高了系统效率。而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点。
其他文献
“第五媒体”是以手机为视听终端、手机上网为平台的个性化即时信息传播载体。它是以大众为传播目标,以定向为传播目的,以及时为传播效果,以互动为传播应用的大众传媒平台。  从1990年开始至今,中国新闻传播的历程可谓天翻地覆。在改革开放的新的历史时期,中国的媒介业获得了从未有过的发展机遇。 自上个世纪90年代手机作为一种新型的通信工具进入人们的日常生活以来,经过十几年的发展,从1G到2G,再到今天的3G
第一条 为规范和加强中央财政补助地方卫生事业专项资金的管理,提高资金使用效益,根据国家有关法律、法规及财务规章制度,制定本办法。
期刊
期刊
本文分析了双母线差动保护在不同故障点动作行为,指出了母线差动保护存在的一些问题,并提出了一种改进措施。
目的 了解深圳特区不同婚姻状况人群的自测健康状况。方法 应用自测健康评量表(SRHMS V1.0)对深圳特区居民5940名个体进行现场测试。结果 深圳特区不同婚姻状况人群的SRHMS V1.0
针对集装箱码头资源调度不合理造成资源浪费的问题,在考虑岸桥装卸成本的基础上,以在港集装箱船总的作业成本最小为优化目标,建立了基于非线性混合整数规划的泊位岸桥协调调度优化模型。为使模型更加接近码头操作的实际情况,模型假设船舶装卸时间依赖于为其分配的岸桥数。采用基于可拓关联函数的改进遗传算法对模型进行求解。改进算法强调了不可行解的重要性,用可拓关联度来衡量种群中不可行解的优劣程度,通过在种群迭代中始终
人是生产力中最革命、最活跃的因素。保证铁路安全生产长治久安,加强安全教育是关键。《国务院安委会关于进一步加强安全培训工作的决定》就强调,"安全培训不到位是重大安全隐
当前,铁路体制和机制改革正在加快推进,在新旧体制转换过程中,铁路企业反腐倡廉建设面临着新的挑战。作为铁路企业"党的忠诚卫士"的纪检监察干部,身处铁路企业党风廉政建设和反
2018年11月23日,由华顿经济研究院主办的第十八届中国上市公司百强高峰论坛暨颁奖典礼在京举行,招商公路荣获“中国百强企业奖”。中国上市公司百强排行榜由华顿经济研究院按
风能是清洁的可再生能源,前景广阔,在大力提倡节能减排的今天和未来,技经人员及时了解风能的投资计算是必要的。