中文文本分割模式获取及其优化方法

来源 :南昌大学学报:理科版 | 被引量 : 0次 | 上传用户:yzahnig621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分割是非结构化文本处理的一个重要预处理步骤,对自然语言处理中的许多任务如自动摘要、自动问答和信息检索等的处理效果具有重要的影响。针对文本分割算法要解决的最根本问题:主题相关性度量和边界划分策略,利用"分割单元"内部具有最大的主题相关性而"分割单元"之间具有最小的主题相关性的思想,以上下文相关性分析计算为基础,构建面向中文文本的文本分割模型框架和分割模式的优化方法。通过三组选自国家汉语语料库的测试结果表明,该方法识别分割边界的平均错误率和最低值均好于现有的其他中文文本分割方法。
其他文献
目的观察不同浓度百香果果汁对D-半乳糖致衰老小鼠学习记忆、抗氧化能力的影响及其作用机制。方法将48只小鼠随机分为正常组,模型组,阳性组,百香果高、中、低剂量组。除正常
当今市场波动较频繁,柔性生产对于企业的发展起着至关重要的作用。文章分析了3D打印的特点、优势及相关应用领域,以及3D打印是如何与模块化进行结合,接着阐述了模块化生产的
研究了5,5-二甲基-三亚甲基碳酸酯的均聚物(PDTC)及其与聚乙二醇(PEG)组成的嵌段共聚物(PDTC-PEG-PDTC)的亲水性、水解和酶解性能以及药物释放性能.结果表明:随着聚合物中PEG
农业的发展问题,一直以来都是党中央关注的“重中之重”。十九大以来,中央首次提出了“乡村振兴”这一重大战略,充分说明了农业问题的重要性。2018年,中国人民银行出台了资管
随着科学技术的不断发展,计算机网络和通信工程越来越先进。基于此,笔者针对计算机网络在有线通信工程中的应用,结合理论实践,在简要对比有线通信工程和无线通信工程基础上,
介绍了一种旋转机械状态监测与故障诊断系统。该系统主要采用了基于转子轴心轨迹测试和分析,以一、二和三阶正、反进动量为特征量的监测、诊断方法。系统还保留了频谱分析功能
自工业革命以来,农地非农化在中国乃至世界迅速蔓延,农地非农化过程中不仅改变了原有的碳素循环平衡性,同时还伴随着一系列生态环境问题。我国正面临着城市扩张、耕地保护与生态环境之间的矛盾,“绿水青山”和“金山银山”之间的问题日益突出,面对国务院提出的减排目标,减排增效迫在眉睫。因此,研究农地非农化碳汇损失与碳效益可以更好地揭示经济发展背后付出的生态代价,以及土地覆被变化的生态反馈效益。成绵乐经济发展带是
微咸水灌溉是缓解世界范围内水资源危机的重要手段。因滴灌可以实现微咸水灌溉情况下水肥盐的精准调控,被认为是最适宜的微咸水灌溉方式。但是,微咸水中数量和种类丰富的离子
本研究以冰山理论、人的全面发展理论以及实践活动理论作为指导,采用文献综述、问卷调查、个案访谈(教师访谈、学生访谈、企业访谈)等相结合的方法,对社团尤其是专业类社团影
特岗教师政策主要针对中西部地区教育师资问题提出,鼓励大学生积极报考特岗教师服务农村义务教育工作,把知识与文化带到农村。在农村教育改革的洪流中,特岗教师政策的施行无