基于词序统计组合的中文文本关键词提取技术

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:xinwang01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。
其他文献
重建文学理论、文学批评与公共领域的有机联系 ,是有志于批判性知识分子志业的文学工作者的紧迫使命 ,但学科专业化的结果已经使得研究文化现象的各学科 (如人类学、社会学、
针对HowNet语义词典对词项收录数量的有限性在一定程度上制约文本相似度运算准确性的问题,提出一种词项语义维度映射的方法。从词项词性的角度出发,按词性对短文本中词项进行
针对传统BP神经网络存在学习效率低、收敛速度慢和容易陷入局部极小值的问题,提出一种基于改进的PSO来优化BP神经网络的方法。通过在PSO算法中引入随机变化的加速常数来获得
工程结算在很大程度上反映了工程的建设成果,建设企业往往依据工程结算进行投资。同时,工程结算的审核结果会直接影响建设企业和施工企业的经济效益。基于此,论文阐述了工程
目的:探讨脑白质疏松症(Leukoaraiosis,LA)患者的危险因素,了解LA的危险因素及其与LA的相关性,通过对LA患者进行蒙特利尔量表(Montreal Cognitive Assessment,MoCA)、简易智
针对云计算动态调度问题,提出一种考虑资源状态动态反馈的云计算调度算法.该算法针对资源服务器状态动态变化影响当前工作流调度结果的问题提出滑动窗模型,该模型可以实时动
汪绂论《诗》,以"性情"探求为主张,以俗语世事论诗为显著特点;注重读《诗》的方法,比较分析和引诗证《诗》是其重要手段;汪绂论诗反对急功近利和空疏的学风,对"今日学者"提出批评
马兰诺研究是研究犹太人生存状况,特别是研究中世纪犹太人生存状况的一个重要课题。马兰诺是中世纪反犹运动的产物,所以,研究马兰诺的生存状况也可以让人们对反犹的历史有更
以棕榈酸、异辛醇(2-乙基己醇)为原料、对甲基苯磺酸为催化剂直接合成棕榈酸异辛酯。考察了反应温度、催化剂用量、反应时间及带水剂用量对酯化反应的影响,确定了合成棕榈酸异
基于问卷调查数据,运用Probit回归模型从父母视角分析了子女情况如何影响父母长期护理保险购买意愿。实证结果表明,子女数量、子女受教育情况、子女的经济状况、父母与子女的