【摘 要】
:
为了适应信息时代的迅速发展,从汉语文献中自动提取主题词,已成为自然语言处理研究领域的一个热点。由于传统的自然语言处理技术仅仅采用机械的关键词匹配来实现,缺乏知识处
论文部分内容阅读
为了适应信息时代的迅速发展,从汉语文献中自动提取主题词,已成为自然语言处理研究领域的一个热点。由于传统的自然语言处理技术仅仅采用机械的关键词匹配来实现,缺乏知识处理和理解能力,造成了文本处理的不确定性。为此本文以中文文本为处理对象,研究并实现了基于语义理解的中文文本主题词自动提取算法,以实现规范的主题词提取和智能检索。本文结合领域背景,构建概念语义网络作为分词词典和知识库,研究并设计了基于词典的分词算法和无词典的基于词频统计的分词算法;采用向量空间模型将非结构化的文本表示为向量形式,提出了中文文献主题词确定的数学模型;利用智能计算等技术实现中文文献集的主题词自动提取,设计一套适合该种数据集主题提取的遗传算法。
其他文献
目的:探讨循证护理干预措施在预防急性胆囊炎患者术后并发感染的应用效果。方法:选取 2016 年 3 月到 2017 年 3 月收治的 49 例急性胆囊炎患者作为对照组,予以常规护理;选取 201
<正>皮亚杰认为认知结构就是学习者头脑里的知识结构,它是学习者全部观念或某一知识领域内观念的内容和组织,学习使新材料或新经验和旧材料或旧经验结为一体,形成一个内部的
有着"天府之国"之称的成都,拥有优越的自然条件,深厚的历史积淀,作为成都最具特色的休闲文化,更是以其独特的魅力吸引着无数的游客。分析了休闲文化的成因以及农家乐、茶馆、
从全球支付行业的发展看,预付卡是继信用卡、借记卡之后零售支付领域的重要支付产品,目前已广泛应用于餐饮、超市、美容、健身等消费细分领域,并在公共交通、公用事业等行业
<正>全球油气恢复再平衡仍需时日唐代著名诗人王维在《山水论》中有一句话"画中山以丈来量,画中树以尺来测,画中马以寸来量,画中人以神韵揣度。"看画的这四种境界也可以用来
目的探讨前列腺基底细胞癌的临床特点及其诊治方法。方法分析1例前列腺基底细胞癌患者的临床资料,并结合文献对前列腺基底细胞癌的临床病理特征、诊断治疗及预后进行分析。结
本文结合国家项目“越野汽车T.C+AMT 自动变速系统的研究”,对T.C+AMT 的离合器及其控制系统进行了研究。1.论述了湿式离合器的设计方法及关键问题,对摩擦片上开槽型式对离合
脉冲功率技术在国防科研以及工业民用方面均有十分广泛的应用,脉冲功率技术中的关键问题之一是绝缘问题,它是系统稳定运行和轻量化、小型化的重要因素,随着脉冲功率技术的发
目的 :为带血供半腱肌肌腱转位重建后交叉韧带 (PCI)提供应用解剖学基础。方法 :在 5 0侧成人下肢标本上观测半腱肌肌腱的形态、血供来源、分支及分布特点 ;2侧新鲜下肢标本
体育教学评价是体育教学活动中不可或缺的一个过程,要提高体育教学质量就必须使用科学的评价方法。本论文在前人研究的基础上,从微观的角度,针对评价方法自身存在的局限性以