基于文本集密度的特征词选择与权重计算方法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:cheer4you
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据汉语语言自身的特点,在基于原有的特征项提取方法基础之上,提出了基于文本集密度的特征词选择的思想,对于特征项个数和选择进行了界定,找出了不损失文本有效信息的最小特征词语集,并且利用其中的中间值作为词语权重计算的一部分,创造出更为合理的权重计算方案.最后利用一种新的衡量权重好坏的标准--元打分法,对文中所提出的方法的正确性和有效性进行了实验和证明.
其他文献
本文介绍日本多摩新城第1 5住区的开发思路、设计组织模式和设计理念.该住区的实例对中国当前的住宅开发具有参考价值.
兴义煤田位于六盘水断陷区的南部,上二叠统龙潭组和长兴组为主要含煤地层,含煤地层主要分布于区内各背斜构造的两翼.本文对贵州兴义煤田含煤地层的特征进行分析,首先了解该煤
目的探讨儿童分泌性中耳炎采用耳内镜下鼓膜置管与腺样体切除术联合治疗的临床效果。方法选择40例分泌性中耳炎的儿童作研究对象进行回顾性分析,根据治疗方法分组,就单纯耳内镜
美国是当今世界上第一个制定、实施反垄断法的国家,已经积累了一百多年的司法实践经验。为了增强我国企业应对突发反垄断诉讼案件的实战能力,以维护我国出口贸易产业经济安全
针对静态图像行为识别研究缺乏标注数据的问题,在Android平台下,利用“众包”思想,设计并开发了基于静态图像的视觉行为人工标注系统。该系统主要包括分配标注任务、用户标注
前一段时间,微信朋友圈里围绕百度贴吧事件的议论持续发酵。笔者认为这是新年伊始非常有商业道德意义的中国社会公民意识觉醒的标志性事件。有关百度与谷歌的价值观对比引人
曾作为韩国经济中流砥柱的韩国财阀到了不得不改变的地步,同样具有“东方企业家的大企业情结”的中国国企在改革中需要警惕韩国财阀所遭遇过的“陷阱”
编者按:把古今中外哲学体系下的形上性科学和近代物理、化学体系下的形下性科学并列纳入我国科学体系之列的立场和观念,这就是大科学观。在科学结构的整体框架上,文学、艺术、政
报纸
此次新冠肺炎疫情警醒我们:由于现有医院、传染病院难以按灾害发生时需求容量进行扩建,因此,未来在加强公共卫生体系建设的同时,需要提前储备"战时"临时医疗中心快速实施方案
报纸
直驱式A轴摆动头是机匣加工五轴联动加工中心的重要发热部件,其发热产生的热变形对机匣的加工精度有直接的影响。文章通过对摆动头内置电机与轴承的发热量计算,并以Ansys Work-