基于组合特征的中文新闻网页关键词提取方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:countrygary
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文新闻网页的特点,使用了包括统计特征、位置特征和词性特征等在内的多种特征综合评定候选关键词的权重大小。对于部分分词结果不能良好地反映主题的问题,提出了一种基于有向图的组合词生成方法,旨在找出高频次的相邻词作为组合词。实验结果表明,该方法较传统的TF-IDF方法效率有较大提升,能够有效提取出新闻网页关键词。
其他文献
2012年5月17日,某县农业执法人员在依法对饲料市场例行检查的过程中,发现某饲料经营门店经营的某牌强化型猪场专用浓缩饲料有5袋已超过保质期,于是按照《饲料和饲料添加剂管理条
针对猪只死亡率高,猪只安全健康生产的环境控制技术问题,2012年5月22日,由中国畜牧兽医学会科普部、农村养殖技术杂志社主办,北京斛盛农业科技有限公司承办的当前国内养猪环境控
应用分析方法和Laplace变换,利用熵密度偏差的概念,研究了任意非负连续信源熵密度的极限性质,修正了赵静和魏杰所做的结果。
建筑节能是建设资源节约型社会的重要方面,建筑节能在整个社会节能中占据重要比重。建筑节能标准的推广至今已有30多年的历史了,但收效甚微。文中以沧州市建筑节能的推广现状为
目的:分析封闭负压吸引技术治疗褥疮创面的效果。方法:对褥疮创面51例采用封闭负压吸引技术治疗,创面低负压吸引7天为一周期,可连续使用2~3周期。创面不愈合者可再重复创面低负
利用改进的蚁群算法对机器人水下作业进行路径规划,找出能耗最低路径,提高机器人续航能力;将蚁群算法中信息素的更新改进为用能量表示,使转移概率受能量、距离双重影响。通过
随着信息技术的迅速发展,多媒体教学作为一种有效的教学手段走进了课堂.它图、文、声、像并茂,能使抽象知识具体化,化静为动,形象逼真地为学生呈现知识的形成过程,并能够超越时间、
目的:探讨心胸外科术后发生急性呼吸窘迫综合征(ARDS)的高危因素、早期诊断及治疗措施。方法:ARDS 27例中,单纯低氧血症14例予以面罩吸氧;需行无创呼吸机机械通气8例;行气管插管3
针对传统谱聚类算法应用于图像分割时仅采用特征相似性信息构造相似性矩阵,而忽略了像素分布的空间临近信息的缺陷,提出一种新的相似性度量公式——加权欧氏距离的高斯核函数,充分利用图像特征相似性信息和空间临近信息构造相似性矩阵。在谱映射过程中,采用Nystrom逼近策略近似估计相似性矩阵及其特征向量,大大减少了求解相似性矩阵的运算复杂度,降低了内存消耗。对得到的低维向量子空间采用一种新型的聚类算法——近邻
电子技术是一门实践性较强的学科 ,实践环节与操作技能的训练在课程中占有重要地位。教育部《关于全面推进素质教育 ,深化中等职业教育教学改革的意见》中指出 ,教育工作存在