Web文档中词语权重计算方法的改进

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lovezhizunbaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以向量空间模型作为Web文本的表示方法,对传统的TF*IDF公式进行了改进。首先,结合Web文本中HTML标签的修饰功能,体现了特征词在Web文本结构中的位置信息;其次,以广义信息论为理论基础,引入了基于二次熵的互信息作为权重计算公式的一项,体现了单词的类区分能力。实验验证了该方法的可行性和有效性。
其他文献
目的:测定EAE大鼠血清中MBP抗原和MBP抗体的变化,以探讨MBP及其抗体在EAE发病中的作用及可能机制.方法:MBP抗原和抗体的测定均采用双抗体夹心ELISA法测定.结果:血清中MBP抗原
传统的基于区域特征图像融合方法的一个难点是各源图像最佳权值的分配问题。该文利用径向基神经网络与T-S模糊推理模型具有函数等价性的特点,设计了一种模糊推理神经网络实现基于区域特征的图像融合,并用遗传算法优化网络参数。该网络能够自适应地动态获取优化的图像融合权值参数。仿真实验表明该算法有效可行,通过与传统的基于区域特征的图像融合算法相比,融合性能得到明显改善。
对影响锚板埋设施工质量的关键环节进行了归纳,介绍了确定下锚支延长线的2种方法,推导出了确定锚杆出土角度和锚坑位置的计算公式,提出了确定锚杆埋设位置、保证锚杆和锚板受
在研究目前信息系统中数据计算常用方法的基础上,根据数据计算过程的特点,利用SQL语言对数据库中数据操作的优势,提出了一种快速计算数据的方法,并利用由用户动态定义计算公
本刊讯(特约通讯员陈世平)蕉柑是诏安县近几年来发展较快的果树品种之一,全县现有种植面积667 hm^2多,已成为当地培植特色农业产业和促进农民增收的一大亮点。据介绍,诏安县将
目的:探讨卒中后癫痫的临床特点及发病机理. 方法: 对1500例卒中病例中136例继发性癫痫患者的临床资料进行回顾性分析. 结果:卒中后癫痫的发生率为9.07%, 早期癫痫发作5.73%,
首先介绍了小波变换的基本原理,并在此基础上详细说明了如何根据所要分析的信号设计最优小波,最后介绍了它在图像处理中的应用。实践结果证明运用最优小波对图像进行处理相比一
本刊讯 5月31日,浮山县农业技术推广中心组织果树专家服务组成员在张庄乡杨村和东张乡尧村进行果树生产技术巡回培训。上午,在张庄乡杨村专家组首席专家李振刚高级农艺师对果农
通过对网络环境下的档案信息资源整合进行探讨,分析了档案资源整合面临的困境,进而提出了网络环境下我国档案信息资源整合可采取的策略。
利用Micaps利用TBB、雷达回波等非常规资料对2004—2010年4—9月东部农业区短时暴雨、冰雹、雷暴三类强对流典型个例进行中分析.掌握不同过程中尺度对流系统发生、发展和消亡