HTML文档分类中的词元权重算法

来源 :山东师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:deskleg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对WWW的HTML结构,采用TFE表示,给出一种新的TFE实现方法.在此基础上,探讨了基于向量空间模型的词元权重函数的构造方法,描述了权重函数,研究了先前比较典型权重函数.把整个文档作为一个空间,提出一种更有效的文本权重调整方法.试验结果表明,该算法对文本分类的准确率有明显提高.
其他文献
天地广场工程设计为地下二层地上十一层,基坑开挖深度12 m。该工程位于繁华市区,基坑周边环境复杂,基坑支护难度大。结合该工程地质条件及地下水情况,考虑支护结构的安全性、
本文分析高中体育教学中学生不重视、参与度低,教学未与学生心理健康有机结合等问题,提出新课改背景下创新高中体育教学模式的有效途径:树立全新的教学理念,实现体育教学与学
【摘 要】本文论述终身教育视阈下职业教育—社区教育共同体建设,从开展职业教育—社区教育共同体建设的政策依据出发,分析职业教育—社区教育共同体内涵和建构的意义,从在职业院校开设社区教育学院模式、职业学校与社区教育机构共同参与县域职业培训网络建设模式、社区学院与高职院校共同打造社区教育品牌模式等方面提出职业教育—社区教育共同体建设的措施。  【关键词】终身教育视阈;职业教育—社区教育共同体  【中图分
对公路交通流进行监测可以找到交通流的时间分布规律,及时发现突发事件,进而采取更有效的措施保证公路的服务水平.本文介绍了无线通讯网络为了保证服务质量采用的位置管理方式,同
提出了利用单幅电子散斑物体变形相位图分离二维分量的方法.传统电子散斑干涉技术测量得到的是物体变形的混合相位场.当物体具有对称变形时,可通过图像处理的方法,获得二维变形的分量值.利用三点加载的简支梁进行了实验,给出了实验结果,验证了该方法的正确性,该方法保持了传统电子散斑干涉系统的简单、稳定、便于应用的优点,并进一步得到了二维场分量的信息.
直肠癌是最多见的大肠癌,治疗仍以手术为主。近年来,直肠腔内彩超检查(以下简称腔内彩超),越来越多地用于直肠癌的诊断和术前检查,为临床诊治提供更多的信息。本文对腔内彩超诊
以海兰蛋鸡为试验对象,进行了噁唑酰草胺原药在蛋鸡体内的代谢试验,寻找给药后其在蛋鸡排泄物中潜在的代谢产物。采用UFLC-QTRAP-MS中多反应监测扫描、母离子扫描、中性丢失
目的:了解本院鲍曼不动杆菌临床分布特征及其对常用抗生素的耐药状况,为临床使用抗生素治疗提供科学依据。方法:统计分析570株鲍曼不动杆菌的标本来源、感染科室分布及耐药情况
低碳经济是以低能耗、低污染、低排放为基础的经济模式,如何有效实现这种经济模式,正是目前各国致力研究的问题.笔者在分析英国、日本和美国等发达国家低碳经济运行模式的基础上