基于位置的文本特征加权方法研究

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:leeo_1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
TF-IDF是文本特征赋权的常用方法.该方法简单易行,但没有考虑位置因素对特征赋权的影响.通过修改因子,分析不同条件下文本表现形式的差异,提出3个基于位置的文本特征加权方法.随后的文本分类试验表明,此加权模型相比较于传统的方法,均具有较好的文本标注效果.
其他文献
提出了一种基于SOPC技术的高速数据采集和传输系统的解决方案.该系统通过在一片Altera公司Cyclone Ⅱ系列的FPGA芯片上配置Nios Ⅱ软核处理器、自定义的接口逻辑、传输模块和
Pseudc-LRU替换算法可以避免复杂的硬件设计,所以在很多流行的Cache内存系统被使用.但是该算法的主要缺点是二叉树结构的顶层节点不能包含所有底部叶子节点的信息,在某些情况下
<正>1 改进型中心指示器的制作现在市场上出售的X射线探伤机中心指示器存在两个问题,一是由于指示器的底座是由铸铝制作的,容易滑丝且不易修复;二是拉杆天线多次使用后拉脱,
小赵,一个帅气的小伙子,但在英俊外表和礼貌举止下透露出的却是神情低落身心疲惫。“我是个强迫症患者……”小赵第一句话就说出自己的症结,他已经在心理门诊确诊,口服药物缓解了
为了克服入侵检测系统对孤立点敏感的缺点,采用半监督学习方法改进入侵检测系统.在检测时标签数据及其相关信息较难获得.针对这一特点,利用半监督学习方法改进算法,减少了对
网页分类器设计的核心是对原始分类数据集进行分类规则挖掘,提出了基于混沌粒子群算法的分类规则抽取方法.该算法采用实数编码,令特征类别作为粒子的恒定属性,适应度函数从支
为了降低OFDM系统中的峰均功率比,提出利用反正切变换对OFDM信号进行压扩处理.反正切压扩可以在压缩大信号的同时,增强小信号,从而提高了OFDM系统的误码率性能.仿真结果表明,与著名
介绍双频涡流检测传感器的工作原理,设计和制作,以及与EEC-35型智能全数字多多频涡流检测仪的联机调试。
目前还不能实现IPv4-IPv6之间直接的数据通信.只有通过隧道技术,可以实现IPv4-IPv6之间数据通信.文中通过对GRE隧道技术、手动隧道、自动隧道、ISATAP隧道技术的试验应用,成
以OpenSSL0.9.8e实现的RSA密码系统解密/签名执行过程为攻击对象,以RSA密码实现过程中利用的蒙哥马利模乘算法中的额外约简步骤为突破点,以随着密钥位的不同而会产生不同的约