基于公共块“补偿-对称”模型的微博文本相似度计算

来源 :通信技术 | 被引量 : 0次 | 上传用户:sadlyiwas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合微博文本的特点,提出一种基于公共块的“补偿-对称”模型算法。该算法对预处理的微博文本使用word2vec计算词项之间的相似度,并进一步将微博公共词块数量、词项顺序和微博标签话题等融入算法,以对称计算的方式计算微博文本相似度。实验证明,与传统公共块算法相比,该方法对于微博文本相似度的计算更加准确,文本分类准确率和召回率更高。
其他文献
据台湾《纸业新闻》报道,在国际浆价持续上扬带动下,用浆量大的生活用纸首当其冲,虽然纸厂出货价格已逐步调整,但末端售价依然在通路的价格战下未明显上扬,由于浆价后市持续看涨,业
在FPGA平台上实现了一种MIMO—OFDM系统的时间同步器。该同步器基于CAZAC序列的相关特性,采用了对接收信号进行量化处理,将复杂的复数相关运算变化成简单的映射,从而降低了运算
目的:探讨非ST段抬高型急性冠状动脉综合征(NSTE-ACS)病人血清高敏C反应蛋白(hs-CRP)、胱抑素C(Cys C)、载脂蛋白A(ApoA)、脂蛋白a[Lp(a)]与全球急性冠状动脉事件注册评分(GRACE评分)相关
近日,宁夏自治区经委新技术推广站推广的节电新技术在美洁纸业安装试运行取得较好的节电效果,单台使用节电率达25%。
卫星移动通信信道是典型的衰落信道,其存在的阴影效应、多径效应、多普勒效应给系统性能带来了较大影响,严重时会导致系统通信中断。协作通信技术利用不同节点间的相互协作,
安全多方计算旨在解决一组互不信任的参与方之间隐私保护的协同计算问题。自姚期智从1982年提出以来,随着云计算、电子商务技术的发展,安全多方计算得到了更加广泛的研究及应用
针对三元对等架构(TePA)的公钥证书管理和密钥托管问题,在TePA的密钥管理方法中引入并行密钥隔离机制,提出了一种基于可信安全架构的三元并行密钥隔离方案。该机制强化了对物
起皱工艺是使卫生纸与其他纸种的生产有所不同的独特的单元操作。在这一操作工序中,已成形的湿纸页经压榨后被紧贴在吸水毛毯上,并随之通过托辊被转移到热的扬克式烘缸上,在通过
目前,我国造纸机械行业仍处在初级发展阶段,一方面低档产品相对过剩,利润下降;另一方面高档产品需求量大,难以满足。国产纸机的市场占有率已下降到32.8%(按重量计)和17.2%(按销售额计)
海湾国家合作理事会(GCC)由沙特阿拉伯、阿拉伯联合酋长国、科威特、卡塔尔、阿曼及巴林等国组成。长期以来这些国家以石油财富著称,造纸工业则非常落后。但是,GCC地区正在准备