融合要素及主题的汉越双语新闻话题分析

来源 :计算机工程 | 被引量 : 0次 | 上传用户:wumin0371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双语话题分析与发现是当前国内外的研究热点,但针对特定文本研究较少。为此,在汉越双语新闻文本中,基于双语主题分布词的汉越文本相似度计算方法,提出融合标题、关键词以及实体等并针对新闻文本的新闻要素特征。将这些新闻特征信息融合到文本相似度计算中构建双语文本相似度矩阵,对汉越双语新闻文本采用自适应K均值算法进行聚类,分析汉越双语新闻话题。实验结果表明,与仅考虑新闻文本相似度的计算方法和K均值聚类方法相比,该方法的准确率、召回率和F值更高。
其他文献
作为现代新儒家代表人物之一的徐复观从艺术化的哲学角度对《庄子》进行“再发现”,他对《庄子》艺术精神的揭示与对《庄子》美学的深度发掘,对启发思考《庄子》具有审美倾向
标准粒子群优化算法的速度更新机制为比例-积分(PI)控制策略,而由于其中固有积分项的存在,系统容易产生振荡,导致搜索速度慢。为此,根据比例-积分-微分(PID)控制特性,提出一
【正】使用这套分离性肱三头肌训练计划来将你大臂的口径从9毫米转变成M16。从解剖学上看,在胸部训练日里练习肱三头肌,这意味着它不会像分离性单独针对它们的训练那样高效。
在增加手臂围度和胸部肌肉厚度的同时,你还应该关注力量和爆发力的增长。与引体向上是测量上半身力量的重要训练动作一样,在腰部悬挂重物做双杠臂屈伸,同样令人印象深刻。不
【目的】分析湖光岩玛珥湖流场、温度、密度、浮性频率的三维空间结构、时间演变及其与风场的关系。【方法】于2017年1-4月,用三维超声风速仪、安德拉海流计、ADCP、CTD等进
针对离散粒子群优化算法进行基因特征选择容易陷入局部最优解的问题,提出一种基于离散粒子群优化和邻域约简的组合优化算法。利用邻域约简挖掘基因数据本身蕴含知识的特点,依据决策属性对条件子集的依赖度构造离散粒子群优化算法中的优化函数,根据优化函数值的大小引导粒子搜索最优基因特征子集,从而解决局部最优的问题。实验结果表明,与粒子群优化和遗传算法的混合优化算法、优化的邻域粗糙集等算法相比,该算法能够获得较高的
GSH是由谷氨酸、半胱氨酸和甘氨酸组成的含巯基的三肽,广泛存在于生物体内。它参与维持细胞的正常氧化还原状态。对于需要巯基的酶有保护与恢复活性的功能,从而促进糖、脂肪
许多种类的昆虫,如蝇蛆、蝗虫、蚕、蛾、蜂、蚁等都可以作为畜禽的饲料应用,而且繁殖快、数量大、蛋白质含量较高,易于饲养。因此,开发昆虫用作饲料资源,对促进我国畜牧业及饲料工
基于雾天图像成像模型的去雾方法在天空区域易产生失真现象,并且存在边缘处透射率计算不准确的问题,为此,提出一种图像去雾方法。该方法基于变分模型构建含有数据项、平滑项和边缘保持项的能量泛函,利用梯度下降流法最小化该能量泛函以达到透射率的精确求解,根据已获取的透射率值和雾天图像复原理论实现图像的精确复原。实验结果表明,该方法在天空区域和边缘区域的去雾效果优于传统方法,具有更小的均方误差值和更大的结构相似
现如今颈椎病已经不是什么少见的疾病了,每天到医院治疗的患者不计其数,这些人大部分都是由于不良生活习惯造成的。长期的伏案工作,再加上极少运动,使现在的颈椎病越来越年轻