基于LDA的中文词语相似度计算

来源 :北京化工大学学报：自然科学版 | 被引量 : 0次 | 上传用户：jttzw

【摘要】

：

针对基于语料库统计的词语相似度计算方法存在的一些缺陷,如：计算量大、向量的特征维度高、特征稀疏、忽略了词语的语义信息等,提出了一种基于latent Dirichlet allocation（LDA

【作者】

：

吕亚伟李芳戴龙龙

【机构】

：

北京化工大学信息科学与技术学院

【出处】

：

北京化工大学学报：自然科学版

【发表日期】

：

2016年5期

【关键词】

：

词语相似度 LATENT DIRICHLET allocation(LDA) 主题模型 word similarity latent Dirichlet al

【基金项目】

：

中央高校基本科研业务费（JD1502）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对基于语料库统计的词语相似度计算方法存在的一些缺陷,如：计算量大、向量的特征维度高、特征稀疏、忽略了词语的语义信息等,提出了一种基于latent Dirichlet allocation（LDA）的词语相似度计算方法,通过将词语的特征向量映射为词语的主题分布来计算词语间的相似度;通过与基于《知网》的词语相似度计算方法的对比,证明了该方法能有效降低特征维度,并具有较好的词语相似度计算效果。

其他文献

悬臂式调谐质量阻尼器抑制管道振动研究

基于调谐质量阻尼器(TMD)的结构振动控制机理,将调谐质量阻尼器应用到管道的振动控制中。针对传统弹簧结构无法满足高频振动下调谐质量阻尼器刚度设计要求的问题,设计了一种

期刊

调谐质量阻尼器管道高频振动振动控制模态分析tuned mass damper(TMD)pipelinehigh-frequency vibra

金属锌改性HZSM-5催化的固定床反应器中甲醇芳构化工艺条件优化研究

通过等体积浸渍法制备了Zn改性的HZSM-5催化剂,并在连续流动固定床反应器上研究了Zn-HZSM-5催化剂的甲醇芳构化性能。结合X射线衍射(XRD)、吡啶吸附傅立叶变换红外光谱(Py-IR

期刊

金属改性工艺条件甲醇芳构化温度控制metal-modifiedprocess conditionsmethanol to aromatics

基于非球面工件曲率的打磨斑均匀性优化方法

为了解决非球面工件打磨过程中由于打磨点处曲率变化导致的打磨斑不一致的问题,研究了基于打磨工具下压量变化的打磨斑均匀性优化方法。首先建立打磨几何模型并对打磨斑面积

期刊

非球面曲率打磨斑均匀性下压量aspherical curvature polishing spot uniformity compressio

水热法制备纳米酚醛树脂微球的研究

以间苯二酚（R）、甲醛（F）为原料,氨水为催化剂,十六烷基三甲基溴化铵（CTAB）为表面活性剂,氯化钠（Na Cl）为添加剂,在乙醇与水按照一定比例形成的混合溶剂中,采用水热法合成酚醛树脂微球

期刊

酚醛树脂微球水热法表面活性剂纳米粒径phenolic resin microsphere hydrothermal method surfactan

大豆苷元在有机溶剂中溶解度的测定和关联

采用动态法通过激光监视技术分别测定了大豆苷元在乙醇、丙酮、二甲基亚砜、四氢呋喃、N,N-二甲基甲酰胺和N-甲基吡咯烷酮6种有机溶剂中281.98~338.75 K温度范围内的溶解度,

期刊

激光法大豆苷元溶解度相平衡关联方程有机溶剂laser diffraction assistance methoddaidzeinsolubi

对编码结构光采集图像的区域分割

对图像进行阈值有关处理时,局部内容的处理效果会受到图像中其他部分的影响,导致分割效果不佳,且常用的分割方法是针对单一连通域的处理,并不适用于分割由大量连通域构成的形体内容。为了对这样的内容进行分割,本文提出一种基于数理统计原理的分割算法,自动的划分出采集图像中主要内容的部分,并利用两个参数控制轮廓的尺寸和外形。通过实验对比了直接处理和本文方法处理的识别符号数量,结果表明,本文算法将图像中前景区域划

期刊

结构光图像处理统计算法structured lightdigital image processingmathematical statistics

多功能电参量测试仪的LXI总线接口设计

针对基于单片机的多功能电参量测试仪的LAN etension for instrument（LXI）总线接口设计,给出了一种线路简单、成本低并具有抗电磁干扰特性的硬件接口设计方案;根据国际程控仪器

期刊

LXI总线以太网接口程控仪器标准命令(SCPI)电磁兼容性LAN extension for instrument（LXI） bus ethernet

疲劳裂纹在TA2板中扩展及超载迟滞效应的实验研究

以中心裂纹拉伸M(T)试样为试件,研究了TA2钛板中Ⅰ+Ⅱ复合型缺口裂纹在不同载荷条件下的扩展情况,重点研究了在恒幅载荷和超载载荷下新裂纹的起裂、扩展和迟滞。结果发现在TA

期刊

Ⅰ+Ⅱ复合型缺口裂纹裂纹转型裂纹扩展速率迟滞效应Ⅰ + Ⅱ mixed mode notched-crackcrack mode transform

低压电力线载波通信压缩感知信道估计方法

针对低压电力线载波通信多径信道,建立了正交频分复用（OFDM）基带传输系统和低压电力线载波通信多径信道传输特性模型,并根据传输特性模型与模型参数,实验得出了低压电力线载波

期刊

压缩感知(CS)信道估计多径信道正交频分复用(OFDM)compressive sensing（CS） channel estimation mul

~4He中热流对超流转变温度下压作用的研究

考察4He中热流Q对液氦超流转变温度Tλ的下压作用。借助一种带毛细管结构的小型密封瓶,只需简单控制密封瓶控温平台和下池的温度,就可以获得稳定、平坦的超流转变温坪。由于

期刊

4He超流转变温度密封瓶热流下压效应4Hesuperfluid transition temperaturesealed cellheat

基于LDA的中文词语相似度计算

与本文相关的学术论文