三种主题分割方法的对比研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:cwg8872757
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高聚集性的特点实现片段边界的识别。从模型的特点、分割策略以及实验结果等角度对基于三种模型的分割进行对比。分析表明,基于LDA模型的分割比基于PLSA模型的分割具有更大的稳定性,且分割效果更好。基于小世界模型的分割策略更适合小世界模型特性明显的文本:
其他文献
提出一个安全有效的无证书群签名方案。该方案满足群签名的各种安全性要求,还允许用户动态地加入与离开且不需更新群公钥和其他群成员的签名私钥。群签名的长度不依赖于群成员
在L是完全分配格时,利用极大集与极小集所引入的L-直觉模糊集的截集,本文定义了L-直觉模糊凸集的概念,给出其与L-直觉模糊集截集的凸性之间的等价刻画.进一步研究了L-直觉模
用数论方法解决单位正方形的覆盖问题.用单位正方形的均匀布点方法估计覆盖面积的均值,方差及其分布函数.
将KyFan截口定理推广到FC-空间.作为应用,在FC-空间上进一步推广了Browder不动点定理,并研究了向量值函数的极大极小值,极大极小不等式以及鞍点问题.
如何从大量的图中挖掘出令人感兴趣的子图模式已经成为数据挖掘领域研究的热点之一。传统的频繁子图挖掘方法对满足最小支持度阈值的子图同等对待,但在真实数据库中不同的子图
在改进任意拓扑网构造光滑表面时,初始控制网格确定的情况下,生成的曲面形状惟一确定,最终的物体造型也随之确定,不具有可调性,因而在曲面细分过程中引入了控制参数和摄动。通过引入控制参数,调节一个参数值,使得所得的细分曲面的表达度可控,可以得到一系列的细分曲面。引入摄动是为了改进了空间位置,允许局部地调控约束曲面的形状。最后给出了曲面设计的实例,表明这种算法简单、有效。
给出了模糊C-正规子群、模糊极大正规子群的概念,并利用集合套理论给出了模糊C-正规子群的等价定义,同时研究了模糊-正规子群的一些性质。
研究带强迫项的二阶脉冲时滞微分方程的振动性,得到了若干判别此类方程振动的充分性条件,所得结果推广并改进了时滞微分方程的振动性理论中某些已知的相关结果.
在模糊值函数的模糊结构元表述理论的基础上,利用[-1,1]上同序标准单调函数类上的距离诱导出模糊值函数空间上的距离,证明了模糊实数空间与[-1,1]上同序单调函数类同胚.模糊数空间
研究了包含混合时滞的中立型奇异系统的鲁棒H∞控制问题,在HongLi提出的算子£(xt)=Ex(t)-Gx(t-h)稳定性的基础上,对既含有范数有界不确定参数又含有未知常时滞的奇异系统,得到存在无