基于动态阈值和命名实体的双重过滤话题追踪

来源 :计算机应用研究 | 被引量 : 12次 | 上传用户:X395381435
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法。该方法中,研究了KL距离计算初始阈值,并筛选出候选报道;然后,根据报道时间特点研究了动态阈值方法;最后,抽取追踪话题和测试报道中命名实体,计算命名实体间的相似度以及命名实体相同的个数来选出相关报道,完成话题追踪。通过实验证明该方法的可行性,实验结果表明基于动态阈值和命名实体双重过滤方法能有效地改善话题追踪的性能,并有效降低了话题追踪的误报率和漏报率。
其他文献
细支气管炎的诊治近况高培会综述四川省雅安地区医院内科(625000)刘立荣审校华西医科大学附属第一医院呼吸内科细支气管炎是呼吸道中小气道炎症的病理名称[1],是气道吸入多种损伤性物质的
针对现有方法在定位效能和适应性方面的不足,提出一种基于污点状态空间的脆弱性可疑点定位方法,在动态污点分析的框架下,建模扩展污点状态机模型,通过离线轨迹文件分析指令执行时的污点状态迁移,同时设计了多类非安全迁移规则,检测并定位脆弱性可疑点。构造原型系统并进行测试的结果表明该方法能在未触发脆弱性的条件下较完备和快速地定位多类脆弱性可疑点。
传感节点感测数据易受到干扰,导致传感节点获取的数据出错。为此,提出基于二值数据的多目标容错定位算法(MOFTLBTV)。该算法研究传感节点的差错概率的情况,利用传感节点的二值数据对目标源进行识别及定位。在识别过程中利用分布式竞争领导者(DCL)算法产生领导者(leader)节点。通过估计leader节点数实现对目标源的识别。随后定位阶段采用基于网格投票(GBV)机制对目标源进行定位。在条件下将MO
提出了一种混合多种局部搜索算法的嵌套分区算法用于求解中小规模旅行商问题。该算法使用加权抽样法产生初始最可能域,用带约束的3-opt局部搜索算法搜索每个子域的最优解,然后对Lin-Kernighan算法进行了改进,并且用改进的Lin-Kernighan算法搜索每个裙域的最优解,最后通过实验分析法确定了子域和裙域最优的抽样个数及初始最可能域的长度。对TSPLIB中15个问题实例的仿真结果表明,所提出的
稀疏表示分类方法(sparse representation-based classifier,SRC)在模式识别领域展现了巨大的潜力。基于稀疏表示分类的鉴别投影(SRC steered discriminative projection,SRC-DP
针对当前国内外环签名安全机制在具体实践中的安全隐患,提出了基于格结构的强约束验证方环签名安全机制(SCLS_IM)算法。该算法根据已有的小整数解困难问题,引入强约束概念,完善
接收信号强度(received signal strength,RSS)在WLAN室内定位环境中存在时变特性,降低了WLAN定位环境中RSS信号与位置信息之间的相关性,致使定位精度降低。针对这一问题,提出通过利用独立成分分析(independent component analysis,ICA)对RSS信号进行数据降维和去相关处理,提取独立分量;然后采用核典型相关分析(kernel canonic
针对混合像元分解误差问题,提出一种基于拉格朗日算法的高光谱解混算法。通过变分增广拉格朗曰算法提取出部分端元,由于端元组中存在相似端元影响解混精度,利用基于梯度的光谱信
近年来针对频谱泄漏抑制方法的研究受到广泛关注并取得了很大发展。根据DFT处理过程阐述了频谱泄漏现象并从理论上分析了频谱泄漏原因,给出了一种频谱泄漏衡量指标和抑制系数,阐明了长程和短程两类频谱泄漏的内在联系。根据频谱泄漏类型,分别从短程频谱泄漏和长程频谱泄漏两方面,综合论述了现有频谱泄漏抑制方法的基本思想、算法原理和特点,最后对频谱泄漏抑制方法的发展前景进行了探讨和展望。
针对云计算技术中的资源调度时间长、开销大、不考虑调度安全的问题,在对常见的云环境下工作流任务的资源调度问题进行建模的基础上,提出了一种强安全约束机制下的云计算任务调度方案。该方案按照所用方法的安全强度,再加上相关软件的安全程度,赋予虚拟机不同的安全等级;另一方面,其按照用户的需求等诸多方面,能够赋予操作不同的安全需求等级;最后使用变近邻粒子群算法对该问题进行了求解。在Cloud Sim仿真平台上的