【摘 要】
:
针对贝叶斯信念网络应用于话题识别进行了研究,提出了新的话题识别模型。模型的拓扑结构包括新报道、报道术语、事件术语、话题四层节点,用弧标明索引关系。在贝叶斯概率和条件独立性假设的基础上,模型运用条件概率计算新报道和已有话题簇的相似度,从而实现话题识别。考虑到核心报道、核心事件的重要性,对不同层次的权重计算进行了调整。实验采用DET曲线评测法对模型性能进行测试,实验结果显示,调整后的权重计算可在一定程
【机 构】
:
河北大学管理学院,河北大学数学与计算机学院,河北软件职业技术学院信息工程系
【基金项目】
:
保定市科学技术研究与发展指导计划项目(13ZR058),中国博士后科学基金资助项目(20070420700),河北省自然科学基金资助项目(F2011201146)
论文部分内容阅读
针对贝叶斯信念网络应用于话题识别进行了研究,提出了新的话题识别模型。模型的拓扑结构包括新报道、报道术语、事件术语、话题四层节点,用弧标明索引关系。在贝叶斯概率和条件独立性假设的基础上,模型运用条件概率计算新报道和已有话题簇的相似度,从而实现话题识别。考虑到核心报道、核心事件的重要性,对不同层次的权重计算进行了调整。实验采用DET曲线评测法对模型性能进行测试,实验结果显示,调整后的权重计算可在一定程度上提高新模型的性能,与向量空间模型相比,在相同阈值下新模型的漏报率与误报率有所降低。
其他文献
基于位置服务(LBS)在给人们带来方便的同时也引起了越来越多的安全隐患,位置隐私保护成为了学术界和业界关注的焦点。由于大部分用户是沿着道路交通网络移动,研究路网环境下的位置隐私技术更具有现实意义。通过分析路网环境面临隐私泄露的新挑战,从网络扩张匿名技术、X-Star匿名技术、Mix zone匿名技术三个方面对现有路网下的位置隐私技术进行了深入研究,比较了其隐私水平、服务质量等性能指标。最后,总结了
针对一类单输入单输出非线性动态系统的Volterra级数模型辨识问题,提出了灰聚类多子群自适应PSO算法,并定义了精度影响系数以定量评估模型结构项对辨识精度的影响程度。在利用Volterra级数对非线性系统进行初始建模的基础上,采用灰聚类多子群自适应PSO算法和精度影响系数实现了非线性Volterra级数模型的结构确认和参数优化辨识。将该方法与基于标准PSO、GA、QPSO算法的Volterra时
针对已有的OSPF路由选择协议作进一步的研究,分析并运用了数学原理中的禁位排列方法,设计出一种新的路由决策算法。研究表明,路由单链排列状态下,该算法与Dijkstra算法具有相同的时间复杂度;在实际网络结构下,存在算法的时间复杂度处于O(n2)到O(n3)之间或者该算法在时间复杂度是O(n3)时具有良好的优越性。网络拓扑结构改变,该算法具备较好的收敛性,说明该算法拓展了OSPF并能够应用到广泛的领
结合社会网络的"小世界"特性,利用社会网络指标中心度,提出一种基于中心度的副本控制路由(CRCR)算法。算法中,路由分为社区内和社区间两种情况,消息在社区内传输时,将消息限制在社区内;消息在社区间传输时,利用中心度效用值衡量节点的活跃度,增加消息到达目的节点的速度。仿真结果表明,CRCR算法与经典机会路由算法相比,具有较高的消息投递率、较小的网络开销和平均传输时延。
针对节点的覆盖优化过程极易受到各种攻击的问题,通过从信任管理的框架内深入探索可靠覆盖技术,提出了一种基于网格信任度的可靠覆盖算法。该算法对节点进行可靠性筛选和轮换调度,以并行覆盖的方式对覆盖区域内的网格点实施基于信任度的覆盖。对节点信任阈值的取值进行讨论,分析得出信任阈值的大小对整个覆盖区域的安全性和覆盖质量有很大影响。经过仿真与传统的单一覆盖机制作比较,该算法能有效提高网络安全性和延长网络寿命。
随着实验系统规模的不断扩大,系统运行成本高、周期长等问题逐渐显现,这就造成了实验数据获取困难、可供分析的实验数据量偏小等问题。因此,有必要通过合理的模型和方法分析原始数据的特点,对实验数据进行建模预测,获得足够的数据来对系统进行下一步的分析。针对此问题,以灰色理论为基础,在非等间距GM(1,1)灰色预测模型的基础上,首先加入残差校正模型来提高预测精度,同时对于原始数据具有周期性的情形,建立周期补偿
为实现远距离的无线通信,在网络中添加中继节点,采用多跳路由传输数据。对于中继节点的布局问题,依据线性结构使网络整体能量消耗最小的特征,提出一种中继节点贪婪布局算法。该算法通过最近贪婪策略、中继节点通信容量、传感器节点数据转发跳数等约束方法限制中继节点的布局位置。理论分析和实验验证了该算法能够有效减少能量消耗,延长网络寿命。
目前,问句相似度的计算主要借鉴普通陈述句的相似度计算方法。由于普通陈述句的相似性更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而以获取问句的深层语义信息,以提高问句相似度计算的准确性
针对生产过程中生产作业的优化调度问题,以生产质量、效率和成本阈值为约束条件,基于集对分析建立了的生产质量—效率—成本控制的生产作业多目标优化模型;利用快速非支配排序遗传算法(NSGA-Ⅱ)求解优化模型,得到相对确定条件下质量—效率—成本控制的Pareto最优解集。决策者依据实际生产过程需要,为各项生产作业从Pareto最优解集中筛选最合理的调度方案。最后,通过算例仿真验证了结合集对分析与NSGA-
为了使各个设施的整体利用效果最佳,结合空间位置影响力查询技术,提出了基于RKNN的选址算法。针对空间对象对空间位置的贡献具有多重性,建立了一种新的空间位置影响力的度量模型,该模型更加符合实际应用情况;然后,利用该模型计算选址方案中各个设施的影响力,并引入均衡系数评价选址方案的合理性,均衡系数越小,方案越合理。实际应用表明基于RKNN的选址算法使村镇基础设施的选址更加合理、有效。