【摘 要】
:
将复杂网络理论应用于文本挖掘技术,构造基于词汇共现性关系的词汇概念复杂网络,对文本词汇的重要性指标进行计算分析,挖掘文本中主题的关键词。在计算词汇重要性指标时,综合考虑
论文部分内容阅读
将复杂网络理论应用于文本挖掘技术,构造基于词汇共现性关系的词汇概念复杂网络,对文本词汇的重要性指标进行计算分析,挖掘文本中主题的关键词。在计算词汇重要性指标时,综合考虑目标词汇的频率以及其相邻节点的贡献度。通过实验对比,证实了该网络节点评价指标与基于加权度和加权集聚系数的综合指标相比具有优越性。此外,通过复杂网络社区合并的手段,发现了关键节点之间的网络拓扑关系,即核心网络。通过分析核心网络,可以获得关键词和文本主题的对应关系,为进一步的文本分析提供有效的理论基础。
其他文献
2013年初,国家相关文件将小吨位架桥机安装安全监控管理系统纳入了强制要求范围。中铁工程机械研究设计院根据市场需求,针对起重量为165t的小吨位TJ165型架桥机,采取将安全监
针对跃进煤矿深部采区工作面连续出现顶板突水的现象,分析了顶板突水的特征,对影响突水的各种因素进行了探讨,预测了顶板富水的区域,并对防治水中存在的问题提出了建议。
国家统计局测算,2003年1—9月我国生产总值同比增长8.5%,比上年同期增加0.6百分点,其中第3季度增长9.1%,比第2季度增加2.4百分点。2003年第3季度以来,随着“非典”疫情的解除
在对大规模数据进行蜻蜓算法优化时,由于要计算的维度过多,迭代次数过大,从而耗费大量运算时间,而基于Spark分布式计算可以减少大数据运算的耗时。将DA算法在Spark分布式计算
为保证压电材料定征结果的自洽性,基于单块样品采用超声谐振谱(RUS)技术实现了压电材料全矩阵材料系数的定征。本文阐明了利用RUS技术定征压电材料全矩阵材料系数的原理并给
铀尾矿水泥固化过程中,经常会遇到混合不均匀而导致强度较低、氡析出率高等问题。为了改善固化体的性能,在固化体中掺入一些其他固化材料,例如粒化高炉矿渣、粉煤灰和生石灰
二胡作为中国传统民族乐器,在历史长河中历经演变与发展,无论是二胡演奏、二胡创作、演奏技术创新、演奏风格丰富等等,都取得了耀眼夺目的成绩。随着二胡演奏艺术的蓬勃发展,
目的通过对62例骨质疏松并髋部骨折的治疗,探论其手术治疗的必要性及优越性.方法回顾分析了其的骨质疏松程度、术前并存症、手术方式、术后并发症.结果手术组平均住院22 d,并
建筑工程运行情况展现出了一个地区现代化经济水平,建筑工程作为重要的基础设施,所形成的效果也会对人们的物质生活水平产生直接影响。土木工程施工中,屋面、厨浴和外墙等位
本文研究了磁导率检测技术,该技术基于探头闭合磁路中的感应电压与磁通量的变化率成正比的电磁感应原理,来检测试样的磁导率变化。它是一种新的电磁无损检测技术,可用于评估和检测铁磁构件的微观结构变化,如应力集中,疲劳损伤,结构相变和老化变质。本文首先结合磁导率检测相关理论,以试验研究为手段,设计高灵敏度的检测传感器,最后,将磁导率检测技术应用于铁磁材料的应力集中、疲劳损伤、热处理质量及性能评估。这对于推动