基于图论的片段合并方法研究

来源 :应用科技 | 被引量 : 0次 | 上传用户:shalaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对抄袭检测系统的文本对齐模块无法处理大规模数据的问题,提出基于图论的片断合并算法,通过寻找图的连通分支实现了片段合并的优化,减少了重复计算的时间。将片段合并算法与Hadoop的MapReduce计算框架结合,使片断合并算法在集群中并行的执行。实验表明,基于图论的片断合并算法在集群中的并行执行能缩短文本对齐模块运行时间,可以在短时间内处理大量的文本数据。
其他文献
核电厂退役阶段将产生大量的中低放废物.在设计和运行阶段研究和估算退役阶段可能产生的中低放废物总量,可以尽早规划中低放废物的处置场,评估运行阶段所筹集的退役中低放废
本文从我国翻译文学期刊的发展及其译介活动与我国新时期文学创作的内在关系分析入手,采用引用、例证等方法,从译介主体、译介手段、译介客体、(内容、重点、特点及译介作用)
辜鸿铭,中国近代史上的怪杰,在激烈的民族冲突和文化冲突中,他谴责列强行径,为国家主权辩护;他挞伐西方文化,极力捍卫中国传统文化,并向西方倾力推荐,成为东方文化的代言人。辜鸿铭文
为深入诊断某±500 k V换流站切除交流滤波器时发生的小组断路器重击穿故障,就保护装置的比例差动保护动作、零序差动保护动作进行了分析研究。通过查证SER(sequence even