在未分类英文文档集中挖掘相关词的方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:johndovl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在搜索引擎结果相关性判断、文字语音转换与识别等领域中,如何准确地分析单词之间的搭配关系是主要研究问题之一。利用互联网中的海量信息,在对大量英文网页进行统计分析的基础上,利用单词的出现频率和单词对的共现频率归纳总结出了未分类互联网页面中单词相关程度判定的经验性结论,提出了一种基于文档集统计分析的单词相关程度排序方法和计算公式,并根据该方法实现了分布式的英文单词相关性挖掘系统的原型。
其他文献
半监督分类算法试图根据已知样本对特定的未知样本建立一套进行识别的方法和准则。渐进直推式分类学习算法是一种基于SVM的半监督分类学习方法,在基于渐进直推式分类学习算法
探讨和研究了如何提升图书馆服务管理水平,并提出了提高大学图书馆服务管理的方法与对策。
提出了一种基于遗传算法的不规则件优化排样的求解方法,通过剩余矩形匹配算法实现解码和局部寻优,并结合正交靠接算法实现自动排样。实例证明,该方法是有效的。
结合某斜腿刚构桥的设计工作,参考众多已有的研究成果,拟总结得出斜腿刚构设计中的规律性问题,或可为该类桥梁的设计提供参考.
Multi Agent实现是基于Multi Agent的分布式测控系统动态任务调度算法实现的关键技术。采用Java作为开发工具,根据Multi Agent的功能,详细论述了Multi Agent在分布式测控系统
期刊
分析了国内外教材的使用现状、高校图书馆开展教材循环利用的依据及优势,提出了在高校图书馆设立捐书室,发动义务馆员开展教材循环利用、管理的对策。
对欧美铁路信号系统安全保障相关的技术法规、工作流程、相关责任及安全审批等基本要素进行分析研究,针对我国铁路客运专线和既有线信号发展现状,提出了信号系统安全评估体系构架的建议。
依据JJG 99-2006《砝码检定规程》要求,参照JJF 1059-1999《测量不确定度评定与表示》国家计量技术规范,对1 000kg F2等级砝码标准装置的不确定度进行评定。
商办铁路为主的铁路体制,对抑制洋股,抵制洋债,防止铁路利权流失起到了一定的作用。但由于清末社会经济体制的自身不足,商办铁路体制的致命弱点暴露无疑。商办士绅封建专制的劣根