【摘 要】
:
该文对二种能够精确描述文本词频分布的齐普夫型分布——韦林分布和山石等发展的新分布进行了较透彻、全面的研究;根据齐普夫型分布和实际数据分布的特点发展了四种有效的模
论文部分内容阅读
该文对二种能够精确描述文本词频分布的齐普夫型分布——韦林分布和山石等发展的新分布进行了较透彻、全面的研究;根据齐普夫型分布和实际数据分布的特点发展了四种有效的模型参数估计方法;为了验证韦林分布这二种理论模型及其应用方法的有效性,选取取中型和大型规模的文本,分析理论模型与词频实际分布的拟合效果;利用新分布对文本的整个生成过程进行动态模拟,考察文本规模的增大对模型各参数以及新词进入率的影响.
其他文献
该文从网络环境和电子文件的定义入手,通过回顾国内外研究现状和论述网络时代电子文件运行和管理的理论基础,分析得出电子文件运动和管理的四项基本内容:电子文件的产生(形成
该文将数据仓库的理论与实践相结合.针对其特点进行了深入地分析和研究.该文共分六部分:第一部分介绍数据仓库产生的背景、特点以及发展现状;第二部分着重就数据仓库的体系结
论文分为五个章节:第一章绪论是作者论述的理论起点,对档案开放实践和理论进行历史回顾,阐明作用选题的原因及目的,并概述档案开放与公民权利的关系.第二章、第三章、第四章
本体的概念最初出现在哲学领域,指一切实在的最终本性。随着本体的概念被引入到人工智能领域,本体及其相关知识已经在图书馆学、情报学、语义网络、知识工程等领域得到广泛应用
基于校园足球现状和存在的问题,我校不断探索校园足球发展新思路,研究足球竞赛制度改革对校园足球发展的作用,通过足球赛制改革可行性研究提高学生参加足球运动的兴趣和能力,
论文通过对数字图书馆系统结构和元数据作用的分析,提出以元数据为基础的数字图书馆信息系统对数字图书馆的重要意义,是现阶段数字图书馆信息系统的主要发展方向.基于元数据
“我们希望借由这个聚会来称颂米拉莱斯的一生,向他致敬,并与所有爱他的人共同分享.”rn“We want to celebrate the life of Miralles in this festive meeting,pay tribute
本文以"虚拟图书馆与传统图书馆关系研究"为题,试图通过对虚拟图书馆及其相关概念的辨析,在总结中外虚拟图书馆发展的基础上,从虚拟图书传统图书馆的特征与功能、文献资源、
随着信息化和全球化竞争的加剧,文档信息在企业内越来越受到重视。许多企业都建立了相应的信息系统,加强了文档信息工作。但结果却并不全令人满意,大部分企业内都存在文档信息系
20世纪50年代初,史学界对中国近代史资料进行了大规模的整理和出版。在这项工作中,由中国史学会主编的《中国近代史资料丛刊》(以下简称《丛刊》)对近代史研究的影响最为深远。但