搜索筛选:
搜索耗时2.0680秒,为你在为你在102,285,761篇论文里面共找到 17 篇相符的论文内容
类      型:
[学位论文] 作者:龚才春,, 来源:中国科学院研究生院(计算技术研究所) 年份:2008
伴随着信息时代的到来,我国互联网事业和通讯事业发生了翻天覆地的变化,导致以电子形式存储和处理的数据爆炸性增长,存储成本的降低进一步使海量数据的存储和处理成为可能。...
[学位论文] 作者:龚才春, 来源:山东大学 年份:2004
本文在总结学术上已有关于计算机文字识别成果的基础上,描述了计算机文字识别的基本过程,介绍了几种常用的数字字符识别方法和汉字字符识别方法,对已有字符识别方法的改进主...
[期刊论文] 作者:龚才春, 刘荣兴,, 来源:山东大学学报(理学版) 年份:2004
给出了一种从脱机手写体汉字字符中识别笔顺的法则——统一笔顺法则,将脱机识别问题转变为联机识别问题,利用人们熟悉的图论知识加以解决,大大提高了识别率和识别速度,也简化了识......
[期刊论文] 作者:龚才春,刘荣兴, 来源:计算机应用与软件 年份:2005
本文描述了现有字符细化算法的思想及其缺陷 ,并且在分析细化形变根源的基础上给出了一种面向字符识别的快速细化算法。该算法不仅速度非常快 ,而且不会产生毛刺和伪分支点 ,细化后字符骨架形变很小。......
[期刊论文] 作者:龚才春,刘荣兴, 来源:计算机工程与应用 年份:2004
该文通过模拟人眼识别数字字符的过程,提出了一种基于字符整体特征(凹凸特征)的快速手写体数字字符识别方法。该方法不需要对字符图像做复杂的细化处理,减少了细化形变可能带来的误识和拒识;也不需要进行复杂的笔道特征分析,因此速度非常快。同时,由于不同人书......
[期刊论文] 作者:龚才春,黄玉兰,许洪波,白硕, 来源:第三届全国信息检索与内容安全学术会议 年份:2007
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法。本文提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划......
[期刊论文] 作者:贺敏,龚才春,张华平,程学旗,, 来源:计算机工程与应用 年份:2007
提出了一种基于大规模语料的新词识别方法,在重复串统计的基础上,结合分析不同串的外部环境和内部构成,依次判断上下文邻接种类,首尾单字位置成词概率以及双字耦合度等语言特征,分别过滤得到新词。通过在不同规模的语料上实验发现,此方法可行有效,能够应用到词......
[期刊论文] 作者:刘祥涛,龚才春,刘悦,白硕,, 来源:中文信息学报 年份:2010
Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器:Rainbow对节点拥有的文件资源进...
[期刊论文] 作者:黄玉兰,龚才春,许洪波,程学旗, 来源:中文信息学报 年份:2008
本文提出了一种基于伪相关反馈模型的领域词典自动生成算法。将领域词典生成过程视为领域术语的检索过程:假设初始检索出来的前若干个字符串与领域相关,将这些字符串加到领域词......
[会议论文] 作者:黄玉兰,龚才春,许洪波,程学旗, 来源:第四届全国信息检索与内容安全学术会议 年份:2008
本文提出基于局部性原理的有意义串提取算法.本文发现有意义串遵循空间局部性原理和时间局部性原理,并用LE值量化字符串的局部性.在此基础上,利用LE值和其他统计量共同提取有...
[期刊论文] 作者:龚才春, 杜振雷, 周华, 陈国贤, 来源:中国科技术语 年份:2023
近年来,全球掀起了元宇宙的投资和创业热潮,同时元宇宙也成为学术研究热点。“元宇宙”概念的泛化和定义模糊给相关研究、学术交流和产业发展造成了障碍。文章以元宇宙的概念为出发点,梳理了“元宇宙”术语定义的发展过程,对全国科学技术名词审定委员会提出的“元宇......
[会议论文] 作者:龚才春,贺敏,张华平,许洪波,程学旗, 来源:2007年全国网络与信息安全技术研讨会 年份:2007
已有基于内存的频繁模式发现算法需要的物理内存是语料规模的几倍甚至几十倍,本文提出一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每...
[会议论文] 作者:龚才春,张华平,许洪波,程学旗,白硕, 来源:第七届中文信息处理国际会议 年份:2007
提出了一种面向中文短文本流的快速编码识别算--CodeFinder.CodeFinder构造一个编码识别专用词典,并对每个词语关联一个编码可信度。扫描待识别文本并计算文本在各种可能编码...
[期刊论文] 作者:龚才春,贺敏,陈海强,许洪波,程学旗,, 来源:通信学报 年份:2007
提出了一种大规模语料频繁模式快速发现算法,通过采用合适的策略将语料划分为若干子语料,对每个子语料单独进行处理,即可获得原始语料的频繁模式;同时该算法能够避免处理频次在设定阈值以下的模式,进一步减少了内存占用,提高了处理速度。实验表明,对3.6G互联网......
[会议论文] 作者:龚才春[1]黄玉兰[1]许洪波[2]白硕[2], 来源:第三届全国信息检索与内容安全学术会议 年份:2007
编辑器的拼写校正、搜索引擎的查询纠正、光学字符识别的结果检查等领域都用到词典近似匹配算法。本文提出了大规模词典近似匹配的多重索引模型,首先将背景词典根据单词长度划......
[会议论文] 作者:刘祥涛,曾依灵,龚才春,白硕,鲍旭华, 来源:第五届全国信息检索学术会议CCIR2009 年份:2009
Kad网络中存在数百万的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关...
[会议论文] 作者:刘祥涛,龚才春,曾依灵,白硕,鲍旭华, 来源:第五届全国信息检索学术会议CCIR2009 年份:2009
Kad网络中存在数百万的共享资源,而其中有相当一部分可被评定为敏感资源。首先用我们的Kad网络采集器:Rainbow对节点拥有的文件资源进行探测;然后对节点资源和敏感资源进行相关统计分析。我们发现:1)只有3.09%的节点拥有资源;2)文件长度和文件流行度都近似符合Zipf......
相关搜索: