一种GIS的中文分词算法研究

来源 :微电子学与计算机 | 被引量 : 7次 | 上传用户：txj8u5yhb

【摘要】

：

提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大匹配的算法,很好的解决了切分歧义和未登录词的问题.实验结果表明,该算法为GIS中文查询语句的正确理解提供了有效的语义信息.

【作者】

：

杨晓军王一莉

【机构】

：

南京工业大学信息科学与工程学院

【出处】

：

微电子学与计算机

【发表日期】

：

2010年07期

【关键词】

：

地理信息系统中文分词 TRIE树哈希结构分词词典 GIS Chinese segmentation Trie tree Hash structure

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

远程数据复制系统的日志保护机制研究

提出了一种减少日志溢出的DCM方法,论述了它的原理及实现算法.该方法在远程数据复制系统中得到了实现,在维护系统的高可用性的同时,减少了日志溢出的次数,降低了日志在发生溢

期刊

复制高可用性相位差replication high availability data phase difference

基于动态可重构技术的阵列型处理器设计

在现有可重构处理器设计的基础上,提出了一种改进的阵列型动态可重构处理器—IRAP.在IRAP中,将处理单元组成的阵列按象限划分为4个区域,每个区域包含个可配置的处理单元,运算

期刊

可重构阵列处理器并行计算SIMD数字信号处理reconfigurable array processor parallel computing SI

一种基于代理机制的组件组合方法

为了实现快捷有效的组件组合,提出了一种基于代理机制的免编程组件组合方法.应用继承的方法统一了组件接口,利用代理组件作为客户端与被组合组件交互的中间件,实现外部消息的

期刊

组件组件组合代理机制组件规范化component component composition agent mechanism component

钨合金壳体的超声检测及缺陷分析

采用纵波直探头和自磨制经校准的斜楔横波探头，对钨合金壳体部件进行了检测，并对钨合金壳体的缺陷定位、典型缺陷及其对应的回波特征进行了研究。结果表明，采用超声检测能够检测

期刊

超声检测横波探头缺陷定位波形分析Ultrasonic Testing Transverse wave sensor Defect location

远场涡流检测技术在反应流出物空冷器碳钢管束检测中的应用

反应流出物空冷器管束在使用过程中由于各种原因会造成腐蚀穿孔,引起高压高温介质泄漏,因此需要定期进行检测.讨论了远场涡流技术在带翅片和不带翅片碳钢管束上的应用,比较了

期刊

远场涡流检测碳钢管空冷器翅片Remote field eddy current testing Carbon steel tubes Air coo

2006年西南地区第九届NDT学术年会暨 2006年全国射线检测新技术研讨会第一次通知

2006年西南地区第九届NDT学术年会暨2006年全国射线检测新技术研讨会计划将于2006年11月在重庆市举行，同期将举办无损检测新产品和新技术展示会。会议由重庆市科协、重庆市无

期刊

新技术研讨会射线检测学术年会西南地区NDT第九届无损检测学会专业委员会重庆市研究中心

基于小波变换的瞬态压应力信号分析

黄土振动压实的压应力信号是一个含噪的非平稳瞬态突变信号.为了分析信号的联合时频特性,提出基于小波变换去噪和奇异值检测的信号分析方法.利用多分辨小波分解,选择性的提取

期刊

压应力信号小波变换去噪奇异值检测stress signal wavelet transform de-noising singularity

基于分布式动态功率控制的WLAN/WPAN自身干扰解决算法

文中提出的分布式动态功率控制(DDPC)算法能够在高密度WLAN/WPAN环境下大大提高每个用户的吞吐量,解决由于有限的信道所带来的自身干扰问题,尤其在变化不均匀的通信量条件下.

期刊

分布式动态功率控制自身干扰吞吐量信道质量DDPC self-interference throughput channel quality

基于概率潜在语义分析的Web用户会话识别

为提高Web用户会话识别的准确性,给出了一种基于概率潜在语义分析模型（PLSA）和竞争奖罚（CRP）算法的Web用户会话识别方法.其核心内容是利用PLSA模型计算出请求页面和每一个活动用

期刊

会话识别概率潜在语义分析竞争奖罚算法最大期望值算法WEB使用挖掘session identification probabilistic laten

2006年欧洲无损检测大会征文

第9届欧洲无损检测大会(ECNDT)将于2006年9月25—29日在德国柏林召开，会议由德国无损检测学会(DGZfP)承办。现诚邀各领域的无损检测研究人员、用户、制造商和技术服务人员踊跃

期刊

一种GIS的中文分词算法研究

与本文相关的学术论文