彝文网页文本分词平台

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:shenlixi44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器翻译、自动分类、搜索引擎等技术中,彝文分词具有很重要的作用,同时也是彝文信息处理至关重要的环节.本文以当前的彝文分词技术为基础,通过构建彝文词库,并用彝文网页获取平台抓取彝文网页文本,结合彝文特有的优势,从分词词库、分词算法、结构流程、系统界面和模块、实验结果等方面进行了详细的分析,最终实现彝文网页文本分词平台.最后的结果表明,本平台分词准确率较高,实用性和通用性也较好.
其他文献
传统的小波阈值去噪方法会造成有用语音信号的损失,信噪比改善情况不理想.通过分析小波去噪原理,提出了一种改进的小波阈值函数语音增强方法.该方法结合小波软、硬阈值函数去
进入21世纪以来,知识数据大量存储在文档中,但各类文档的粒度和结构不便于知识的加工、整合和管理.如何从这些无序的、非结构化的数据(知识)源中提取语义,首要任务是将蕴藏在数
为了提高光伏发电功率的预测精度,提出一种改进BP神经网络的光伏发电功率预测模型.首先采用包括室外温度、光照辐射量、风速等作为输入层节点,交流发电功率作为输出节点,引入
隐蔽集作为QBF问题的重要结构之一,能使QBF这一难求解问题变得更加简单.QBF问题中隐蔽集的求解相当复杂且难以理解.为了使读者更好的理解QBF问题中隐蔽集的求解过程,本文对QB
虚拟化是云计算的关键技术.Hypervisor在虚拟机与主机硬件之间提供了一个抽象层,允许用户为运行着的虚拟机分配的内存总值超过主机的可用内存,这种技术称为内存过量分配.为了
提出一种基于Laplace变换的图像配准算法.首先利用经典的角点检测算法提取待匹配图像的特征点或角点;其次利用相位相关法估算出两幅图像的重叠区域,以缩小匹配范围;然后对角点邻域模板区域施行Laplace变换;最后利用基于改进的SSIM(结构相似性)作为相似性度量准则建立特征点之间的匹配关系.实验结果表明,该方法可以很好的完成特征点匹配,匹配点对充足且具有很高的准确率,而且对亮度差异具有一定的鲁棒性
为了获得更高的网络吞吐量,更低的端到端时延,设计出了一种适用于分簇网络的水声传感器网络MAC协议,该协议采用接收方建立握手机制,有效的获取邻居节点通信时的状态,动态分配
为了加快Android移动端图文信息的加载速度,方便用户快速浏览界面获取相关信息,在汲取前人的相关技术基础上,结合了Android图像开源视图smart-Image-View、网络请求框架andro
本文提出了一种分布式的移动设备异常检测系统,该系统采用客户端-服务器架构,客户端程序在移动设备上持续提取特征并传送给服务器,服务器使用异常检测算法分析特征.根据人类
针对Hadoop中提供底层存储的HDFS对处理海量小文件效率低下、严重影响性能的问题.设计了一种小文件合并、索引和提取方案,并与原始的HDFS以及HAR文件归档方案进行对比,通过一