中文文本分词及其可视化技术研究

来源 :现代计算机 | 被引量 : 1次 | 上传用户:pk8984812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据和人工智能是当前计算机领域的两大热门方向,其应用正在改变我们的生活、工作和学习,其中一个应用就是自然语言处理。分析处理文本,首先需要进行分词,文本分词是自然语言处理的基础。Python是当前一门广泛使用的计算机语言,功能强大,已作为大数据和人工智能处理的首选程序设计语言。介绍基于Python的jieba中文分词工具和WordCloud词云工具,并在此基础上进行实现。
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
以成果导向教育(OBE)为指导,以提高专业人才能力培养为基准,通过对IT行业进行调研,掌握行业对数据库人才的需求标准。借助校企协作,理顺课程在专业中的定位和对专业的支持度,
随着改革开放的不断深入,我国加强了和世界的联系。近年来我国出国留学的人员很多,与此同时,也有很多外国留学生来华学习,这些留学生有很多对中国的文化很有认同感,希望来中
本文从羊草不同移植密度、种子田最佳灌水组合、刈割次数(刈割量)、种子收获时间等方面研究羊草结实规律。通过采取一系列农艺措施,解决了羊草结实大小年、羊草有性繁殖"三低
针对MWC系统中OMP算法所涉及的最小二乘问题,通过伪逆公式转换将问题转变为求解n维共轭对称复数矩阵的逆,在FPGA平台上设计基于改进型Cholesky分解法的复矩阵分解模块、下三
郁金香为球根类春季花卉,花姿优美,花色艳丽,花期早,在景观花卉中应用较广泛。文章从地块选择、水肥管理、种球处理等方面介绍了宁夏六盘山区景观郁金香栽培技术。
针对虚拟视点合成,提出一种新的基于深度图像的渲染算法流程。该算法使用层次聚类来解决虚拟视点合成中的遮挡问题。通过统计每一个遮挡周围的像素的深度分布,对像素深度使用凝聚式层次聚类来决定遮挡周围的深度平面个数。选择最远深度平面中的像素作为恢复该遮挡的候选像素,提出的算法在Middlebury stereo数据集上的评估取得很好的效果。
本文主要解析高职院校宠物医学专业顶岗实习教学模式,从顶岗实习经济投入不足、对顶岗实习的学生实施监管的难度大、顶岗实习评价机制不完善、学生不重视顶岗实习等现状出发,
区块链是分布式数据存储、共识算法、加密算法等计算机技术的新型应用模式。区块链证明了拜占庭容错的共识算法的可行性,这对于多中心、去中心化的企业应用具有重要意义。通
由于分布式链路监控系统中接入的微服务的数量越来越多,需要监控的应用数量也越来越多。分布式链路监控系统中提供的有可视化界面查看,但需要运维人员或者开发人员登录监控系