ICTCLAS 相关硕士博士期刊学术论文

ICTCLAS相关论文

基于XML的全文检索方法及原型系统实现研究

随着社会信息化的发展,人们已迈入了信息时代,并朝着知识时代迈进。在这一时代背景下,信息对企业或组织的作用越来越突出,成为企业......

学位

XML Lucene ICTCLAS 全文检索系统

沪深股票信息的文本分类

从网上收集相关的文本信息,用ICTCLAS进行分词,用Java编程处理、转化为Weka的ARFF格式,再利用String To Word Vector过滤器转换为......

期刊

股票文本 ICTCLAS 文本分类 economic differences Fu Jian Pilot FTA coordinated industria

云计算平台上两种中文分词算法的实现对比研究

现如今,常用的中文分词算法为IKAnalyzer(简称为:IK)和ICTCLAS(简称为:IC)两种,这两种算法也可以说是如今的主流中文分词算法,为了......

期刊

云计算 IKAnalyzer ICTCLAS HADOOP 比较

汉语词法分析系统ICTCLAS在Nutch-0．9中的应用与实现

分析了Nutch的语言分析器结构，针对Nutch对中文进行单字切分的不足，结合基于多层隐马模型的汉语词法分析系统ICTCLAS，以JavaCC脚本设......

期刊

NUTCH LUCENE ICTCLAS 中文分词汉语词法分析系统 Nutch Lucene ICTCLAS Chinese segmentati

利用JNI实现ICTCLAS系统的Java调用

介绍了Java本地方法的作用及意义,详细讨论了在Windows平台上,利用JNI(Java NativeInterface)在Java中调用ICTCLAS系统进行词法......

期刊

Java本地接口本地方法 ICTCLAS 词法分析

A Comparative Study on the Two Chinese Versions of The Apple Tree by John Galsworthy

A Comparative Study on the Two Chinese Versions of The Apple Tree by John Galsworthy...

期刊

CORPUS The APPLE TREE COMPARATIVE study WORDSMITH ICTCLAS

基于词性的文本挖掘算法在IDS日志中的应用

提出一种以词性为参考值的文本挖掘算法，能有效挖掘与种子词有关的关联规则。基于Bootstrapping算法思想，既减少了预处理阶段对于词......

期刊

词性 ICTCLAS BOOTSTRAPPING 入侵检测系统数据挖掘 part of speech ICTCLAS Bootstrapping IDS

中文短文本相似度算法研究及其在电视节目管理中的应用

随着互联网、智能终端的普及和发展,信息化交流越来越便捷,每时每刻都在产生大量的信息,电子文本信息是其中一种重要的传播形式。......

学位

节目匹配算法短文本相似度算法 ICTCLAS 网络爬虫

ICTCLAS汉语词法分析系统的研究与改进

中文分词(Chinese Word Segmentation)指的是将汉字序列按照一定的规则组合成词序列的过程,它是中文信息处理系统中的一个重要部分......

学位

中文分词 ICTCLAS 隐马尔可夫分词算法双数组Trie树算法

2009共享版ICTCLAS的分析与使用

汉语的分词是汉语信息化、现代化的一个重要步骤,也是汉语分析的必经之路。本文通过对2009共享版ICTCLAS(中国科学院计算技术研究......

期刊

ICTCLAS 分词汉语信息化

ICTCLAS中文词法分析的Delphi调用研究

深入研究了ICTCL AS2011的API,并利用Delphi实现了对其所有API的调用。...

期刊

ICTCLAS 中文分词 Delphi

标准文献共享公共服务平台开发

目前很多标准文献技术服务部门的信息化建设经过不断的努力,已经建立了一批以标准名称查询、文献咨询服务为核心的业务管理和信息......

学位

SSI Web Service XML Lucene ICTCLAS

基于层叠隐马尔可夫模型的中文命名实体识别

本文提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法，旨在将人名识别、地名识别以及机构名识别等命名实体识别融合......

期刊

中文命名实体识别角色标注层叠隐马尔可夫模型

论文相似度分析系统设计

论文抄袭是困扰学术界的严重问题之一,当前,英文论文的相似度分析主要采用数字指纹和字符串匹配等技术,该技术发展应用的比较成熟,......

学位

复制检测词频统计指纹识别 ICTCLAS KMP算法

基于层叠隐马模型的汉语词法分析

提出了一种基于层叠隐马模型的汉语词法分析方法 ,旨在将汉语分词、词性标注、切分排歧和未登录词识别集成到一个完整的理论框架中......

期刊

汉语词法分析分词词性标注未登录词识别层叠隐马模型 ICTCLAS

基于GATE的中文信息抽取系统的开发和实现

面对网络化、数字化、海量分布、复杂的信息资源,数字图书馆还不能有效地揭示和发现信息之间内在的知识联系。信息抽取技术的出现,......

学位

知识技术中文信息抽取英文信息抽取中英文混合信息抽取 GATE ICTCLAS

论文相似度的计算研究——基于VSM模型

当前论文抄袭现象时有发生,对于学术的严谨性产生负面影响。通过基于VSM相似度计算模型,采用ICTCLAS分词技术及MS OLE自动化技术,......

期刊

VSM模型 ICTCLAS OLE自动化

基于Lucene的企业搜索引擎

随着信息化进程的加快和深入,越来越多的企业建起了自己的企业网站(Intranet),而且这样的网站规模越来越大,数据越来越多、种类也......

学位

搜索引擎 Lucene 中文分词 ICTCLAS 文本提取 DWR

基于Lucene.net全文检索在文档管理中的应用

针对文档管理中的全文检索功能的开发,综合运用Lucene.net、ICTCLAS等系列开源类库,建立文档解析器,将解析文档内容存储于数据库中......

期刊

Lucene.net 文档解析 ICTCLAS 索引全文检索文档控制

校园网钓鱼邮件监控系统的研究与实现

随着计算机网络的发展，垃圾邮件问题和邮件欺骗问题变得越来越严重，给广大网民带来巨大危害。为了保障网络公共安全，减轻垃圾邮件和钓......

期刊

网络钓鱼深度包检测技术 LIBNIDS ICTCLAS 敏感词

看过本文同时还关注