论文部分内容阅读
为满足用户对特定领域信息或知识的精确查询需求,以知识图谱相关技术为基础搭建一个图书信息查询系统,通过HttpClient API中的GET方法获取网页中的文本资源,利用Jsoup API封装解析器抽取文本中的有效数据;经过数据预处理将有效数据转化为RDF三元组数据,利用KNN算法完成文本分类,即依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别;利用Java EE软件开发技术以及MVC软件设计模式搭建信息查询系统;调用中科院开发的NLPIR汉语分词系统所提供的CLibrary接口中的GetKeyW