Nutch的中文问题研究

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:devil521zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要讨论Nutch中存在的各种各样的中文处理问题,修改并实现Nucch的中文分词、中文文档处理、FTP中文搜索等功能,解决了Nutch在搜索时Web显示中文乱码的问题。
其他文献
针对装配作业调度优化问题,考虑装配过程中工具的更换次数、零件装配方向的改变次数和零件装配类型的变化次数的影响.提出一种支持多目标和多优先级车间调度策略的规划模型,给出
探讨VRML当中交互式动画的构成要素和原理以及实现的方法.通过一个实例说明应用交互式动画原理实现复杂动画的过程。
为了进一步做好冷季型草坪养护管理工作,对草坪的修剪、施肥、浇水、对杂草及病虫害的防治等需要注意的环节进行了简单介绍。
为了更好地在高校中开展《人工智能》课程的教学,根据该门课程知识结构的特点,结合当前流行的教学改革模式,提出了以资源库利用为核心的《人工智能》课程教学模式和综合兴趣、问
学生是教学的主体,学生对教学的评价扣建议对教学改革起到重要的指导作用。从学生的视角剖析现在大学本科计算机专业的教学情况.列举一些给学生们留下深刻印象的优秀教学方法,分
教学模式改革是精品课程建设的重要内容。基于高职《数据结构》精品课程的建设实践,从基于工作过程导向的课程设计、项目驱动教学、启发式教学、发现式学习等方面时《数据结构
从信息技术出发,分析现有网络营销模型在数据采集方面的不足,并在城市主题的虚拟社区的基础上建立了一种新的网络营销模型,在此基础上探讨了模型的优点和特点,并给出了各层的功能
从建设项目的投资决策阶段、设计阶段、建设项目施工招标阶段、建设项目实施阶段等方面综合分析了合理进行造价控制的必要性和有效措施,指出建设工程全过程的工程造价控制是工
天津市自行车研究院成立于1978年,在此基础上于1987年组建国家自行车质量监督检验中心。研究院占地面积6600m^2,建筑面积8000m^2。拥有检测、计量校准设备300多台(套),其中引进的
针对水资源短缺与污水资源化的需求,在市科委的支持下,泰达新水源公司实施的“天津市滨海新区城市水环境质量改善技术与综合示范”项目,获得科技部资助,列入国家863计划。