网络蜘蛛Nutch的分析、定制与二次开发

来源 :2009年中国高校通信类院系学术研讨会 | 被引量 : 0次 | 上传用户:hua1kai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Nutch是一款非常优秀的开源的软件。需要快速构建自己的搜索引擎时,可以考虑用Nutch来实现.Lucene和Nutch是针对国外英文系统环境的搜索引擎,不太适合直接构建中文环境的搜索引擎。当需要改变其工作方式时,可以采用修改其配置文件的方法来实现;当需要扩展其功能时,可以采用增加插件的方法来实现;当需为搜索引擎增加某一功能,而插件的方法不能满足要求时,可以考虑用修改源代码重新编译的方法来进行二次开发。 Nutch的开放式结构以及插件的机制使得开源软件的二次开发的设计不再成为很困难的工作,而其源代码的清晰、易读也为二次开发中的编码工作提供了很大的方便。除了上述举例的二次开发外,还可以通过二次开发来改变它的网页排序部分、网页解析部分、将解析的内容存入数据库等,使得Nutch能满足更多的需求。
其他文献
本文利用三维激光扫描仪获得物体的表面数据,采用径向基隐式曲面插值方法对散乱数据进行了曲面重构,在表现细节的同时修复大量缺失数据,获得了较逼真的物体形态模型.实验结果表明,基于径向基函数的隐式曲面插值具有良好的精确性和光滑性,而且算法简单,可操作性强.基于径向基插值的曲面重建对农学、植物学的研究有重要意义,同时也是计算机辅助几何设计及几何建模的一个难点问题.
虚拟现实(Vitual Reality,VR)和计算机仿真(Computer Simulation)技术是当前计算机应用中最广泛的实用技术.建立虚拟战场仿真环境,实现研究区域的真实环境再现以及作战态势的预见与以上两种技术密不可分.本文从图形模拟的角度出发,以真实感和实时性为目标,重点探讨了爆炸火焰特效的实现技术,并基于三维图形引擎Gingko实现了相应算法.实验结果表明,本文所采用的方法具有较大的
本文研究圆域B样条曲线的降阶问题,即用降一阶后的圆域B样条曲线包住原曲线.给出了圆域B样条曲线可精确降一阶的充要条件和精确降阶公式,并给出了整体法和分段法这两种降阶逼近算法.通过实例验证了两种算法的正确性,并对它们的逼近误差进行了比较分析.该降阶算法能在降阶的过程中保留原曲线的误差信息和逼近误差信息,其结果有利于随后的几何操作.
本文针对现实生活中的书及现有的电子书在信息显示和交互方面的不足,采用视频手势的交互方式和虚拟现实技术实现了一种新的三维可交互书,使得用户通过手势不仅可以获得文字及图片等二维信息,而且可以获得更为直观的三维信息.文章从手势设计、手势识别及系统实现等方面进行了具体分析.实验表明,该系统在信息的组织呈现和交互方面具有很好的应用效果,特别是针对儿童,可以达到寓教于乐的目的.
本文提出一种基于哈德码变换的数字水印算法.原始图像先被分割成一系列8×8大小的图像块,而阿诺德变换作用在原是水印上以获得更好的鲁棒性.然后,对每一图像块进行哈德码变换.接着,通过修改每一图像块的变换系数矩阵中两个系数之间的关系在每一图像块中嵌入1比特水印.最后,对修改后的系数矩阵作哈德码逆变换.实验结果表明,本文的算法对各种不同的攻击具有鲁棒性.
本文提出一种新的基于水印的可逆图像认证方案.该技术对原始图像的差分图像的直方图进行微小平移,从而平缓地修改像素值以得到一个高的嵌入容量.如果含水印未被篡改,则由嵌入引起的失真可以在水印提取后完全去除.与现有的基于差分图像的可逆水印方案相比,本文框架只对差分图像的直方图做小改动来获得一个相对较高的嵌入容量,但代价是失真有所增加.不过,仿真实验结果证明含水印图像的峰值信噪比值仍然很高(大于45.12d
三角域上的V-系统是一类由分片二元多项式构成的正交函数系,函数系中既有连续函数又有间断函数.本文利用三角域上V-系统对三维艺术几何造型进行频域表达,并利用V-描述子对不同的几何艺术造型给出差异比较.实验结果表明V系统对复杂的、连续间断并存的几何信息特征提取是有效的.艺术造型的这种新的表达方式,有利于对其造型整体作频谱分析.
为了实时有效地跟踪目标,提出用目标区域内的颜色混合高斯模型来表示目标,通过目标模型对图像序列做反向投影,并结合Camshift算法对目标进行定位跟踪,并在目标被严重遮挡时利用卡尔曼滤波估计目标运动状态.实验结果表明该算法快速高效,具有很好的准确性和稳定性.
奥林匹克精神就是相互了解、友谊、团结和和平竞争的精神。中华民族在悠久的发展历史中,积淀和形成了自己独特而伟大的民族性格和民族精神。中华文化的基本精神,表现为自强不息、厚德载物、居安思危、乐天知足、崇尚礼仪等特征。中华文化的核心和精髓,就在于“和合”两字。通过借助奥运这次空前的国际体育、文化盛会,向世界展示中华民族优秀的文化传统,并传播中国的文化,增强与世界各国人民的沟通和了解,带动我国的各项事业发
提出了一种基于中指和无名指之间特征点的掌纹定位方法.利用平面几何的方法在中指和无名指之间寻找两点连成直线构成x轴,以该直线与掌纹边界的交点为坐标原点建立直角坐标系,从而提取ROI区域.即使在分辨率极低的情况下,仍能准确的定位.