论文部分内容阅读
分析讨论了Intranet环境下对搜索引擎Web站点文本、MP3、图片三类数据的实时索引问题。我们的工作与Google、百度不同的是MP3、图片数据采用的挖掘特征信息进行实时索引的方法,减少了索引文件对磁盘空间的需求,削减了人工分类的麻烦。最后在BOT和UJCENE软件包的基础上,设计并实现基于上述分析技术的Web搜索引擎。经实际测试,效果良好。