基于手机图片搜索引擎的设计与实现

被引量 : 0次 | 上传用户:zhuzhihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究工作是针对手机图片搜索引擎的应用背景,以构建手机图片搜索引擎为目标,提出基于文本检索方式的Web图片搜索引擎设计方案。本文重点地研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对真实数据进行实验和分析的基础上,提出了若干关键技术,用于系统的设计,现归纳如下:本文提出对PageRank算法的改进。PageRank值仅依赖于网络的链接结构,而与具体的检索内容无关。无论得到多少的检索语句,PageRank也是一定的、文件固有的评分量。本文提出的方法通过细致地分析并利用真实数据进行实验验证,总结了9条提取模式,用于从这些结构中提取与图片相关的信息,以保证提取到的信息相关性程度较高。研究了三种具体的提取方法:基于DOM的方法、基于字符串的方法和基于Wrapper的方法。提出了过滤无用图片的方法,提高了系统中图片的可用度。该方法将图片文件大小小于某一阈值,图片的长或宽小于某一阈值,图片的长宽比例超过某一阈值以及同一网页内通过<img>引用次数超过某一阈值的图片作为无用图片剔除。探讨了将LSI算法应用于图片搜索引擎来整合文字和内容信息的方法,并通过简单实验进行了效果验证。
其他文献
近年来,甘南州认真贯彻落实中共十七届六中全会和省第十二次党代会精神、《甘肃省加快文化大省建设的若干政策规定》和州十一次党代会提出的实施“文化撑州”战略、建设“文
索力是斜拉桥结构状态评估的重要内容。对拉索进行实时在线的观测、分析、评估,从而掌握斜拉桥拉索的健康状态,已成为斜拉桥构建健康监测系统的重要部分。利用监测系统对结构的
数字媒体时代的设计主要基于计算机技术。今天,信息传达方式的变化导致了设计方式和风格的变化。设计的取材,形式,效果更多样化,同时也要求设计更具时代感,科技感,人机界面更
随着农村电子商务的迅猛发展,农村电子商务信用体系建设成为关注的焦点之一。本文针对农村电子商务中的信用体系问题,将农村电子商务价值链层次主体进行农产品提供商—农产品
随着现代教育视野的不断改革与发展,国家也加大了对各地学校的支持与投入,但实际上各地区的教育还是呈现不均衡化,这种不均衡逐渐的催生了寄宿制,而中等职业技术学校正是因为
期刊
“被”字句是现代汉语中的一种重要句式。本文旨在讨论被字句中“被”字的隐现规律及“被”字有无对整个句式的影响。本文拟运用句法分析、语义描写与语用解释相结合的方法,
随着课程改革的不断深入,作为一名初中思想品德教师,有必要从理论上探究适合新形势发展要求的教学方式,用于指导教学实践。案例教学是教师根据课程教学目标和教学内容的需要,
蔬菜属于劳动密集型农产品,是中国加入WTO后具有比较优势的农产品之一,出口额在我国农产品出口中位列第二。因此,中国不仅是蔬菜生产大国,也是出口大国。近年来,我国蔬菜国际
2006年国家发展的国民经济社会“十一五”发展纲要、中国中长期发展规划纲要、国家“十一五”文化发展规划纲要,在这三个规划中,数字出版技术、数字化出版印刷复制和发展新媒