基于双语翻译的个性化搜索引擎的研究与设计

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:xiaoxianjihuoma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet已经成为人们获取信息资源和进行信息交流的一个重要途径,随着Web信息的日益增长,要想在信息量浩如烟海的互联网上搜索浏览自己需要的信息,成为了一项极具挑战的工作。虽然传统的搜索引擎的出现极大地提高了人们对网络信息的检索速度,在一定程度上解决了信息资源的定位问题,但还是无法满足人们日益增长的对信息服务个性化的需求,特别是不能对网络上现有的中英双语翻译的对照页面信息进行充分的利用。因此,个性化搜索引擎与双语辅助翻译的结合成为了当前一个重要的研究课题。本文针对现有的基于大规模网络语料库和双语网页搜索的辅助翻译系统在用户接口个性化方面的缺陷,利用显式和隐式两种方式获取用户兴趣爱好信息,对用户需求进行扩展,达到因时因人因地的不同,得到用户真正想得到的查询结果,更深层次上实现双语翻译搜索引擎的查全率、查准率。本文的主要工作如下:(1)对个性化搜索引擎的含义、基本类型、体系架构、工作流程以及目前存在的不足进行简要综述。(2)用户兴趣个性化信息的获取。分析用户兴趣个性化信息的收集方法和更新方式,重点从用户需求扩展、特征选择,以及文本聚类分析三个方面来进行分析,实现主动推荐和隐式发掘的一种个性化服务。(3)对系统模块实现的相关技术进行了相关的分析与研究,例如网络爬虫的改进、分词处理等。(4)对基于双语翻译的个性化搜索引擎进行了系统设计与实现,分析了模型中各模块的功能与实现技术。本文的研究与探索将为进一步研究基于大规模语料库和双语页面搜索的辅助翻译系统在用户接口个性化性能优化上,提供了一个良好的理论平台和开端。
其他文献
近几年来计算机病毒、木马数量成指数增长,泛滥成灾,严重威胁着网络安全。病毒从原来简单的破坏系统快速的蜕变到不法分子窃取用户虚拟财产的工具。计算机病毒制造的模块化、
随着计算机科学的逐步成熟和信息社会需求的提高,人们需要在日益庞大的信息中发现对决策有用的知识,数据挖掘作为一门新兴的交叉学科应运而生;随着信息技术的高速发展和互联
随着集成电路的特征尺寸进入纳米量级,持续降低的工作电压、急剧升高的工作频率以及明显提高的集成密度等原因,导致软错误率快速攀升。作为集成电路关键的应用领域之一,也是
无线传感器网络是新兴的下一代传感器网络,通常包括传感器节点(sensor node)、汇聚节点(sink node)和管理节点,可应用于布线和电源供给困难的区域、人员不能到达的区域(如受
随着互联网的飞速发展以及信息传播方式的多样化,互联网已经成为了人们获取信息和服务的主要渠道。但是,残疾人由于自身的缺陷,访问网页内容存在各种障碍,从而无法获取所需的
产品创新推理是制造业在市场竞争中取胜的关键,而产品的创新性主要取决于产品设计的概念设计阶段。功能模型是概念设计的核心处理对象,如何对功能模型进行快速有效的创新推理
动态拓扑是MANET网络最主要的特征。MANET网络拓扑的动态变化导致路径频繁中断,是造成网络性能下降的重要因素。因此,设计一种有效的MANET路径稳定策略,实现稳定路径的目标,
前处理是复杂问题数值模拟的主要性能瓶颈,涉及大量人工干预,其效率严重依赖于用户经验。可靠高效的自动前处理算法是提高数值模拟效率和精度的关键。前处理研究主要包含2项内
随着计算机网络技术和应用的迅猛发展,人们对互联网的需求也进一步提高,希望互联网能够有效地提供他们所需的各种服务。计算机网络及其应用的研究重心呈现出向应用层延伸的特征
随着计算机网络和移动电话技术的迅猛发展,人们越来越迫切需要发展一定范围内的无线数据与语音通信。AdHoc网络是一种没有有线基础设施支持的移动网络,网络中的节点均由移动主