中英文双语交叉过滤的逻辑模型

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:guobihuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章简要地描述了文本过滤的背景,提出了基于潜在语义索引的中英文双语交叉过滤的逻辑模型。其基本思想是改进双语交叉过滤中基于词汇对译的方法,而是利用双语文中潜在的语义结构,作为用户模板与文本匹配的基础。将出现的双语词汇和文本映射为语义空间的向量,不必翻译对译词,甚至不需要出现相应的对译词,也匹配成功,极大地改善了交叉过滤的精度,效果良好。
其他文献
2013年10月3日,上海,在“十一假日楼市”房展会上拍摄的被人丢弃在地上的各种宣传单。CFP供图  房地产泡沫,是经济学界、房地产界,乃至于全社会都关注的话题。过去十年,诸多专家学者炮制出“中国楼市泡沫论”,结果一个接一个被现实击败。近期,诺贝尔经济学奖新得主,美国经济学家罗伯特·席勒(Robert J. Shiller),2009年和2011年来访中国时指出的“中国房地产泡沫严重”,被国内媒体
民营经济战略转型升级的主攻方向,一是由粗放扩张向集约发展转型升级,二是由低端制造向高端制造转型升级,三是由拿来主义向自主创新转型升级,四是由传统竞争性产业向垄断陛产业转
藏语虚词研究是藏语自然语言处理中一项不可缺少的基础性工作,有着极其广泛的实际应用价值.它是藏文信息处理的核心和藏语自然语言理解的基础,在藏文校对、信息检索、双语对
信息量剧增导致建设远程教育支持系统中信息资源库时需寻求稳定安全、大容量的信息资源存储模式.本文通过研究分析当今流行的以服务器为中心、以存储为中心和具有可扩充性的N
文章首先回顾了分布式共享存储器(DSM)系统中主要的内存一致性协议,重点分析了释放一致性(RS)模型。在此模型的基础上对其进行了改进,提出了基于动态减少无效副本集的RC模型。
党的“十六大”报告,主题鲜明、内涵丰富、思想深刻、论述精辟,具有很强的理论性、思想性、前瞻性和指导性,是一篇马克思主义的纲领性文献。报告在“七一”讲话创新的基础上,又有
王国维以康德、叔本华哲学为指导,研究中国哲学史,美学史和文学史,这种研究具有开创意义,王国维以“审美无利害关系”这一命题为中心,接受和宣扬了一系列西方美学和文学思想观点,并
信息技术的发展导致并伴随着安全问题的产生,长期以来安全技术防范的目标都是外部闯入者,而忽视了内部人员的非法操作和主机(服务器)本身的安全。文章提出一种主机安全的模型框架
要把握<民办教育促进法>的核心内容,必须统一三点基本认识:一是办学体制与办学形式的多元化是教育优质均衡发展的必要条件;二是民办教育的公益性与投资者可以取得合理回报的
为了研究循环荷载下降雨前后无砟轨道桩网结构路基的动力特性,尤其是桩土相互作用特性,开展了4组大比例尺动力模型试验。试验结果表明:桩土差异沉降影响受加载力和降雨条件影