基于弱相关主题对齐的跨语言伪相关反馈

来源 :中国医学科学院/北京协和医学院医学信息研究所/图书馆2014年学术年会 | 被引量 : 0次 | 上传用户:wdq007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
跨语言查询偏移的问题在非平行网页中尤为严重,本文针对可比性较差的非平行多语言检索文档,提出了一个基于弱相关主题对齐的跨语言伪相关反馈模型.利用翻译知识建立不同语言主题之间的对齐关系,并提出融合了翻译以及web同现特征的多语言词项相似度评分函数,从弱相关对齐主题中抽取有用的扩展词.该模型有助于改善跨语言查询偏移问题,适合对可比性较差的检索文档进行跨语言反馈扩展.
其他文献
本文介绍了STKOS相关工具集成服务系统中的集成框架,以及集成框架下插件封装的设计思路和主要流程,并进行了系统实现和测试。系统能够将课题各成员单位提交的知识组织相关工具进行封装集成到知识组织工具集成框架中形成可被管理的组件对象,规范管理工具的输人/输出接口、功能类型等,实现了工具的复用、共享。封装后的插件也可被用于组建知识组织体系建设的工作流当中,用户按需求选择各种知识组织工具的核心插件,将这些核
本文主要从适用范围、建设流程、系统定级、系统设计、系统实施、系统测评与检查、信息系统中止、招标采购方式等角度,对等级保护制度和分级保护制度在系统建设过程中的异同点进行了对比分析.对比分析发现,信息系统安全等级保护和信息系统分级保护在很多方面存在着各自的特点。梳理和总结这些异同点将有助于更加深入的理解这两项基本制度,为以后信息系统筹建方在信息系统安全制度的选择、系统定级、招标方式等系统建设流程方面起
针对目前主从式云存储架构的用户对数据的可控性差、隐私感知度低以及存在单点失效等问题,本文研究并设计云存储安全体系结构.在P2P云存储框架中引入语义的结构组织方式,增强云存储系统的可扩展性和易管理性,为用户对资源进行复杂的语义搜索提供支持.在此基础上,构建基于语义P2P的云存储系统框架,并对语义P2P云存储架构各层的安全需求以及可供实施的安全机制进行分析,从系统架构层面为云存储系统的安全提供保证.
研究公众健康知识的移动APP服务模式,为公众随时随地获取、利用和分享健康知识奠定基础.本文通过调研与梳理国内外移动健康应用领域及核心技术,明确面向公众的移动健康APP技术方案,确定采用无线定位技术采集患者位置信息,从而实施就诊路线、就诊科室推荐、相关健康知识推送以及离院随访,实现对公众健康的及时管理.
本文首先分析了生物医学大数据的特点,从理论方面和数据查询对比试验两个方面,对比分析了以Oracle为代表的传统的关系数据库和以HBase为代表的NoSQL数据库在解决大数据问题各自采用的技术以及各自的优势与不足.接下来以一个药物基因组数据存储系统为例,进行云存储实践和初步的对比试验.最后对本文进行了总结,并就解决生物医学大数据问题的提出建议.
恶性肿瘤是威胁人类健康的最严重疾病之一,随着大数据时代的到来,肿瘤流行病的相关研究也有了新的研究方向.可视化技术是大数据时代数据展示的有效方式,有助于数据分析、数据挖掘.本文介绍了数据可视化的研究现状,设计具有良好的交互性、动态性、可扩展性的肿瘤流行病数据可视化系统,从多角度分析数据,使用不同可视化维度展示数据.为实际建设可视化系统提供理论基础和设计理念.
采用按时间先离散的方法建立主题模型,通过监测主题在不同时间片内的变化趋势进行主题演化分析.在各时间片中分别建立LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;使用Gibbs算法进行推理,获取主题-词和文档-主题的概率分布;利用KL距离来计算主题之间的相似度,刻画其演化情况.并以此方法对近十年中国医学类SCI论文进行了主题演化分析.
互联网日益成为公众获取健康信息的主要渠道之一.然而,尽管网络上的健康信息资源丰富,公众却仍然难以获得个性化的高质量健康信息.一些研究探索了从公众产生的问题中自动抽取其信息需求,如通过一体化医学语言系统(UMLS)对公众所提问题进行自动的多主题标注等.从一般主题角度对公众健康问题进行分类将是对这些方法的有益补充.因此,需要有一个主题分类体系来指导问题分类,同时需要有一些标注过的语料来训练机器实现自动
本文将实体词典以特征的形式引入到机器学习模型当中,提出一种基于实体词典与机器学习的基因命名实体识别方法,在GENIA 3.02语料上进行实验,测试结果表明,引入实体词典特征后,在获得较高的实体识别准确率的同时,优化了CRFs识别模型的时间复杂度,提高了系统的识别效率.
资源建设是国家人口与健康科学数据共享平台(下文简称"人口健康平台")建设的重点内容,资源建设成效对平台功能与服务有直接影响.本文对人口健康平台联合共建共享资源建设模式做了介绍,同时结合平台资源建设现状,指出平台资源建设面临的主要问题并提出相关建议,期望能为人口健康平台资源建设与共享服务发展提供有意义的参考.