基于Relative-IDF的医药数据相似度算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:joyceywq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医药数据相似度计算在药物信息处理中具有重要的作用。传统的文本相似度计算在医药领域并不能取得很好的效果。针对医药数据文本的特殊性,提出基于Relative-IDF的医药数据相似度计算算法。实验结果表明:相比传统TF-IDF、编辑距离等计算方法,基于Relative-IDF的医药数据相似度计算在效率和准确性上都有了很大的提升。
其他文献
通过在大豆上试验结果表明:"彩特美"细胞酶叶面营养剂有促进大豆生长发育,加快大豆生育进程,促进大豆提早成熟,增加产量的效果,亩增产大豆22.7 kg,增产13.3%。
为了提高数字信号调制模式识别在低信噪比下的正确率,通过分析基于稀疏表示的模式识别,提出了一种基于K-SVD和稀疏表示的特征提取方法。该方法首先引入主成分分析对样本进行降
为提高人工蜂群算法在求解优化问题中的性能,结合极值优化策略提出一种改进的人工蜂群算法。改进算法基于极值优化策略高效率的寻优机制重新设计了原算法中跟随蜂的局部搜索
转基因食品的安全问题一直为人们所关注,针对与食品链关系密切的转基因大豆在加工过程中各个环节进行分析及跟踪溯源研究,建立起我国转基因大豆的溯源与污染评估体系,为我国
问答系统因能提供方便的输入模式与更精确的答案而成为获取网络信息的重要手段。介绍了一个面向OWL知识的问答系统Agile,并着重阐述了其在问题规范和字典生成方面的技术方案。
复杂工程布局方案的设计是一个典型的属带性能约束的布局优化问题,难以求解。针对此类问题,提出了一种人机交互的混合式算法。该算法首先采取人工设计的布局策略,然后与人工蜂群
“全国大豆学术讨论会”是每四年举行一次的全国性专业学术活动,旨在为我国从事大豆科学技术研究的专家、学者和企业家提供学术交流、探讨合作以及产品与技术展示的平台,同时也
淮鲜豆6号为丰产、优质、中熟鲜食菜用大豆新品种,2013—2014年江苏省鲜食夏大豆品种区域试验平均鲜荚产量698.9公斤/亩,较对照品种通豆6号增产7.3%;平均鲜籽粒产量367.8公斤/亩
为基于模型的诊断系统设计建立了一个基本理论框架。以系统模型为基础,生成一组诊断测试,并以之代替系统模型而建立了一个基于测试的诊断系统。从完备和可靠性两方面证明了以测
针对有限元计算时遇到的大型线性方程组求解问题,提出一种解决方法,即对方程组的系数矩阵采用三角分解法,并用一维变带宽存贮,同时与分块法相结合,实现内存与外存数据的交换