结合受控词汇表的生物基因本体标注与分类

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:stoudemire21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过研究有关基因的生物学文献特征,提出了一种能对生物基因文献进行自动标注与分类的方法.在K最邻近算法的基础上,采用了Chi-Square特征选择方案,并且在加权算法中突出了Chi-Square的选择特点.另外,采用文档逻辑分块法,将额外的生物受控词汇表中的信息所形成的向量直接引入到了分类算法中,以提高分类和标注的效果.实验表明,所提算法优于常用的单词频率/逆文档频率加权方法,其在文本检索大会(TREC)数据集上的分类、标注效果分别比TREC公布的最好结果提高了3.14%和4.12%.
其他文献
1996年11月和1997年3月,对漕泾-柘林的近岸海域的浮游生物进行了调查,1996年11月浮游植物平均密度为3.39×104个/L,密集于高潮带,主要有舟形藻、圆筛藻、直链藻等5种藻类,舟形藻
针对冗余度机器人梯度投影逆解算法和数值优化方法在处理位移层面附加作业任务时存在的不足,基于自运动流形,推导出直接面向位移寻优的冗余度机器人运动规划的新算法.新算法将运
考虑多组序加试验,在Weibull分布场合给出参数的点估计,其数学处理比较简单
gis技术应用在医疗急救体系,可实现医疗急救地理信息的查询,即使抵达目的地,指导救护车路线,救援人员提供有力救援支持.
现浇钢筋混凝土柱与墙体连接,必须按规定在柱内预埋拉结筋。在实际施工过程中,柱内预埋拉结筋却存在的问题。包括漏土里,移位,拉结筋选用、制作不呈,漏土里后补设方法不符合
合成了稀土色氨酸咪唑三元固体配合物,其通式为RE(Trp)3IMCl3·3H2O(Re=Nd3+,Eu3+,Tb3+,Trp=L-色氨酸,IM=咪唑).经无素分析、摩尔电导、红外光谱、紫外光谱和荧光光谱的测定,研
儿童急性淋巴细胞白血病(ALL)现代治疗的最终目的是争取长期无病生存乃至治愈。笔者1994年以来,采用连续强烈化疗方案,观察初治缓解率,并随访远期疗效,报告如下。材料与方法194年2月至1997年10月初治
总结了贵州省野生百合的栽培技术,包括繁殖方法、选地整地、田间管理、病虫害防治、采收贮藏等内容,为百合资源的引种保存提供技术支撑。
神经根型颈椎病的磁刺激运动诱发电位研究刘磊许虹颈椎病是中老年人的常见病,其中以神经根型颈椎病占主要比例,而要区别是否神经根型颈椎病,仅依靠X线摄片、CT、磁共振等检查是
针对目前河道曝气存在的问题,提出了一些廉价、有效的补充措施,如在曝气河段两侧拦坝,使曝气段的污泥不得外流,人为添加曝气河段的污泥含量,将现有的连续曝气改为间歇曝气等通过