基于序列比对方法的藏语人名实体消重研究

来源 :甘肃科技纵横 | 被引量 : 0次 | 上传用户:snelgar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对网络藏语文本做信息抽取时,往往由于有很多藏族人具有同一个名字,使研究人员得不到期望的结果。为了解决这种"信息丢失问题",本论述在分析其产生原因的基础上,提出可采用生物学中序列比对的方法与社会网络分析方法中的图聚类算法相结合,对藏语人名进行消重。将人名实体的各个属性抽象成各个序列,进而通过各个序列的对比来统计出每两个相同人名的相似度,在通过社会网络分析方法中图聚类算法的决定该两个人名所表示的是否为同一个人,将表示同一个人的相同人名忽略,进而达到消重。
其他文献
中天科技(600522)日前捷报频传,公司相继取得了厄瓜多尔国家电网公司总金额约1.6亿元人民币特种导线供货合同;同期签署了苏丹尼罗河州输变电项目导线供货合同,合同总金额约0.9亿元人民币。此外,今年二季度,公司还取得了中国国家电网、南方电网7.6亿元人民币订单,其中特种导线0.9亿元人民币。  二级市场上,中天科技股价走势也相当坚挺。有分析人士指出,大单为公司业绩持续稳定增长奠定了扎实的基础。W
选择36只25日龄的欧拉藏羊与小尾寒羊杂交羔羊,随机分为3组,进行早期断奶试验。2个试验组分别饲喂不同配方的代乳料,对照组自然哺乳。结果表明,(1)30~45日龄,试验组羔羊生长速度
目前,我国农机市场正处于前所未有的急剧转型期,与传统农机市场持续多年低迷形成鲜明对比的是农机小众市场的崛起。文章分析了秸秆处理机械市场的发展优势,并对2018年秸秆还
我国正处于重化工时期,对能源的消费同时也处于高速增长阶段。另外,现阶段我国经济增长的一个典型特征是靠投资拉动,新开工项目越多,对能源、资源和环境的压力越大。党中央、
投资要点:1、1-2月地产数据超预期,房地产投资处于"合意"水平。2、下游投资波动收窄,电梯行业发展进入新阶段。
21世纪需要能走向世界的外向型人才,我国外语教育担负着培养高素质外向型人才的神圣使命.目前外语教育存在着不少问题,极不适应新世纪的要求.着眼未来,认真分析存在的问题及
水、能源和粮食作为生产和生活的最重要资源,是人类赖以生存和发展的战略基础资源,也是区域可持续发展研究领域的重要主题,三者相互依存,联系紧密。在全球人口增长、环境恶化
2017年,国内航空市场进入上行通道,在需求旺盛的背景下,各航空公司开始采取提高票价的策略,试图将高客座率转化为收益。6月中旬以来,国际原油及航空燃油价格震荡下行,因此油价下跌
本统计期内(4月6日至4月12日)主流热点雄安概念股剧烈分化,A股市场呈现出震荡走弱之势。在市场调整之际,融资客却趁机加仓。Wind数据显示,截至4月12日,沪深两融余额报9373.48亿
文章从研究浙东偏远型海岛传统村落的文化基因切入,探索偏远型海岛传统村落文化基因的理论框架体系,并提出海岛传统村落文化基因数字化活态保护的技术路径。以浙江舟山东极岛