语言标注框架评述与对比分析

来源 :网络新媒体技术 | 被引量 : 0次 | 上传用户:zhangjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据驱动是当前机器学习和人工智能技术的一大特征。高质量、大规模的标注数据集是领域技术发展的根基。在自然语言处理领域,标注数据的质量和数量直接决定了某个语言处理任务是否标准化,方法模型能否在公平条件下被评估和比较。而语言数据的人工标注是一个十分繁琐和复杂的过程,其中涉及诸如标注质量、标注管理、标注效率等诸多问题。为了解决这些问题,研究者提出了大量语言标注的工具和框架。本文介绍了语言标注的基本理论和技术,并对主流的两个语言标注框架GATE和UIMA进行评述和比较。
其他文献
罗军、李琨在《档案学通讯》2008年第6期撰文指出,所谓工商部门企业信用档案资源开发,是指工商行政管理部门采集、加工本单位档案馆(室)所藏的“经济户口”信用档案信息,
支持向量机(SVM)算法以统计学习理论为基础,依据结构风险最小化的原则,且在有效的特征信息有效的情况下,能够对数据中隐藏的有效信息进行挖掘。故本文用支持向量机对ZPW-2000轨
金融街是在现代市场经济条件下,由银行、证券交易所、信任投资公司、保险公司等金融机构聚集而形成的、从事金融活动的街区。    北京金融街    北京金融街在我国是享有盛名的。它位于西城区西二环路东侧,南起复兴门内大街,北至阜成门内大街,东邻太平桥大街。南北长1700m,东西宽650m,规划占地面积为2.59平方公里。目前金融街金融资产40万亿元,占北京市金融资产的82%,占全国的47.6%,控制着全
由于本特利图书馆的工作被高度重视,工作人员被赋予大量的参与世界上其他档案机构交流项目的权利,下面是主要的项目:1975-1978年与芬兰、爱尔兰、波兰、荷兰档案馆合作的移民起
1911年,鲁迅30岁,此时他还没有启用鲁迅的笔名。这年辛亥革命爆发前后,鲁迅从经济到精神都很困顿,是辛亥革命改变了他的处境,使之成为无所顾忌的独立撰稿人。  年初,鲁迅在绍兴府中学堂教书,给学生留下了深刻的印象。那时清朝还没有灭亡,他却留短发,没有当时绝大多数人拖在脑后的辫子,常喜欢穿着洋服,而不是长袍马褂。走起路来挺胸、直腰,很有精神。他的步子走得很快,而且习惯于走在路中央。他的风度,同那些弯
绿豆不但是食品,也是一味中药。中医认为,绿豆性凉、味甘,有清热解毒、消暑除烦、止渴腱胃的功效。
近两年来,随着国有企业的改革日趋深入,明晰产权关系,进行产权制度改革的呼声日高。由于实践的需要,理论界和经济界对产权问题的讨论逐渐成为令人瞩目的'热点'。现将
老年性应激性溃疡多较复杂重危。本文报道治疗本病在采取急救措施的同时进行辨证治疗。根据收治60例分别辨为胃热壅盏、气不摄血、阴虚火旺和气虚胃热夹瘀等4型施治,结果显效
<正> 先祖父许春芬(1889~1979),字兰葶。生前系聊城地区名老中医,早年攻儒,为前清童生,后弃儒投当地名医张武先生门下习医,5年后尽得其传。先祖行医60余年,医理精深,经验丰富,
针对盐家砂砾油田沉积格局的复杂性,导致注采调整困难的实际情况,利用干扰试井技术,判断该油田的层间连通性,并结合其储层流体特征及储层敏感性评价结果,优化注水实验方案,完