【摘 要】
:
组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖,本文提出了一种基于主动学习的训练策略,改进了基本的最大熵模型的解码算法和训练过程.实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用.
【机 构】
:
中国科学技术大学计算机科学与技术系,中国科学院计算机语盲信息工程研究中心
【基金项目】
:
国家自然科学基金项目(60878088)资助,国家“八六三”基金项目(2002AAll401)资助.
论文部分内容阅读
组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖,本文提出了一种基于主动学习的训练策略,改进了基本的最大熵模型的解码算法和训练过程.实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用.
其他文献
笔者曾多次参加养老保险稽核检查工作,据有关资料和笔者的亲身经历,社会保险经办机构在依据《社会保险征缴暂行条例》和劳动保障行政部门的委托对缴费单位和个人进行养老保险
元旦到了,我又会收到许多贺卡。我喜欢贺卡,精美的图案,温馨的祝词,总会带来希望,带来好运气。而我也会精选一批贺卡,同样送给朋友,可是,每年总有一张赠给"阳光"的贺卡不知该
昨天下午开会的时候,了解到某学校在招聘教师的时候被应聘者投诉到了省人事厅.投诉理由是:招聘人员拒绝接收除北广和浙广外的学校的学生,但在他们的招聘简章中并没有写明招聘
近年来事业单位对干部人事档案管理工作的重视程度日益增加,但人事档案归档不及时、档案管理模式单一、人档分离、弃档等问题依然严峻。建立完善的人事档案管理制度体系、配备
目的探索分析采用中药与克罗米酚相结合应用治疗多囊卵巢综合征患者,研究其临床应用效果。方法选取48例多囊卵巢综合征病人,按抛硬币方式分成观察组(n=24)和对照组(n=24)。观察组
针对Intranet资源共享需要解决的访问控制问题,本文提出一种方法,在企业PKI和目录服务的基础上,使用X.509证书和属性证书灵活方便地实现RBAC模型.
社会保险制度是现代社会成员的安全网和社会发展的稳定器,其积极作用已为人们熟知。要实现社会保险制度的高效运转,社会保障基金的筹措建立、投资运营及其支付使用是重要的三
一字诗:我国著名朦胧诗人顾城曾写过一首题为《生活》的诗,通篇只有一个字:“网。”它高度概括了“生活”丰富复杂的内涵,形象生动地道出了生活中错综复杂,千丝万缕的关系。
在繁华的大都市里,生活着一种小型猛禽,它只有鸽子一般大小,却拥有鹰一般锐利的眼睛和尖喙,以及一双强有力的翅膀。这种禽类出没于高楼大厦之间,靠捕食较小的禽类果腹,是飞翔
前不久,上海虹桥一物业内佳丽云集。上百位妙龄女郎使出浑身解数,前来竞争两个年薪10万元的职位——女保安。据了解,这两位女保安不同一般。按招聘启事上的要求:身高1.70米以