【摘 要】
:
在基于半监督和主动学习的信息抽取研究中,对初始样本集的选择,鲜有考虑样本在数据集中的分布情况。以林业领域的病虫害抽取为例,提出基于聚类的方法来获取样本在数据集中的分布
论文部分内容阅读
在基于半监督和主动学习的信息抽取研究中,对初始样本集的选择,鲜有考虑样本在数据集中的分布情况。以林业领域的病虫害抽取为例,提出基于聚类的方法来获取样本在数据集中的分布信息,以此指导初始样本集和迭代过程中标注样本的选择。实验结果表明,基于聚类的方法相比于随机初始训练集,在不同标注样本集个数的情况下,模型 f 值均有提高。相比于单一的主动学习方法,在性能相近的情况下,节约了30%左右的人工标注量。
其他文献
为解决工地现场搅拌器效率低、扬尘大两个问题,研制了一种环保型干混砂浆现场搅拌器,文章主要介绍了该新型环保搅拌器的工作原理、结构和优点,该新型搅拌器为高效施工、保护
从产品标准及设计原理入手,针对塔式起重机起升机构钢丝绳打绞的现象进行原因探究,以不同角度查找问题出处,明确纠正措施并给予实施,验证其有效性。
Starting from the prod
小型挖掘机动臂下耳板位置,受力情况复杂,强度要求极高,对动臂整体的使用寿命极为关键。本文分析了下耳板外挡距、耳板加强板结构形式对耳板强度的影响,并且提出了有效的改进
就东方蜜蜂(Apis/ceTana)采集有毒蜜源植物雷公藤属昆明山海棠[Tripterygium hypoglaucum(Level.)Hutch]识别行为进行研究并得出结论:在同时放有正常蜜和有毒蜜饲喂盘的情况
分析了近15年来河南杨树的动态变化及其原因,应用灰色理论与方法,对未来10年河南杨树的发展趋势进行了预测。
The dynamic changes of poplar in Henan Province in recent
对68群土法饲养、野生的中蜂蜂巢和105张自然巢脾观测结果表明:群势不论强弱,其蜂巢总体结构呈球形或椭圆形;蜂巢中央巢脾向外巢脾的面积逐次减少,递减率多为15%名左右;每张
本文阐述了Nm 116防静电毛/涤/天丝混纺纱产品的原料配置,分析了其可纺性,探讨了提高该混纺纱产品质量的方法;着重介绍了毛/涤/天丝混纺纱产品的生产工艺流程、生产工艺
产品轻量化设计,就是以减轻产品物理自重和视觉重量感的产品设计。当今重组竹家具市场看好,但存在着的产品自重大、安装搬运困难等缺陷。设计实践表明:重组竹与其它材料搭配使用
目的 评价灯盏生脉胶囊对于缺血性脑卒中的防治效果.方法 本研究是以社区医院为单位的随机对照开盲临床试验.在北京市城区选择5家二级医院,将其随机分为试验组和对照组,研究
目的 调查HBV Ba、C1和C2三种基因亚型在临床致病性方面的差异,同时检测并分析三种基因亚型毒株在前C和C基因启动子区发生变异的模式.方法 采用聚合酶链反应-限制性片段长度