【摘 要】
:
为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练
【机 构】
:
中国石油大学北京石油数据挖掘北京市重点实验室,中国石油大学北京地球物理与信息工程学院,中国石油信息服务技术中心
论文部分内容阅读
为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练数据、测试数据等。将文本划分为实验语料句和非实验语料句两类,统计实验语料句的词汇特征和位置特征,构建相应的特征库,用朴素贝叶斯模型对特征进行训练。在词性标注和分词的基础上,结合机器学习生成的模型判定是否为实验语料句,进行抽取。以自然语言类科技文献作为数据来源,在该领域随机选取了200篇科技文献进行抽取实验,对比人工判别方法和所提方法的抽取结果,验
其他文献
针对单向航道港口,采用基于时间窗口的滚动调度策略对拖轮作业动态调度问题进行研究。以拖轮最大作业时间最小化为目标,采用滚动时序的方法构建动态调度模型。利用基于3种不
采用热浸镀工艺模拟机,研究钢板浸入不同Al含量的锌液中保持一定时间后,镀层质量的变化。结果显示,镀锌浸润时间从2.5s增加到5.5s时,镀层重量和厚度变化较小。辉光检测锌液中
为减少传统行为识别方法中光流场特征提取的计算量,提取光流区域的关键点,分析关键点的频率域多尺度轨迹,与运动方向以及形状信息进行融合,得到关键点特征;为凸显与重要运动部分相关的局部特征能够产生更加有区分度的行为表示,提出一个运动部分规则框架识别每个运动部分的动作,将已得运动部分组合成每一个行为样本的区分度输入分类器进行人体行为识别。将实验结果与其它算法进行比较,验证了该算法具有更好的识别率和实时性。
激光拼焊汽车板在汽车车身上得到广泛应用,介绍了激光拼焊板技术的特点及应用现状,分析了激光拼焊汽车板的可能替代技术,展望了汽车板激光拼焊技术的未来发展趋势。
大武汉百年变迁,革命战争血染历史长卷,湖北传媒生动精辟地记录与再现英雄城市形象。中共历史上每逢周年之际,湖北传媒推出特刊宣传报道,着力挖掘历史文化积淀。社会需要推进
'三小'岩巷光爆锚喷掘进作业线是'八五'期间原中国统配煤矿总公司重点推广的新技术项目之一。原总公司对推广'三小'技术十分重视,自1991年1月在兖州
为改进经典射频识别(RFID)室内定位算法LANDMARC与VIRE,提出一种SEVIRE算法。为定位区域的接收信号强度值(RSSI)空间关联建模并用自适应进化极端学习机(SaE-ELM)离线训练,将在线采
我国的体育产业正处于成长阶段.体育产业的成长需要庞大的体育消费人群来支撑.体育消费带有精神属性,与后天的教育及社会生活环境息息相关,尤其与学校体育教育有关.本文试图
阐述了Bohm思想实验和Bell不等式中存在的问题,再次指出Aspect实验同Bohr与Einstein之间的“巨人之争”完全无关。
答:1发展个性:孩子的作品没有高下之分,但由于性格以及心理因素的不同,他们在绘画风格甚至对绘画的选择上存在着明显的区别。作为教师,应当尊重他们各自的个性,顺其所长,帮助他们以