【摘 要】
:
首先通过对双语语料库全过程构建的描述,提出基于专业领域词库快速构建双语语料库的方式,并用于快速发现科技大数据基础语料的多属性,完成语料的标注,这对于科技大数据知识检
【机 构】
:
北京石油化工学院,中国科学技术信息研究所
【基金项目】
:
中国科学技术信息研究所重点工作“面向中信所资源大数据建设的多源异构数据库内容获取与融合平台建设(二期)”(ZD2019-04)
论文部分内容阅读
首先通过对双语语料库全过程构建的描述,提出基于专业领域词库快速构建双语语料库的方式,并用于快速发现科技大数据基础语料的多属性,完成语料的标注,这对于科技大数据知识检索、知识图谱方面的应用具有基础性支撑作用。然后通过分析新时期科技大数据对语料库构建的要求,从期刊、专利中选择“分布式能源”主题数据集,结合“神经网络机器翻译+统计机器翻译”的机器翻译技术,构建形成20834个双语词对初试语料集,利用中国科学技术信息研究所专利数据库、德温特专利数据库形成6428条专利数据对双语词对初试语料集进行测试应用。最后从忠
其他文献
叙述了强化镀铁工艺与其它工艺对轴修复后的技术指标的差异,介绍该工艺在钾碱泵电机和锅炉给水泵电机轴修复中的应用效果.
高新技术产业是属于我国战略性产业之一,是能够推动国家核心竞争力的体现。同时也是我国当前金融产业转型,构建现代化产业体系的一个重要途径之一。但是我国高新技术产业的发
近几年随着房地产业的高速发展,物业企业也如雨后春笋般涌现出来,由于我国物业管理起步较晚,物业企业发展模式尚未完全构建,许多企业的发展存在问题,如财务管理比较薄弱等,制
目的:观察羊膜移植在眼表疾病中的治疗效果.方法: 采用新鲜人羊膜移植治疗16例复发翼状胬肉、睑球粘连、结膜囊狭窄、眼表恶性肿瘤等患者,并随访观察.结果: 16例中13例羊膜存
根据不同的方式,例如用途、敷设方式以及输送压力的大小等,可以将输配气管网分成不同的种类。按照用途的不同,可以将输配气管网分为工业企业燃气管道、城市燃气管道以及长距
目的探讨酸敏感离子通道-1a(ASIC1a)在急性肺损伤(acute lung injury,ALI)大鼠肺组织中的表达及可能的作用。方法 SPF级♂SD大鼠32只,随机分为正常组、ALI组、阿米洛利组和阳
改革开放后我国经济体制发生变革,社会结构重组,出现了三大领域——即政府、市场和社会,政府体制和市场机制不断完善,而社会管理的领域发展相对其他领域滞后,尚未形成行之有
赛庚啶长期治疗库欣病一例徐新民,唐哲,张允平患者男,40岁。自1978年起进行性向心性肥胖,体重增加15kg,伴头晕。血压高达24/16kPa,服降压药无效。1981年1月在我院门诊经查8a.m,血皮质醇(F)566nmol/L,4p。m。541nm...
Cyclopidine lon
为了筛选出对番茄溃疡病菌有拮抗作用的内生细菌,从健康番茄茎样本中分离得到186株内生细菌。用抑菌圈法测定,其中9株内生细菌对番茄溃疡病菌有拮抗作用。通过形态特征观察、生
提出了一种基于经验模态分解(Empirical Mode Decomposition,EMD)的音频水印算法,选择EMD分解得到的冗余信号分量作为水印的嵌入位置,并证明了冗余信号分量按照提出的算法嵌入