基于高校网站内容的实体抽取研究

来源 :北京信息科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:wangle2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高校网站上大量的会议稿中的人名、地名以及会议名称等重要信息,提出了一种基于规则与统计相结合的识别方法,首先根据会议稿的特点将会议稿分为2类,规则和非规则会议稿,其中规则会议稿采用编写规则的方法来抽取会议稿中的实体,非规则会议稿则通过条件随机场进行初步识别,然后,再针对条件随机场未能识别的实体进行基于规则的识别。实验结果表明,该方法的识别效果明显优于仅采用单次规则或条件随机场的处理结果。
其他文献
建立了以踝关节脉冲推力为动力源的平面半被动双足机器人模型,并推荐利用拉格朗日第二类方程得到机器人的动力学方程。为判断模型的稳定性,采用庞加莱映射方法分析了半被动双足
以主动移频法(Active Frequency-Drift,AFD)及基于正反馈的主动移频法(Active Frequency-Drift Positive Feedback,AFDPF)孤岛检测算法为研究基础,针对其检测盲区大、影响电能质
传统的多变量统计过程监控技术采用的故障模型是线性的,该模型在具有强非线性特征的工业过程的故障诊断及预测方面的效果不够理想。针对复杂系统,需采用非线性数据模型的故障描
针对协同过滤算法存在数据稀疏性问题及新用户问题,根据选课系统的具体情况及特殊性,比如,优秀学生可以按相似度高的邻居评价推荐,对于成绩较差的学生应参照优秀学生的选课情况对
目的:传统二维超声及彩色多普勒血流成像对不同病理级别的肿瘤间差异与否未进行进一步分析。文中探讨三维容积超声VOCAL参数与肿块型乳腺浸润性导管癌病理分级的相关性。方法
针对无驱动结构微机械陀螺的工作带宽进行理论分析,提出一种调整频带宽度的方案。然后利用MATLAB和PSpice软件进行仿真验证,最后利用安捷伦信号发生器81150A对调整前后的电路部
针对信息安全风险评估工作中难以把企业的业务安全映射成资产安全的问题,提出一种基于业务战略的信息资产识别方法,即以信息资源为核心进行资产分类,从支持企业业务战略实现的信
以硝酸铈铵为引发剂,以淀粉、顺丁烯二酸酐为基材,合成具有一定相对分子质量范围的阴离子型水溶性淀粉,作为湿法磷酸防沉降剂。考察了反应温度、反应时间、单体配比、引发剂
中国华能集团公司是经国务院批准成立的以电为主、综合发展的国有大企业集团。中国华能集团由核心企业中国华能集团公司和九个成员公司及其下属分布在全国各地的控股企业组成
以共沉淀法制备纳米级Fe3O4磁载体,以SiO2为过渡层,通过溶胶-凝胶法制得包覆型光催化剂TiO2/SiO2/Fe3O4复合粒子。通过TEM、XRD、IR等测试手段对样品进行表征。以甲基橙为目