中文专家实体主页识别方法研究

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:starseekerwjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别。首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集。然后,采用不同学习算法对在不同特征上的页面进行主页识别,寻找最有效的分类特征和主页识别学习算法。最后,对不同特征、不同算法进行测试,实验结果表明,采用J48算法,结合链接与网页内容特征,中文专家实体主页识别取得了较好的效果,其识
其他文献
对任意有限群G,利用其子群的弱拟正规条件刻划原群G的结构,给出G超可解的若干充分条件,并推广相关文献的结果.
对不相容决策表分别使用3种知识约简方法(代数方法、信息熵方法和差别矩阵方法)得到的结果可能不同。在此概括这些知识约简并介绍其在分析不相容决策表中的作用。因此对于知识
实验通过试片悬挂转动的方法来模拟现场水造粒硫磺成型过程,采用失重腐蚀速率、扫描电镜观察,能谱进行表征,研究了温度、位置因素对316L和20N在水造粒硫磺颗粒成型过程中的腐蚀
高压电力转接头经常工作在恶劣的环境中,当前以人工巡检的效率较低,难以及时发现一些被氧化的高压转接头,存在高温造成的火灾隐患。设计并实现了一种电力转接头温度远程监控系统
为了研究基于空间拓扑关系的离群检测,提出了一种基于面包含关系的离群面检测算法DOR-IR。它采用算法PL I判断面包含关系,并把面包含的对象看作面对象的属性,建立面对象的密度连通集合,相应于"噪音"的面就是离群面。运用算法DOR-IR分别在人工数据集和真实数据集上进行了测试,实验结果表明,算法DOR-IR能有效挖掘基于拓扑包含关系的离群面。
在多值逻辑中,含有量词的Tableau方法具有统一的扩展规则,并已通过可靠性和完备性的证明,但是由于扩展后的分枝非常庞大,使机器实现非常困难,通过对规则量词公式与一阶经典量
目的:探讨CT引导下注射沙培林治疗妇科肿瘤术后盆腔淋巴囊肿的疗效。方法选择妇科肿瘤术后盆腔淋巴囊肿患者10例(共12个囊肿),行CT引导下穿刺引流囊液,引流后注入沙培林1 Ke,如经首
合成了镍(Ⅱ)与吡啶-2,6-二甲酸配合物[Ni(HDPC)2]·3H2O,并获得其单晶,该配合物单晶属单斜晶系,空间群为P21/C,晶胞参数:a=1.3670(2)nm,b=1.0043(10)nm,c=1.3767(2)nm,β=115.140(10)&
从生境条件、种类组成、类型、外貌、结构、物种多样性、演替等方面较为系统地分析了广西北仑河口国家级自然保护区红树植物群落的生态特征.红树植物种类有14种,隶属11科14属;其
介绍一个混沌二值序列产生和实验的软件平台,利用3种混沌动力学模型,即一阶时延模型、Logistic 模型和Lorenz模型产生加密序列,并结合Shanon的'一次一密'思想,建立一