【摘 要】
:
针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入
【机 构】
:
华中师范大学计算机学院; 国家语言资源监测与研究中心网络媒体语言分中心; 国家数字化学习工程技术研究中心(华中师范大学);
【基金项目】
:
国家自然科学基金资助项目(90920005,61003192);国家语委“十二五”重点项目(ZDI125-1);国家“十二五”科技支撑计划项目(2012BAK24B01);教育部/国家外国专家局高等学校学科创新引智计划项目(B07042);湖北省自然科学基金资助项目(2011CDA034);华中师范大学中央高校基本科研业务费专项资金资助项目(CCNU10A02009,CCNU10C01005)
论文部分内容阅读
针对传统人工编辑导致大量类别信息重复和不规范的问题,提出了应用协同过滤技术为中文维基百科文章自动推荐类别。利用中文维基百科中的四个重要语义特征即链入、链出、链入的类别和链出的类别来表示维基百科文章,得到与目标文章相似的前若干篇文章的所有类别后,通过查询返回的相似度值计算各个类别的权重,选择前面的若干个类别作为推荐结果返回给目标文章。实验结果表明了这四个语义特征能较好地表征一篇维基百科文章,同时也验证了协同过滤方法在中文维基百科自动推荐类别中的有效性。
其他文献
结合《中医儿科常见病诊疗指南》的研制过程,分析文献研究的目的、方法及意义,揭示了作为主要的研究方法之一,文献研究可以构筑循证型指南———《中医儿科常见病诊疗指南》
目的分析十字花科碎米荠属植物华中碎米荠挥发油的化学成分。方法采用水蒸气蒸馏法提取挥发油,并用气相色谱-质谱联用(GC-MS)法对其挥发油成分进行分析。结果鉴定出35个化合
词语的情感倾向判别是文章语义情感倾向研究的基础工作。利用中文情感词建立一个基础情感词典,为专一领域情感词识别提供一个核心子集,能够有效地在语料库中识别及扩展情感词
改革开放以来,中国国民经济一直保持着令世人瞩目的高速增长,但做为社会进步重要标志之一的职业健康安全工作却远滞于经济建设的步伐,在市场经济大潮中受到巨大冲击,重大恶性
目的研究盐制对青娥丸补肾健骨药效的影响,根据中医"盐制入肾"的理论,盐制可以增加中药温肾壮阳的功效。本研究观察不同炮制品配伍的青娥丸对去卵巢(Ovariectomy,OVX)大鼠诱
目的:探讨人脐带间充质干细胞经外周静脉移植治疗不同程度肝硬化的临床疗效及安全性.方法:选择乙型肝炎肝硬化失代偿期患者20例,其中Child-Pugh A级6例,B级8例,C级6例,在常规
<正>冯美臣,博士,副教授研究方向:作物生态与信息技术代表性作品1.Mei-chen Feng,Lu-jie Xiao,Mei-jun Zhang,Wu-de Yang,Guang-wei Ding.(2014)Integrating Remote Sensing
通过铁水预脱硫-100 t顶底复吹转炉-吹Ar-LF(VD)-方坯连铸工艺生产轴承钢的实践,得出冶炼终点钢水碳含量为0.2%~0.6%时,钢水氧含量在50×10-6到150×10-6之间;经出钢时脱氧、
本文介绍了袋式除尘器节能和降低成本的研究及实际成功应用情况,并简述了袋式除尘的技术创新情况。
装备的战场抢修是保持和恢复装备战斗力的重要因素。对于指挥员来讲 ,预测并准确的掌握装备系统的抢修时间 ,有利于实施适时而准确的指挥。同时对新装备的研制与发展政策的决