利用URL-Key领域术语识别方法

来源 :北京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:ff520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介,借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先,借助互联网中已有的人工分类领域URL,根据URL-Key在各领域汇总使用的频度,采用基于方差的领域URL-Key识别方法,构建领域URL-Key词表;然后,利用伪反馈技术,收集候选领域词检索得到的URL结果集,根据URL结果集构建候选领域术语的URL-Key特征向量;最后,利用SVM对候选领域术语进行提取。在4个领域进行实验,都取得不错的效果。新提出的方法可以有效地解决低
其他文献
网络领域充满机遇,更多的事不是做不到,而是想不到,需着眼未来开拓思路。我们身边有着移动通信、因特网、电视、多媒体等诸多的用户信息服务,怎么把这些传统应用结合起来,更灵活地
目的探究延续护理对高血压患者血压、血脂的影响。方法该次研究选取2017年9月-2018年5月于该接受治疗的50例高血压患者,将其划分为对照组与观察组两组,每组各25例。为两组患
摩托罗拉在五月初于香港举行的TETRA亚洲会议宣布,将在中国铁路运输市场全力拓展数码通讯标准—TETRA。
2001年5月28日,由北京青年报主办的中国宽带峰会在北京召开,来自电信行业的运营商、设备制造商、技术服务提供商、内容提供商以及媒体参加了会议。这次峰会是在中国电信等几大
2001年,尽管全球电信业在经济下滑声中同告褪色,但这一时期的中国通信业却依旧保持了强劲的增长势头,许多跨国设备制造商在全球市场遭受重挫,而在中国市场却获得了良好的业绩。6
水利工程建设中,由于工程的特殊性,在市场经济条件下,应注意以下几个问题:1)现场发生工程量的签证;2)记录工地现场情况;3)召开监理例会及批复文件;4)合同管理;5)各种价格信息
期刊
据UMTS论坛预测,全世界移动用户在2000年约为4亿,到2010年可增长至18亿.多媒体业务流量在2010年将占数据流量的60—70%。提供话音和低速数据业务的第二代移动通信系统难以提供先