领域术语自动抽取及其在文本分类中的应用

来源 :电子学报 | 被引量 : 0次 | 上传用户:cheqiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于信息熵的领域术语抽取方法,在给定领域分类语料的前提下,该方法既考虑了领域术语在不同领域类别间分布的不均匀性,又考虑了其在特定领域类别内分布的均匀性,并针对语料的不平衡性进行了正规化.人工评测显示该方法能更准确有效地抽取领域术语.本文还将该算法应用于文本分类,用于代替传统特征选择算法,实验表明,该算法能够显著提高文本分类的精度.
其他文献
习近平总书记指出,各级领导干部要牢固树立和发扬好的作风,既严以修身、严以用权、严以律己,又谋事要实、创业要实、做人要实。这“三严三实”是对作风建设的进一步升华,简明
在GHz以上高频集成电路中,必须考虑互连线的电感寄生效应,以便对电路性能进行准确的分析和验证.K参数矩阵(部分电感矩阵的逆)由于其较好的局部化特性,被广泛接受并应用于对互连
基督教传布中国的过程是一个充满矛盾与冲突的过程,而冲突的发生在不同的历史境遇彰显出不同的范围与内容。依照美国史家柯文提出的“中国史境”论即一种从“内部取向”上研
大型医院门诊患者聚集多,流动性强,人员聚集随时间变化而变化,很难发现门诊患者在就诊期间聚集的规律。通过收集患者在门诊聚集区域的相关信息,使用空间分析方法,寻找到患者
针对音频信号,提出了一种水印算法,该算法利用DCT频谱中的DC直流系数数据正负性不易改变的特性来嵌入水印信息,通过实验结果说明该水印算法可以在鲁棒性与不可感知性之间达到
通过广泛调查、采集与鉴定,结果发现大别-桐柏山区分布的杀虫性中草药有75科167种。
英国作家阿兰·霍林赫斯特在小说《美丽曲线》中,呈现了20世纪80年代以同性恋群体为代表的社会边缘人沦为权力话语机制下牺牲品的悲剧命运,讽刺批判了当时社会权力话语建
利用安徽省68个台站近40年的日降水资料,运用累积频率法判别分析基于日资料的极端降水事件,给出了安徽省各台站降水极端事件的阈值。着重分析了阈值的空间分布,出现最大和最小阈
近百年来,中国艺术歌曲的艺术影响力在中国和世界艺术领域占有重要的地位,这些歌曲不仅旋律优美流畅,创作技法精湛,更具有丰富的文学性和高度的审美价值。江苏籍作曲家对中国艺术
RNA干涉(RNA interference,RNAi)作为研究基因治疗、基因功能、生物品种改良等方面的一种有效方法已经被研究者广泛接受。作为基因抑制的一种有力工具,与其他的方法相比,RNAi的操