论文部分内容阅读
领域知识获取是文本处理技术中的一个瓶颈问题,本文提出一种领域词汇的自动获取方法.该方法采用Bootstrapping的机器学习技术,从大规模无标注真实语料中,自动获取领域词汇知识.该方法独立于具体领域,移植性好.文中给出了该方法的详细描述.最后,根据实验结果,对该方法的性能进行评估.实验结果显示,从人民日报语料中学习效果比专业领域语料好.