论文部分内容阅读
现有的语料库检索软件和统计手段多用于计算两个单词之间的搭配力,而如何测量多个单词之间的黏着力是语料库语言学尚未解决的问题。本文提出新的算法以一阶隐马尔可夫过程为基点,进一步结合Silva和Lopes的“假拟二元序列转化”理论,并以新JDEST语料库为测量对象。通过检验和比较,新算法能够较为有效地改进短语单位的识别与界定,提高计算机自动提取连续短语单位的准确性。