基于机械分词与统计学的新词识别研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:intercsw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一.本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法.
其他文献
提出了一种用于盲估计四相编码(Quaternaryphaseshiftkey,QPSK)载波频率的改进MAT(M—MAT)算法,并给出了一种新型QPSK信号码元估计方法。在没有接收信号先验知识的情况下,首先对QPSK
<正> 在水力发电站里,油、水、气系统是水轮发电机组的配套设施。小型水电站的气系统承担着机组的制动用气、调相压气和检修吹扫等任务。在电站的长期运行中发现:刹车装置贮
本文对自适应超媒体智能计算机辅助教学(ICAI)中的教学系统建模和超媒体自适应问题进行了深入研究。通过建立学生本体、能力本体、知识本体、资源本体和测试本体对教学系统进行
探讨在电子政府建立过程中对虚假信息的控制问题,包括虚假信息控制的含义,虚假信息的来源,虚假信息的种类,虚假信息的特点以及控制虚假信息的措施.
昭通诗人樊忠慰运用多元化的创作思维系统,创造意象,建构意境,形成其《精神病日记》组诗瑰奇怪诞、朦胧含蓄、苍凉悲壮的审美特征,给读者带来了丰富神奇的美感享受。
为解决光照不均匀、锈斑、污损等因素造成的钢卷尺图像检测识别不准确问题,提出了一种基于Cabor变换的钢刻线提取方法。通过Cabor变换,使特征方向与特定频率的线条结构被过滤呈现出来,基于这些线条结构计算图像中的线纹尺待检刻线位置,之后通过RANSAC算法拟合刻线的双边缘,从而准确获得刻线中心位置。经实验证明,该算法可以在刻线质量较差的情况下,鲁棒地识别破损和有锈斑的刻线,有效地提高检测准确度和整个
本文通过对风力提水的社会效益和经济效益分析计算,阐明了在我国部分地区推广一个时期曾被冷落了的风力提水机的必要性;并根据东南沿海丰富的风力资源和目前比较成熟的风力提
中国的媒体以往都是作为舆论宣传工具而存在的,进入市场只是近几年的事情.对于传媒市场的规律与常识,直到今天还有很多业内人士不甚了了.因此,在决策与日常工作中,仍然大多采
从安全、经济的技术要求出发,任何一种水轮机的适用水头都有一定的范围。当水轮机在低水头运行时,不仅出力和效率显著降低,而且其运行稳定性也下降。本文就清溪二级水电站水