利用汉字二元语法关系解决汉语自动分词中的交集型歧义

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:weixin1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种利用句内相邻之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法。初步的实验结果显示,可以正确处理90.3%的交集字段。
其他文献
集成Internet上大量自治的、异构的数据和计算资源将是今后软件业的主要挑战之一。作为一种应用系统从位于Internet上的远程服务结点获取数据并进行数据集成处理的机制,Internet市场越来越受到业界的重
文中采用阶段并行模型,分析了并行NAS benchmarks的结构和资源需求特征,得到了其对内存、I/O及通信的时延和带宽等需求的参数值。这些量化的参数对各类并行计算机的设计和评价具有一定的参考价
文中介绍了一个多线索DBMS核心,它具有一般DBMS的基本功能,为不同的DBMS提供统一的设计环境。
区间索引是随着对约束数据库的实用化的研究而提出的。文中在Meta-树的基础上提出了DM-树和相应算法,它对区间索引保持了存储为O(n),查询I/O时间为O(logn+t/B)的性能,
超媒体文档由一系列结构化的信息组成,这些信息包含不同类型的媒体,传统的文档系统描述这些信息比较困难,HyTime标准作为SGML的一个应用不仅能够描述超媒体文档的结构,耐用能描述不同媒体之
XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持
SAT为Scholastic Assessment Test的缩写,是美国高中生进入美国大学所必须参加的考试,其重要性相当于中国的高考,也是世界各国高中生申请进入美国大学本科学习能否被录取及能
期刊
咖啡小憩时有人谈到"一条龙"学校教育,涉及所谓名校教育问题.  啡友N说曾听从事教学工作的前辈说,送子女进学校,要记得宁做坏学校的好学生,勿做好学校的坏学生.……
期刊
【正】 近读《文言语法分析》(廖序东主编,1981年上海教育出版社出版),受益匪浅。该书第40页云:“文言里有少数几个词兼有两种不同的意思和作用,叫做兼词……尔=如此(动词+指