一种基于聚类的汉语词语知识的获取方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zgr2020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理中,知识的自动获取一直是一个核心问题。但如何实现知识的自动获取呢?该文在基于实例的学习方法(Example-Based Learning,简称EBL)的基础上,提出了一种基于聚类的汉语多义词知识的自动获取方法。实验结果证明,用该方法获得的知识对汉语的词义排歧是有效的。
其他文献
多主体系统的可视化是一个非常复杂的工作,它将多个主体复杂的协作和交互活动过程可视化,以便用户对其进行监控。该文主要从这一复杂问题入手,分析多主体系统可视化需要研究的内
该文针对目前数据挖掘的研究状况,理论上提出了将基于属性分类方法和多元线形回归算法相结合的算法,首先使用基于属性分类的方法将原始数据库进行属性分析,化简,去掉次要的条件属
针对织物疵点分类的高精度和实时性要求,利用解决小样本问题的支持向量机分类器,采用ZYNQ平台实现疵点的识别并显示结果。介绍了ZYNQ硬件平台,对采集到的图像预处理之后应用局部
线性参考系统和动态分段是应用于交通地理信息系统的两项新技术,它们在基于线性网络的分析,查询和显示中表现出的优点已被广泛认同。该文介绍了线性参考系统和动态分段技术在交
总结粘胶牛津纺的设计与生产要点。以集聚纺R14。8tex单纱为经纱,集聚纺R14.8tex×2股线为纬纱。降低络筒速度至750m/min,并减少络筒张力,以保证筒纱质量;整经速度控制在450m/mi
为实现棉涤氨三组分混纺织物纤维成分含量快速定量分析,采集138个样本的近红外光谱信号,使用模型集群分析方法剔除异常样本,筛选出46个关键波长,利用偏最小二乘法建立了棉涤氨三
该文讨论并建立了一真彩色白细胞显微图像微机自动识别系统。针对传统组合优化方法用于特征选择的种种缺陷,提出了基于遗传算法的特征选择策略。根据细胞特征,笔者对传统的遗传算法做了相应的改进。最后运用选择特征子集来训练BP神经网络作为分类器。结果证明该方法对于分类系统的性能优化有明显效果。
论文提出一种应用于H.263+视频传输的误差恢复方法,即基于H.263+视频编解码器的差错掩盖方法,在这种方法中,在编码器端通过重传出现差错的数据和发送帧内编码帧来限制误差的扩散和繁
针对当前存在的大量非结构化MPI程序,该文提出一种在MPI程序中实现点对点通信原语到集合通信原语转换的方法,其基本思路是:分析非结构化消息传递并行代码的内部结构,建立Diophant
数据仓库化Web数据,以更好地支持企业的经营决策和联机分析处理,是当前数据库研究的一个热点。Web数据的数据仓库化包括数据抽取,数据集成和数据物化三个连续的阶段。本文在MIX