中文自然语言理解中的若干关键问题探索

来源 :中国科学技术情报学会 | 被引量 : 0次 | 上传用户:blackhorse1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
只有教会电脑能理解人的自然语言,能够用自然语言与人进行交流,人才能真正地成为电脑的主人,本文介绍了作者领导的研究者们在成功地教电脑理解中文自然语言所走过的道路、认识的飞跃和基本方法。
其他文献
在信息化时代,探求军工企业组织创新是优化军工体制的重要思考。本文基于信息空间概念框架,分析了军工企业信息机制存在的问题及现实制约,并就促进军工企业组织创新提出一些建议。
本文利用博弈链理论的分析方法,剖析了我国武器装备采购过程中的主要博弈关系及其均衡状态的特点,在此基础上总结出装备采购博弈链演进的方向和规律,并提出有助于我国装备采购逐步扩大开放、军民协调发展的政策建议。
国防科技情报事业已有50年的发展历史,其中始终重视紧紧跟踪信息技术的飞速发展,坚持不懈地开展国防科技情报工作的现代化进程。根据作者的初步认识,国防科技情报现代化进程经历了三个主要阶段:新型检索方法的探索、计算机技术的普及应用和网络技术的全面应用。本文对国防科技情报工作现代化发展进程进行了简要回顾,并且展望“十一五”,国防科技情报现代化进程必将得到更大的创新发展。
在知识标引的研究中,自动标引研究常集中于词表的运用和组织以及分词方法的研究,对于自动标引系统中规则的相关研究比较少。规则引擎是由java社区推动的旨在分离商业决策逻辑和技术决策的新技术。规则引擎可以为规则的建立和使用提供高效、方便的接口。本文在研究和分析自动标引系统和规则引擎的基础之上,提出了基于规则引擎的自动标引系统的结构和工作流程,为在自动标引系统中规则的建立和使用提供一个途径,为提高自动标引
本文提出一种适合数字图书馆特定专业领域小文档(如摘要等)的文本自动分类算法。该方法以同义词集合概念代替词条,建立分层的概念层次结构,使得在训练过程中更容易提取出代表类别的高层次信息。实验结果表明,当训练文本数量不大时,该方法比基于词频的方法能获得更高的检索准确率。
分析了当前网络环境下信息资源的特点和用户的需求,从《装备科技信息分类表》在网络建设中的应用探讨了当前面向网络的专业信息分类表的编制。
本文对2000至2006年国外研究用户网络搜索行为的文献进行了调查,主要探讨了影响用户网络搜索行为的因素以及不同群体的搜索行为特征方面的研究成果。最后,本文评述了该两方面的研究现状并对未来的研究发展进行了展望。
针对目前的基于内容的图像检索系统的速度和效率问题,本文提出基于分类技术的图像检索方法。本文首先介绍了基于SVM的多类图像分类的研究,然后介绍了在分类基础之上,构建的基于内容的图像检索系统的原理,最后做出评价。
当前的用户兴趣模型大多采用基于向量空间模型的加权关键字的方法,当一个关键字在不同的领域中有不同的含义时,会导致模型失效。本文提出类别与关键字结合的构建用户模型的方法。根据用户日志,对用户浏览过的网页分类,建立用户兴趣的类别模型。再从各类网页中提取关键字,建立与类别相关连的关键字模型。两种模型综合,构成了用户兴趣模型。
语义标注是语义检索、知识挖掘、智能推理等研究领域的一个基础研究课题。本文给出一种基于文本语义相关度计算的中文文本语义关系标注方法。该方法首先构建了主题特征量和文本特征向量,采用基于《HowNet》的词语语义相似度和文本语义相似度计算方法进行主题特征量与文本特征向量的语义关系计算,同时,对文本的类别、语义关系进行有效标注。