科研项目管理中的文本挖掘方法研究及应用

被引量 : 22次 | 上传用户:zhaotong125555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基础研究的科研项目管理中,项目的相似性分析是一个基本的管理问题,依据相似性可以对项目进行分类,避免重复申报、重复立项,还可以为相似项目的评审选择合适的同行专家。项目的相似性分析一般是根据项目建议书的标题、摘要和关键词并结合项目管理人员的经验进行。但是由于一方面项目数量逐年快速增加,另一方面基础研究具有创新性、不确定性、学科交叉融合及新观点、新概念和新的知识点不断涌现等特点,科研项目管理人员很难根据基础研究项目的真正内涵进行相似性分析,从而给管理工作带来了极大的挑战。因此,从项目的知识内涵中进行相似性分析就成为现实的需求,这就需要对项目进行知识挖掘,并从知识管理的角度探讨项目管理问题。 科研项目建议书是由自然语言撰写的文本,特别是我国基础研究的建议书绝大部分是中文文本。因此对项目进行知识挖掘就转变为对项目建议书的文本挖掘。本文针对基础研究项目建设书的特点,研究了文本挖掘中的基本方法。本文的主要工作如下: 1.提出了符合中文科研项目文本特点的长度优先的无词典切分思路。与英文相比,文本切分是中文文本挖掘中的基本问题。科研项目文本中包含大量的语义不可分割的专业术语,并且不断涌现新术语,特别是基础研究项目的中文文本更是如此。现有的文本切分方法不适合于解决基础研究项目的文本切分问题,因此,本文提出了长度优先的无词典切分思路。 2.提出了中文科研项目文本的切分方法。依据上述的切分思路,提出了科研项目文本的三种切分方法:正向串频最大匹配法、逆向串频最大匹配法和双向串频最大匹配法,实验结果表明双向串频最大匹配法可以达到更好的切分精度。结合统计学习与规则筛选,这几种方法可以切分出专指语义串、短语和词。给出了专指语义串的定义,并从系统整体性和语义优先性的角度对其表示科研项目建议书内容的合理性进行了分析。上述方法既可以解决中文基础研究项目建议书文本的切分问题,又可以应用于一般文本的切分。 3.提出了科研项目文本的层次特征项获取和建模方法。针对科研项目的特征项之间在语义上具有层次性的特点,在文本切分结果的基础上,提出了基于迭代学习的层次特征项获取方法。通过迭代学习不仅可以获取切分结果中包含的层次特征项,而且可以获取切分结果中所不包含的层次特征项,从而更全面地表示文本。在层次特征项的基础上,采用网络作为语义层次结构关系的表示工具,从而实现科研项目文本建模。与通常的向量空间模型相比,该模型既可以表示特征项信息,又可以表示特征项之间的语义关系。该模型对单个文本的表示、领域文本的表示及本体等的自动构建具有重要意义。
其他文献
关于新型钢筘国产化的一些浅见韩振中(陕西纺织器材厂)0前言随着纺织工业的发展,大量新型织机进入我国。新型器材也要随之配套发展。在配套器材中,喷气箱生产难度大,技术要求高.而其
无梭织机钢筘的选用和维护近年来随着纺织工业设备更新改造,无梭织机发展很快。据统计全国已拥有各类无梭织机4万余台。钢箱是与无梭织机配套的关键器材,它的性能、质量、维护及
期刊
这篇论文主要围绕两个方面的具体内容展开研究:一方面是对文学作品中的模糊语特征进行了细致的论述,另一方面是对中国古典诗歌的模糊语英译进行了研究。文章首先以介绍模糊语
钢琴演奏是一个综合的整体艺术,在钢琴教学中,需运用辩证统一的教学模式——即将读谱、演奏技法以及乐感的培养三者相互协调、促进。并通过钢琴教学中的演奏及乐感的培养来促
随着计算机技术的不断发展,它在各个知识领域都得到了广泛的应用。其中,计算机技术在教育领域的应用成为当今教育现代化的一个重要标志。计算机辅助教学CAI(Computer Aided Ins
热障涂层(Thermal barrier coatings,简称TBCs)材料可有效保护热端部件,使其免受高温氧化、腐蚀、磨损,已应用于航空航天、大型火力发电等领域。然而,由于受材料参数不匹配、
报告了一项有关元认知策略与英语写作之间关系的实证研究情况。研究的结果显示,应用英语专业学生在英语写作过程中不同程度地使用了元认知策略,但大多数学生只是有时使用。就
桥梁作为现代社会中重要的交通方式有着不可或缺的作用,特别是近几年来随着科学技术的不断发展,桥梁设计应用的进步更是突飞猛进,桥梁的安全性和耐久性问题已经引起人们的高度重
目的研究黄芪注射液与5-氮杂胞苷(5-Aza)对大鼠骨髓间充质干细胞(mesenchymal stem cells,MSCs)分化为心肌细胞的影响。方法在无菌条件下从成年大鼠胫骨骨髓分离出MSCs,以1∶
从心理学层面看,在影响顾客消费心理和行为的诸多要素中,知觉要素的作用显得尤为突出。本文主要针对知觉对当代服装消费过程的影响进行分类解析。在服装品牌竞争日益激烈的行