一种文本聚类原型系统的设计与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:shengwei05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种文本聚类系统原型的设计与实现。该系统的设计是针对国家自然科学基金“项目管理中项目关联分析与立项决策支持系统研究”的实际需求而产生的。在自然科学基金的评审过程中,需要由专家对大量的立项建议书进行评审,这一工作是相当繁重的,而文本聚类系统的应用,可以大大减小工作强度,提高工作效率,节约评审时间。本文设计了文本聚类系统的原型框架,并在该体系框架下,详细地讨论了系统中各个子系统的分析设计和实现。本文主要在以下方面开展工作: (1)深入研究了聚类算法中的平面划分法,采用Java语言编程实现了典型算法k平均值算法和k中心点算法,用来对立项建议书进行聚类分析。 (2)申请书中大量存在的同义词和没有类别特征词对聚类的精度影响较大,因此,在系统中加入了同义词的合并和无特征词的去除,提高了聚类分析的准确率。 (3)在聚类分析结束以后,对分析结果进行了标注,得到了类模型。然后利用类模型实现对新文本的分类。 (4)采用Java、JSP技术开发了B/S模式下用户操作子系统。该子系统采用了JSP技术,实现了人机交互,方便了用户使用,并且通过程序将分析结果画成图形,给出了直观的表示。
其他文献
在自然语言处理领域中,句法分析是实现语言“理解”的必然环节,也是公认的一个重点和难点。面向依存文法的句法分析方法主要是通过获取句子的核心动词及其所支配的词语搭配,
我国是一个多山区的国家,山区地形复杂。近些年来,我国多省经常发生山洪灾害。由于山洪灾害突发性强,破坏力大,人工预警困难,及时作出准确的决策和应急机制是当前山洪防御的关键所
FDM(Fused Deposition Modeling)技术是快速成型技术集中的一员。基于PLA(Polylactic Acid)的FDM技术是将环保、可再生、可热塑、适合机械加工、生物相容的聚乳酸(PLA)材料应
本文以超音频串联谐振式感应加热电源为研究对象,首先介绍了感应加热的基本原理及感应加热技术的发展动态。通过分析感应加热电源的谐振槽路和拓扑结构,选择了更适合超音频感应加热电源的串联型逆变器。该主电路采用不控整流,MOSFET单相全桥逆变电路。然后对锁相环原理进行了分析,根据其数学模型,提出一种基于数字信号处理器(DSP)的软件锁相环(SPLL)的实现方法。分析了感就加热电源的各种调功方式,在对比几种
牛鞭效应是供应链中的需求波动放大现象。它是供应链结构中最为重要的性能指标,也是供应链运营中最为重要的绩效指标。牛鞭效应导致库存量及其费用增加;导致物流减缓、库存冗余
语音合成是一种能够将文字转换成语音的技术。当前,语音合成技术已成为人机交互的重要手段之一,并且在很多领域里得到日益广泛的应用。一般来说,把文字变成语音要大致经过这样几
预测控制自上世纪70年代产生以来,因其对模型要求低、具有较强鲁棒性等特点,在生产过程中获得了广泛的应用。目前,对线性系统预测控制算法的研究己经比较深入,理论研究相对也比较
小波分析理论是近一二十年迅速发展起来的新兴数学分支,是继Fourier变换之后又一个实用的信号时频分析方法。基于DWT的图像压缩技术是小波分析理论的一个重要应用方面。图像
永磁同步电动机(PMSM)控制系统因其自身的一些优点,在各个领域得到了日益广泛的应用,而低速无齿轮永磁同步电动机在电梯中的应用,更是其他各种电机曳引驱动系统无可比拟的。
本课题是电子信息技术和神经科学相互交叉融合的产物,以“脑-机接口”技术为主要理论根据和指导原则,应用自动控制科学和微电子技术,研制开发了适合于自由活动动物的遥控导航系