中文Web文本挖掘系统WebTextMiner开发

来源 :计算机应用研究 | 被引量 : 12次 | 上传用户:wwwwcccc3012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
W eb文本挖掘系统的开发对W eb文本挖掘的研究有着很大的推进作用。因此在对基于SVM的中文网页分类器性能研究的基础上,根据研究和实用的需要,实现了一个性能较好的中文W eb文本挖掘系统。
其他文献
移动计算环境下各个同步设备上存储的数据元结构不尽相同,这给移动计算环境下的数据同步带来了挑战。提出了基于SyncML协议的异构数据源同步方法,该方法可以在不改变SyncML协议的基础上方便地完成异构数据源之间的同步。
瞬时无功理论起源与上世纪80年代,提出后成为了专家们的研究热点,并对检测的方法进行逐步的完善与改进,将其应用到了很多的领域,同时也取得了良好的效果。为了使无功电流检测
船舶电站管理系统是船舶上十分关键的设备。通过功能强大的PLC与PPU技术实现船舶电站的起动及停车、负载自动分配、自动卸载等自动控制功能,不仅改善了控制系统的性能,而且可
XML(可扩展标记语言)以其自描述性和便于传输的优势迅速成为网络上交换数据的存储格式。Web服务的应用使得Web应用程序可以透明地访问服务,请求参数和响应结果是被序列化进入SOAP消息中的。结合Web服务和XML技术的各自特点,提出了利用Web服务和XML实现数据库同步的策略。
电力作为社会生产中不可或缺的能源,其使用率在逐年提高,传统的供电方式很难满足当下的市场需求,大规模光伏发电成为当今电力行业的重点发展方向。太阳能光伏作为一种可再生
提出了一种新的手写体数字识别方法。首先利用核主分量分析技术提取数字图像的全局特征,然后利用独立分量分析技术提取数字图像的局部特征,分别选出部分局部特征向量与部分全局特征向量组合成数字的组合特征向量,然后利用支持向量机分类器进行识别。采用USPS字库进行测试,并与其他特征提取方法进行了比较,实验结果显示基于组合特征方法的识别率明显优于其他方法。
本体的应用是第二代语义Web的重要内容。利用本体构建知识库,进行逻辑判定,实现语义Web的自动推理,描述逻辑的作用十分重要。就知识库的本体描述以及在此基础上利用描述逻辑从不同角度的推理进行了研究,并分析了其内在联系。
为了防止混凝土箱梁墩顶块在施工过程中出现早期开裂与温冲现象,研究了混凝土水化热温度损伤模型,综合考虑混凝土弹性模量与边界条件的时变效应,采用线性迭代方法,建立了混凝土箱
为了揭示通过加筋回填减小路桥过渡段差异沉降的力学机理,参照桥台后加筋回填离心模型试验原型尺寸,应用ABAQUS有限元方法建立了桥台后加筋回填平面应变数值分析模型,通过不
采用在软总线TAO(The ACE ORB)上利用XML文档中所包含的语义化的抽象数据类型对构件对象进行操作,从而实现语义化的性能约束构件组装。建构的XML模式描述了构件组装相关的构件接口、交互及配置规约,并通过接口显式地表达构件对环境的依赖,使得能在一个分布式的网络环境里,将多个处于不同节点、提供紧密相关服务的构件在运行时动态地组装成功能系统。在给出的示例中,实现了将三个分布在不同节点的性能约束