中文文本挖掘中特征抽取和表示

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户:jian85733547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。文本的特征是概念的表现形式,特征抽取是文本挖掘的必要基础。鉴于中文文本的特点,该文提出了基于结合性的中文姓名识别方法、数字特征的转换以及基于模糊语义的表示和检索。它们具有较强的适应性和良好的反映能力,不依赖于具体的领域知识。
其他文献
摘 要:随着我国经济的快速发展,电子行业的进步也越来越明显,电子图书的出现迅速占据了图书市场,图书的种类和内容也越来越广泛,此时各种附属产品也不断出现、发展。特别是数字资源,已经整合到了以往传统的图书教育中。读者们获取知识的方式越来越便捷,电子图书的出现改变了传统的获取知识的方式,新型的读书方式使得读者获取知识更加快速。近几年电子书的发展慢慢发展起来,其发展基于各种数据库和非书进展之上并对原始的书
数字视频数据中的文本能提供重要的语义信息。该文用具有良好时频局部特性和变尺度特性的小波分析方法,提取图像中的尺度-空域特性,经神经网络分类器进行分类后,自动检测视频数据
摘 要:高层建筑在城市发展中已经成为了具有标志性的建筑,然而一座建筑的完美运行离不开电气的设计及安装,在高层建筑日益雄伟和壮观的今天,电气工程也面临着越来越高的要求和挑战,本文就关于高层建筑的电气设计安装进行解析。  关键词:高层建筑;电气系统设计;线路安装  引言  高层建筑电气设备具有用电设备种类多、用电量大且负荷密度高、供电可靠性要求高、电气系统复杂、电气线路多、电气用房多等特点。  一、高
文本的自动分割是语言处理中的一个重要内容,它的主要目的是将大量的无分割标志的文本按其主题切分为多段文本,每段文本都围绕一个主题且,段与段之间有明显的主题转换。该技术在
摘 要:法医病理学鉴定是法医鉴定的重要内容,在法医鉴定中起着重要作用,但随着社会的发展,由于各方面的因素,法医病理学鉴定的纠纷也逐渐增加,使得法医病理鉴定工作者也面临更多的挑战,本文对法医病理鉴定中的纠纷及相应的防范措施做简要的阐述,希望法医病理鉴定工作者提高鉴定纠纷防范意识,规范处理,避免纠纷的发生。  关键词:法医病理;司法鉴定;鉴定纠纷  科学鉴定是保证司法公正的基本要素,司法鉴定在司法活动
黑龙江省大豆年播种面积约400多万h㎡,需种量约在20万t以上,大豆种子质量的高低对于黑龙江省的大豆生产至关重要。全面分析大豆种子质量降低的原因并采取有效的预防措施,对确保大豆种子质量,提高大豆种子生产与经营效益,发挥优良品种的增产作用,都将起到积极的促进作用。  1大豆种子质量降低的因素  大豆种子质量降低的因素很多,主要有品种混杂及丧失生活力两个方面。  1.1品种混杂  品种混杂的原因很多,
摘 要:文章首先对开展调度指挥管理创新对铁路货运发展的重要意义进行总结,并探讨了开展货运运输调度指挥改革应当注意的几方面内容,对管理创新开展途径进行总结。在此基础上深入分析了运输组织创新管理的有效途径,并对实现工作目标的有效方法进行整理,帮助提升铁路货运管理资源的有效利用率,并节约运输成本的投入使用量。  关键词:调度指挥;铁路货运改革;管理创新  一、开展调度指挥管理创新对铁路货运改革的意义  
摘 要:现代化进程的不断深入,对社会生产发展的生产力和环保性提出了更高的要求,以工业污染为代价换来的GDP增长模式已经被人们摒弃,环保问题已俨然成为当今工业生产中的一个日趋重要的问题,工业环保生产问题在世界范围内已经引起广泛的关注,各行各业的科研工作者也在积极进行创新性探索。众所周知在输送行业中,一个重要的污染问题是在运送过程中工业散状物料可能会在输送过程中由于外溢撒料和粉尘到处飘扬,造成工厂生活