基于概念和关联扩充的文本标题分类机制

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:zldzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是处理电子可读文本的重要手段,本文提出了基于标题的文本分类机制.其基本思想是:鉴于文本标题的重要性和简洁性,利用汉语语义分类树寻求概念上的扩充,利用语料库的关联矩阵,进行关联扩充,以丰富标题的语义内涵,从而获取较高精度的文本分类结果.该方法不依赖于汉语分析器和相应的领域知识库,速度较快,应用面较广.
其他文献
药剂学是一门综合性应用性较强的科学,是药学专业学生重要的专业课之一。随着素质教育的整体推进,有关实验课教学的理论与实践研究有了较大的进展,我们对药剂学实验教学多环节进
现代网络信息管理技术为人类资源整合及资源直接交流带来了巨大影响和进步,实现了用户资源共享方面完全平等。但在分享利用并消费信息内容时,要质疑和核合法性,如果存在不合
黑龙江省宝清县锅盔山铅锌金矿床地处吉黑褶皱系佳木斯隆起的中部,以往工作发现16条金、银、铜、铅、锌矿体,为扩大资源量规模,选择216、220、、224、228、232五条勘探线开展
时装表演是以服装为主体,以表演者为载体的社会文化表现,对欣赏者的视觉感官冲击非常强烈。任何一个表演舞台都是在有限的空间内将声、光、影、人等基础元素综合展现,力求美
提出一种使用Radix-8 Booth译码的Montgomery模乘算法,进一步减少了模乘的中间乘积项个数,提高了模乘的速度.并给出基于该模乘算法的1024位RSA加密硬件的实现方案,其加密速度可达
利用可扩展标识语言(XML)技术集成企业内部应用程序和B2B电子商务过程,提出了基于服务的电子商务集成框架,补充了UDDI规范,在UDDI的4层结构的基础上定义了服务协同标识语言的基本
采用二步法,以部分交联的聚氨酯(PU)为聚合物I,双酚A型苯并恶嗪(BA)的聚合物Ⅱ合成聚氨酯/苯并恶嗪互穿聚合物网络(PU/BA IPN),并应用动态机械热力学分析对产物的阻尼性能进行了研究。
通过对上海浦东国际机场及高速磁悬浮上海示范线工程项目的案例分析,从项目规划、设计、施工等角度总结了城市公共投资项目管理方面的思想和经验。探讨了公共投资项目管理的基
服务器复制经常被用来作为改进处理大量客户请求的服务能力的方法.在采用服务器复制时,一个关键的问题是客户如何确定哪一个服务器是最好的.通过一个简易的服务器模型,研究了
利用小波变换原理将具有非平稳特征的径流序列进行分解,使其平稳项与随机项分离。对平稳项采用传统的AR模型加以预测,而通过对随机项的混沌特征研究,发现其具有明显的混沌特征,进