切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
汉语语料的自动分类
汉语语料的自动分类
来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zrn851207
【摘 要】
:
语料库语言学的发展要求语料库的规模越来越大,随着电子出版业的迅速发展,获取大量机读文本建立大规模语料库已成为可能。但是收集来的粗语料是杂乱无章的,在作加工整理前必须分
【作 者】
:
吴军
王作英
【机 构】
:
清华大学电子工程系
【出 处】
:
中文信息学报
【发表日期】
:
1995年4期
【关键词】
:
语料库
语料分类
相关系数
汉语
corpus
text classification
related coefficient
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语料库语言学的发展要求语料库的规模越来越大,随着电子出版业的迅速发展,获取大量机读文本建立大规模语料库已成为可能。但是收集来的粗语料是杂乱无章的,在作加工整理前必须分类。若用手工分类则工作量很大。本文介绍了一语料自动分类办法。
其他文献
加强管理 确保国有资产保值增值
川中石油天然气勘探开发公司现有资产总额12亿元,固定资产原值约12亿元,净值6亿元,所有者权益8亿元。公司以经济效益为中心,以严肃的态度抓管理,以改革促进企业发展,取得了较
期刊
加强管理
国有资产管理
国有资产保值增值
效益为中心
经济效益
天然气勘探开发
流动资产
所有者权益
固定资产原值
企业发展
制定加速四川盆地天然气工业发展的扶持政策势在必行
随着本世纪中后期各国天然气勘探开发的加速发展,今后的10年,一些国家能源专家预言的"天然气世纪"即将到来。世界油气工业生产结构面临划时代的转折:世界天然气需求量将增加4
期刊
世界天然气
四川盆地
天然气工业
工业发展
天然气勘探开发
扶持政策
天然气资源
生产企业
市场经济体制
生产结构
石油工业面临的环境义务和挑战——第十五届世界石油大会专题述评
环境问题是第十五届世界石油大会的主要议题之一。在大会收到的91篇宣读论文中,直接论述环境保护问题的多达近1/6,环境问题无疑已成为管理者和石油工作者都必须面对并须加以
期刊
世界石油大会
石油工业
环境义务
环境问题
天然气工业
环境保护
二氧化碳排放
化石燃料
二氧化硫
全球变暖
一种新的汉字编码优化设计模式
本文基于对现有形码设计存在的规范性与易学,易用性间矛盾的分析,提出一种新的汉字编码设计模式;严格遵守汉字部件的规范,用多位(1-3位)字母表示部件以解决大量部件的定位,排序,合体字的
期刊
汉字编码
优化设计
中文信息处理
声形递进编码
国有资产租赁的实践与探索
近年来,为了划清全民与集体资产产权关系,加强国有资产产权管理,防止国有资产流失,我们一方面逐步以资产租赁合同方式对公司内部集体所有制企业有偿使用全民所有制企业的资产
期刊
钻井设备
实践与探索
资产租赁
租赁公司
国有资产流失
国有资产产权管理
野营房
川东钻探公司
设备租赁管理
具体做法
搞活青年科技人员管理的思考
青年科技人员是跨世纪的人才,在很大程度上决定着我们民族的盛衰和现代化进程。然而从目前的实际情况看,在科技人员管理和使用上还存在一些问题。主要表现为以下三个方面:
期刊
青年科技人员
科技人才
用人单位
人员管理体制
人才市场
现代化进程
主要表现
思考
三个方面
人才培养
钻探公司钻井工程招投标情况的调查
1993年,四川石油管理局钻井工作量因受投资局限急剧萎缩,钻井工程投资由计划下达转变为招投标竞争。川东钻探公司在市场、资金等方面出现始料不及的变化的情况下,一方面在职
期刊
工程招投标
招投标工作
钻井周期
钻井工程
钻井队
四川石油管理局
川东钻探公司
工作量
职工队伍
竞争意识
手写中文速记符中音符的动态规划识别方法
本文在分析英文速记识别技术以及中文速记特点的基础上,提出了中文速记符的自动识别策略,并且以“人群速记”体系为研究对象,详细描述了用于识别速记符中297个音符的动态规划识别过
期刊
手写体
速记符识别
动态规划
中文速记符识别
Renqun shorthand Partial smoothing Coarse classification
基于基因算法的时间规正算法
本文提出了一种适用于孤立字识别的基于基因算法的时间规正算法;详细讨论了其中一些关键技术,如编码方法,适应度技术,基因操作子设计等,该算法可弥补动态时间规划的某些不足:(1)使距离
期刊
语音识别
基因算法
时间规正算法
参考模板
Genetic Algorithm
Dynamic Time Warping
Serial Multi-path S
高速中文PostScript系统研究
PostScript为桌面设计过程中,排版印刷的后端处理的开放标准。高速中文PostScript系统的实现涉及到多方面的技术。我们一方面研究了中文PostScript系统软件构成和算法;另一方面,设计并实现了基于Intel80960CA超标量亿次处理
期刊
排版
印刷
硬件
POST
Script系统
中文
Chinese PostScript
Desktop Publising
Parallel Processi
与本文相关的学术论文