切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
会议论文
英汉双语自动对齐混合算法
英汉双语自动对齐混合算法
来源 :全国第八届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:linlijun002
【摘 要】
:
本文根据现有对齐算法,提出了二次对齐思想,并重新修改了句子对齐评分规律,更好的把基于长度和基于词典的算法结合起来,同时优化了一些辅助算法,使计算效率和实用效果都达到
【作 者】
:
周威
万康
刘志杰
【机 构】
:
创新未来电脑有限公司,北京海淀区万泉庄路15号,100089
【出 处】
:
全国第八届计算语言学联合学术会议
【发表日期】
:
2005年期
【关键词】
:
英汉双语
句子对齐
辅助算法
同时优化
实用效果
计算效率
修改了
思想
评分
规律
词典
长度
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文根据现有对齐算法,提出了二次对齐思想,并重新修改了句子对齐评分规律,更好的把基于长度和基于词典的算法结合起来,同时优化了一些辅助算法,使计算效率和实用效果都达到了一个很好的水平.
其他文献
情境描述的构建方法研究
情境描述是基于情境的词汇语义学的核心和基础.本文首先介绍了我们构建情境描述的基本准则,然后通过"符合"情境的构思过程提出了情境提炼的基本方法,最后介绍了我们设计的情
会议
情境描述
构建
词汇语义学
支撑平台
语义词典
认知图式
认知过程
开发平台
基本准则
基本方法
资源
设计
人工
基础
构思
著名经济学家张曙光建议发行社会保障特别国债
阻碍当前经济复苏的关键在于人们的预期看淡,而预期不稳又与大批职工下岗待业使收入预期降低、社会保障和医疗制度改革使支出预期增大有关。 1999年计划增发3165亿国债。如
期刊
医疗制度改革
张曙光
收入预期
职工下岗
经济学家
启动消费
乘数
基金管理
国有企业
社会保障基金
汉语人称代词消解的前端处理
本文讨论了汉语人称代词消解的前端处理所需要解决的两大问题:(1)潜在先行语的识别和捆绑处理(2)人称代词和先行语语法角色的识别.提出可能成为先行语的名词短语的捆绑算法以
会议
汉语
人称代词消解
先行语
语法角色
捆绑算法
识别
前端处理
名词短语
分析算法
测试结果
手工
基于Unicode编码的维、哈、柯文软件用户界面组件研究和实践
一个好的应用程序不仅要有强大的功能,还要有美观实用的用户界面.界面设计不仅是编程的问题,也需要一定的美学修养.本文基于Unicode编码的软件开发技术的研究基础上,对维、哈
会议
编码
软件
用户界面
界面组件
应用程序
美学修养
开发技术
界面设计
界面技术
继承关系
功能
析出
基础
构建
方法
编程
《人民日报》标注语料的初步统计分析
本文介绍了作者在人民日报标注语料库分析上的一些经验,提供了相关的研究结果.采用统计技术对熟语料库进行研究,其目的是为了汉语的自动分析.统计结果表明,即使语料标注经过
会议
人民
标注语料
语料库技术
自动分析
统计学习方法
语料库分析
语料标注
统计结果
统计技术
人工干预
汉语
词类研究
语言学
权益
经验
Windows平台下朝鲜文输入法实现详析
目前计算机已经成为我们工作、学习、娱乐的必备工具,而输入法是我们使用计算机所必须要接触的部分.如果输入法设计得当,那么必将提高计算机的使用效率和人机交互的友好性.本
会议
平台
朝鲜文
输入法
计算机
输入码序列
人机交互
分析方法
友好性
娱乐
学习
效率
设计
键盘
工具
基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析
词表对于中文信息处理等领域具有重要的价值和意义.作者对从2002年10种主流报纸中提取的两个词表(流通度表和使用度表)前3000词语进行了比较,如果把使用度词表作为初表,对比
会议
现代汉语基本词汇先验集的考察分析研究
基本词汇是词汇的核心,是汉语教学、语言本体研究及信息处理领域的基础.当前对基本词汇的研究还远远不够,还没有一个现实存在的基本词汇集,更没有对其量化测定的手段,本文介
会议
汉语教学
基本词汇
先验集
语言本体研究
自动提取
信息处理
量化测定
动态流通
词汇研究
语料库
计算机
词汇集
特性
考察
基础
高频最大交集型歧义字段问题研究
交集型歧义是中文分词的一大难题,建立大规模高频最大交集型歧义字段(MOAS)的数据库,对于掌握其分布状况和自动消歧都具有重要意义.本文采用全切分方法,在4亿字人民日报语料
会议
相似词及其在计算机辅助校对系统中的应用
统计方法在自然语言处理的多种应用中取得了令人瞩目的成果,但数据稀疏问题限制了应用系统性能的提高.把统计单位由词提升到词类有助于缓解数据稀疏问题,但是传统的词类体系
会议
与本文相关的学术论文