【摘 要】
:
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通
【机 构】
:
江苏科技大学计算机科学与工程学院,中国科学院计算技术研究所
【基金项目】
:
国家自然科学基金(61035004)资助
论文部分内容阅读
中文术语及未登录词的翻译是机器翻译、跨语言检索中的一个重要问题,这些翻译很难从现有的词典中获取。提出了一种通过搜索引擎从网页中自动获取中文术语英文翻译的方法。通过术语的部分翻译信息,构造出3种查询项模式,提出了多特征的翻译抽取方法。针对传统方法结果准确率不高、候选翻译干扰项多的问题,提出端类比对齐验证、双语对齐度验证、构词法验证3种验证模型来对候选翻译进行有效验证。实验结果表明,获取的双语翻译对准确率高,TOP1的准确率达到97.4%,TOP3的准确率达到98.3%。
其他文献
采用基于框架表示法的结构化技术表达静态预案,并基于关系模型设计预案库结构和索引。同时将基于案例推理方法和最近邻法相结合,通过计算突发事件与预案的相似度实现最优相似
针对无线传感器网络中的传感器节点通常使用电池供电且能量不易补充的特点,设计了一种低功耗的适用于环境物联网实时监控的节点。节点分为传感器节点和汇聚节点。传感器节点采用MSP430F1611作为微处理器,采用TI公司的低功耗射频芯片CC2420作为通信模块。汇聚节点采用ARM9系列S3C2410作为微处理器,采用CC2420作为通信模块。对节点的硬件结构和软件流程进行了设计。最后,通过实验对网络中节点
提出了基于跨层的自适应带宽预留和多重QoS保证的802.11eEDCA分布式流接纳控制。首先自适应分配各站点OFDM子载波比特以最大化信道容量,并将比特率跨层传送到MAC层。基于此,
给出了一个多处理器NoC结构以实现指定的中值滤波算法。为了提高图像处理的速度,在NoC设计的专用SoC中使用了系统并行机制与基本计算单元指令并行机制相结合的方法。它既可以满足处理速度的要求,又能达到降低功率损耗的目的。对图像处理中的中值滤波处理结构进行了并行设计,可极大地提高处理速度。
认知无线电网络中,协作频谱感知技术利用多个认知用户的本地感知,克服了多径效应、阴影效应等问题的制约,提高了系统的检测性能。介绍了典型的协作感知系统模型,对本地感知和融合
针对当数据集合中的数据属性差异不明显时,传统的均值聚类算法会收敛到局部最小值点,造成算法聚类结果不准、精度下降的问题,提出了一种基于密度的加权模糊均值聚类算法。该
针对带有时间属性的海量事务处理问题,提出了一种求最大相关性的最小时间区间(关键时间段KTI)的算法。通过利用极大团把海量的数据项进行有效的划分,降低了后续数据挖掘和决策
像其它许多领域一样,时间偏移机制在并行计算中也得到了充分的应用。实际上,并行计算并不能真正做到让各处理机都完全无时差地实现"并行"运算。由于各任务间存在数据依赖性,使
提出一种求解对象族模型的新的几何求解方法。提出两种新类型的组,即可伸缩组和可放射组。在刚性组或非刚性组系统中穷举地使用重写规则的较小的集合,一直到没有可用的重写规
在传统的集合运算过程中,集合内的元素一般通过自然语言表示,而不是形式化表示,这就在计算机处理时影响了集合运算的效率。为了解决这个问题,将二进制引入到集合运算过程中,