一个面向信息处理的双向文字处理算法IBidi

来源 :计算机应用 | 被引量 : 3次 | 上传用户:qwaxjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据多文种信息处理中双向文字所存在的问题,提出了一种面向信息处理、具有自描述能力的双向文字处理算法IBidi。该算法首先对字符流进行预处理,主要对数字等特殊的字符进行标注;然后分析字符流,添加各种定义好的标签,用于描述字符的特性,供信息处理系统使用;最后,IBidi利用一个重新排序算法输出处理结果。该算法在典型测试样本上正确率达到96.7%,比Unicode的双向文字处理算法高出约17个百分点。另外,在随机样本测试中,IBidi的正确率也比Unicode的双向文字处理算法高5%左右。
其他文献
通过分析传统异构信息源集成中存在的问题,提出了改进的异构信息源集成中间件体系结构,并给出了数据转换的映射算法。该中间件通过对不同的信息源采用不同的转换机制,简化了集成方法,提高了查询的准确度。
板凳作为一种普通的家具,其本义指&#39;用木头做成的一种凳子,多为长条形&#39;,是一种没有靠背的坐具.在<现代汉语词典>2002年增补本里,&#39;坐具&#39;是&#39;板凳&#39;惟一
提出一个分布式计算机动态取证模型,在被保护系统中进行实时动态的证据采集,将证据及时、完整地存储到安全的证据中心,为证据分析和提取工作提供可信的原始证据数据。
提出了一种基于3D网格物体的鲁棒性盲水印方案。先将3D物体模型转换到仿射不变空间,然后把顶点坐标转换到球面坐标,利用球面坐标来嵌入水印。由于在仿射不变空间下,3D物体模型不受平移、旋转和比例变换的影响,故该水印方案对于此类变化具有很强的鲁棒性。试验结果也证明了这一点,且该水印具有良好的不可见性。
“工人”在古代汉语中也常见,所指较多,除《汉语大词典》所释而外,还可以用来指称占卜者、乐人、傩者、画工等不同的职业者。
美国一项回顾性队列分析表明,伴有房颤的终末期肾病(ESRD)患者在接受血液透析的同时服用华法林可增加卒中危险,在接受华法林治疗而又未接受专业国际标准化比值(INR)监测的ESRD患
浅析中小型双语语文词典的设计与编纂王春丽近年来国内改革开放的政策,促进了中外科技、文化交流及经济贸易的蓬勃发展。随之而来的是人们学习外语的热情不断高涨,外语教材、语
目的观察雷米芬太尼复合泊酚全凭静脉麻醉在胸腔镜肺大泡切除手术的应用效果。方法30例患者,男26例,女4例;年龄18~58岁,ASAⅠ~Ⅱ级,以雷米芬太尼1μg/kg,咪唑安定0.5~1.0mg/kg,丙泊酚1~2mg/kg
提出了一种可在全部可行解空间寻求最优解的混沌遗传算法。算法定义了问题模型及染色体表示方法;生成了考虑通信代价的贪婪算法初始种群;设计了一种新的交叉机制来确保杂交后生成的解依然为合法解;使用了启发变异算子;采用混沌优化技术动态控制交叉、变异操作;还使用了父代若干精英个体参与选择策略。最后给出了3种通信代价、2种任务节点及3种主机节点共18个任务图的仿真结果。