XML标注相关论文
本文系统阐述了一个计算机领域英汉双语语料库平台的构建方案,包括降噪处理,特征语块提取,关键词标注,中文分词,词频信息统计,段对......
多模态语篇分析发展到今天,面临的主要挑战是缺乏基于大量语料的实证研究,尤其是对平面媒体图文语篇的语料库研究。究其原因是图文......
与大型或专门用途的平行语料库相比, 利用影视对白字幕文本及文本中的相关信息建设平行语料库, 不仅能精确定位对白在影视中出现的......
本文报告作者从网上获取香港法律英汉双语文本,利用法律文本的原有体系结构和编号机制进行子段级文本对齐,并将对齐结果进行XML标......