大数据视域下的中文词语研究初探(摘要)

来源 :第五届海外中国语言学者论坛 | 被引量 : 0次 | 上传用户:wangyujing07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网提供了名副其实的文本大数据.如何在这个"新常态"下进行汉语各项研究,是一个具有挑战性的问题.本报告在报告人所提出的"基于自然标注大数据的语言计算"学术思想的基础上,拟主要以新词语自动发现及成语定量分析这两个任务为案例,介绍清华大学自然语言处理和社会人文计算实验室在大数据视域下所开展的中文词语相关研究的初步结果,并给出一些讨论.
其他文献
"意外"(mirativity)范畴,研究"出乎意料"的信息所引起的说话人的情绪反映,它是"感叹"范畴的一个子系统.根据考察,至少对汉语来说,副词化形式(adverbialized form)与
会议
本研究旨在调查中文词典移动端应用"普利科"(Pleco)在美国大学高年级中文泛读课上的使用情况.研究者对11位被试进行了访谈和课堂观察,收集整理了他们对"普利科"的评
会议
新HSK与旧版HSK相比,不仅在题型、等级上有所差异,也更强调试题中的文化因素.但目前缺少对于新HSK考试中文化因素的分布及其特点的系统研究.本文以内客分析法对15套
会议
脱离文化或语境,孤立地进行汉字形、义的讲授,又或者仅仅停留在部件和文化的机械对应关系中,这是目前汉字教学的一些误区.本文探讨多媒体辅助下,针对非零起点汉语学
会议
随着现代教育信息技术日新月异的发展,汉语网络视频教学模式应运而生.该模式是汉语教学的一场革命,充分体现了"以学生为中心"的教学理念.针对韩国市场研发的"汉语在
会议
道经是我国古籍的重要组成部分,有着重要的学术价值.道经中存在大量的俗讹字,是文本校理和阅读中的一大障碍.本文比照不同的道经版本,经过详细的考证和分析,指出道
会议
文章列举了《詩》毛传的瑕疵三则。《周南·葛覃》曰:为缔为绤,服之无斁.毛传、《说文》、郑笺,皆训"斁"为"厌",后人解《诗》、《书》、金文沿用此说.其实《诗》、
会议
微课是教育信息技术现代化的产物,它以短而精、微而全的特点成为翻转课堂教学的主要资源.本文基于微课在培养学生自主学习能力和提高学习效率方面的明显优势,结合对
会议
  严复翻译英国古典经济学家亚当 斯密巨著《国富论》时所选用的英文底本The Wealth of Nations(Rogers 1880)作为严译研究的重要原始资料逐渐浮出水面,特别值得注
会议
汉字形体词符化是汉字构形系统古今发展的全方位转换方式,词符化既是对旧系统的改造过程,也是新系统的建立过程。通过构件形体的义化和声化、转换结构与构意重建、构
会议