中文笑话语料库的构建与应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lavina0526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
笑话作为国家级非物质文化遗产,历史悠久,普遍存在于人们的日常生活中,是最贴近人们生活的艺术体裁之一,笑话的理解也是人工智能发展需要攻克的难题之一。该文构建的大规模中文笑话语料库为人工智能以及语言学研究提供了有利的资源支撑。该文首先归纳总结笑话语料库所依据的笑话相关理论基础,然后对语料库构建中语料标注、语料分析等工作做了详细的介绍,最后在语料库的基础上,分别将笑话与故事、微博、歇后语/谚语以及新闻四种体裁分别做了识别工作,验证了笑话简洁、具有一定的情节、富含情感等特征。同时通过与等长的负例构成的数据集进行笑
其他文献
近些年,网络表示学习问题吸引了大量研究者的关注,而异构信息网络由于其丰富的结构语义信息及其广阔的应用领域,更是成为了网络表示学习领域的重中之重。目前面向异构信息网
在古典室内乐音乐中,弦乐四重奏一直都被认为是具有高度艺术表现力、充分体现作曲家情感并能触动人心灵的音乐形式。但要体现出作品的内涵,往往需要深厚的演奏功底和艺术修养
自体育新课标实施以来,音乐在高职体育教学中的应用已十分广泛,且受到了广大高职体育教师的关注与重视。体育和音乐有着紧密联系的关系,基于对这二者在学生心理与生理方面相
为调动我国从事中文信息处理技术研究的专家和学者的积极性,推动信息产业的发展,根据《钱伟长中文信息处理科学技术奖奖励条例》,以及《钱伟长中文信息处理科学技术奖奖励条
介绍了海上三维地震探技术的新近发展。包括1.单震源多道海上拖缆地震勘探,指出这是一种成本较低的、可获得高褶皱数据的新技术,对单震源和双震源两种技术作了分析比较。2.多船-多道
简要介绍了地质统计学两大组成部分,克里金估计理论和随机模拟理论。克里金估计理论实际上是一种在均方损失下最优线性无编估计,在应用上具有平滑效应,适合于描述变化不剧烈的连
双隐层标准前馈网络只要其隐层节点数足够多就能解决任何形式的分类问题。应用标准网络识别多模式类分类问题时存在以下缺陷;1.对不同模式类均使用相同数目的隐层元;2.增加新模式类
对两类新型阳离子淀粉--阳离子羟乙基淀粉和阳离子苄基淀粉的合成方法进行了研究,通过元素分析和红外光谱对其进行了初步表征,元素分析表明,所得产物取代度小于0.2;红外光谱分析表明在
牛居油田是受岩性和构造双重因素所控制的多断块,多含油层系的油藏。从1983年底开始投产,初期和中期效果较好。1988年以后,部分油层水淹,从1990年起,油田进入低速开采阶段。近几年,运用了分层注
使用单片机采集的数据进行实时快速傅立叶变换在仪表的智能化控制中具有重要应用。笔者给出了8096汇编语言设计快速傅立叶变换程序的思路和经验。