基于动态流通语料库的流行语释义信息自动提取研究

来源 :第十一届中国人工智能学术年会 | 被引量 : 0次 | 上传用户:zf524979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对如何从动态流通语料库中提取流行语的释义信息进行了探讨,采用关键词表达式匹配(Query ExPression, Query Terms, Keyword ExPression)来进行提取,取得了一定的效果.
其他文献
Web上存在着大量内容相同的页面,网络重复信息的有效去除已成为改善Web信息采集系统性能的关键技术之一.本文将全信息理论应用到网络文本信息去重算法的研究中,提出了一种新
会议
目的 总结对有上腹部手术史患者行三孔腹腔镜胆囊切除(LC)术的安全性及经验.方法 对解放军第451医院2011年6月至2015年6月期间收治的有上腹部手术史且行三孔LC术的98例患者的
期刊
@@
从90年代开始,国际自然语言处理领域的主要特征之一就是转向对大规模真实文本的研究和处理.随着语料规模的不断扩大,统计中的数据稀疏问题、垃圾语料带来的统计垃圾问题、汉
传统的图像检索技术主要包括基于内容和基于文本描述两种.前者更多地利用了图像低层视觉特征,却存在难以逾越的"语义鸿沟";后者借助传统文本信息检索中的关键字匹配技术,仍存
会议
建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一.本文对150万汉字熟语料进行了统计分析;定义了语
传统的基于统计的文本过滤技术对具有倾向性的文本进行过滤效果不好,原因在于基于统计的方法忽略了文本中的词序等语义约束,无法有效识别倾向性信息.本文提出一种基于文本倾
语义知识库的构建与不断改进是文本内容理解的基础.本文针对CCD名词概念数据的特点,根据当代中文真实文本信息的词汇特征,提出了CCD名词概念的优化规范以及可行的优化方法,完
中文自动分词是进行中文信息处理的前提,分词词典机制是影响中文自动分词的重要因素.文中对目前典型的分词词典及分词算法进行了分析,并在此基础上提出了一种新的分词词典结
基本名词短语的识别在自然语言处理领域具有重要作用,本文提出一种基于扩展词性模板的汉语基本名词短语识别算法,在采用词性和词性模板信息初步标识基本名词短语的基础上,利
研究汉语的基本词汇,可以"帮助说明汉语的特点和它发展的规律性".本论文针对基本词汇的"全民常用性、稳定性和构词能力强"特点,在现有语言学家对基本词汇定性研究的基础上,构
会议