中国中文信息学会开源情报技术专业委员会(筹)发起会议成功举办

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wenyuanyuan0929
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国中文信息学会开源情报技术专业委员会(筹)发起会议于2021 年5 月9 日在清华大学罗姆楼5-206会议室举行.学会副理事长兼秘书长孙乐研究员、清华大学电子工程系副主任邓北星教授、专委会筹委会主任刘科伟研究员以及30 余位高校、科研院所和企业代表作为创始委员到场参加会议,会议由清华大学黄永峰教授主持.
其他文献
对于故宫的印象,我脑海里是五颜六色.红墙白雪琉璃瓦,雪中故宫美如画.走进故宫,映入眼帘是一大片红墙,飞檐峭壁矗立殿前,听钟楼声起,望城墙内外,惟余莽莽.阳春三月,草长莺飞,
期刊
属性是实体的重要组成部分,因此实体属性的获取是知识图谱构建的关键步骤。由哈尔滨工业大学社会计算与信息检索研究中心推出的开放域中文知识图谱《大词林》是通过从文本中自动挖掘实体及实体间的关系构建而成的,因此为《大词林》中缺少属性的实体添加属性也成为必须研究的问题之一。该文提出了一种解决方案:基于贝叶斯网络的概率统计模型,通过上位词概念与属性之间的依赖关系和实体与上位词概念的依赖关系来自动地为《大词林》中没有属性的实体添加属性,并与相似度计算方法对比证明了其有效性,可大规模提高《大词林》的属性覆盖率。
角色识别任务是近年来提出的一项自然语言处理任务,面向多方参与的对话场景,目标是将对话中的人物提及映射到具体的人物实体.目前在该任务的最优系统中,只使用了较为简单的编
性别偏见是社会学研究的热点.近年来,机器学习算法从数据中学到偏见,使之得到更广泛的关注,但目前尚无基于语料库的方法对文本数据中职业性别偏见的研究.该文基于标记理论,利
成人大脑究竟能否掌握新的语言规则,是语言学习研究领域一直存在争议的问题.习得年龄、输入量和相似性,哪个才是影响语言规则学习的重要因素?学界始终没有统一的结论.该文以
临床术语标准化即对于医生书写的任一术语,给出其在标准术语集合内对应的标准词.标准词数量多且相似度高,存在Zero-shot和Few-shot等问题,给术语标准化带来了巨大的挑战.该文
文本情感分析是自然语言处理领域一个重要的分支。现有深度学习方法不能更为全面地提取文本情感特征,且严重依赖于大量的语言知识和情感资源,需要将这些特有的情感信息充分利用使模型达到最佳性能。该文提出了一种融合卷积神经网络与双向GRU网络的文本情感分析胶囊模型。该模型首先使用多头注意力学习单词间的依赖关系、捕获文本中情感词,利用卷积神经网络和双向GRU提取文本不同粒度的情感特征,特征融合后输入全局平均池化层,在得到文本的实例特征表示的同时,针对每个情感类别结合注意力机制生成特征向量构建情感胶囊,最后根据胶囊属性判
人人心里都有一方凈土,当我踏上前往甘藏线路,内心澎湃。在这里,你习惯轻声细语,因为跨进经堂大门,自然而然低头不语;在这里,我喜欢聆听那浑厚的长号角声和那悠扬的诵经声;在这里,我常常流连于美轮美奂的转经长廊中,沉醉于远离尘嚣的生活里。寺里寺外,两方天地。我们可自由自在奔跑于草原上,呼吸着山间吹来的清风,漫步于旷野上,伸手采云摘星,独享一人的自由与不羁。
期刊
新时期乡村绿色发展是在中国乡村振兴的大背景下发展并逐步完善的。规划设计县乡级绿色通道工程深度改造是乡村绿色发展的重要基础,是发展市场经济的持续需要。因此,合理维系
汉字的表义性是其区别于表音文字的一大特点。部件作为构字单位,同汉字的意义之间有着很大的联系。然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题。针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型。该模型在向量内部评测任务上性能获得了一定提升,在汉字理据性测量任务上也与人工打分结果显著相关。基于该模型,进一步提出了部件表义能力的计算方法,对汉字部件的表义能力做了整体评估,并结合部