中文图文数据集构建

来源 :武汉大学学报(理学版) | 被引量 : 1次 | 上传用户:a415013145
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了从更深层次语义信息来描述图像,定义了图像、文本、事件文本、事件图、图像关键要素和文本关键要素六元组,以六元组为对象建立了中文图文数据集。基于事件语义模型与事件语义标注规范,在对采集的图像文本标注事件语义角色与事件关系的基础上,采用事件图对其语义进行形式化表示。对该中文图文数据集的统计分析表明,该数据集中各个事件语义角色都有所涉及且分布适中,图文对应区域数量相对句子长度表现适中,图文对数据质量较高。
其他文献
人力资源共享服务模式的建设实行,有助于企业实现人力资源的合理分配,让人力资源不再局限于传统意义上基础的、复杂的工作内容.而是通过人力资源共享服务实现充分调动人力资
背景:  强直性脊柱炎的易感性和严重程度很大程度上是由遗传背景决定的。最近中国学者通过全基因组关联研究发现ANO6,HAPLN1,EDIL3在中国汉族人群中与强直性脊柱炎易感性相
针对小样本甚至单样本情况下的疲劳寿命分布特征研究,给出了混合Gamma分布的概率密度函数可定义的充要条件,基于混合Gamma分布的单个观测值,得到了Gamma分布的可靠性函数的两
提出了一类具有多种形状危险率的新型寿命分布,即由威布尔分布和离散位相型分布混合生成的威布尔-离散位相型分布,给出了它的密度函数、危险率函数和k阶矩;研究了威布尔-2阶
本文针对当下企业退休人员社会化管理的模式加以分析,具体研究其出现的一些问题,同时明确社会化管理模式的优势,提出相应能够提升企业退休人员社会化管理模式有效性的应对策
二维系统等价是多维系统研究中的重要问题,它常被转化为二元多项式矩阵的等价问题来研究.二元多项式矩阵与其Smith型等价是矩阵等价研究中的重要问题.本文主要研究几类二元多
期刊
研究了具有齐次Dirichlet边界条件p-Laplace方程解的爆破问题.利用构造凸函数方法证明了初始能量为正数且r>p(n≥1)条件下,解在有限时刻爆破.
信息数字化高速发展的当下,一部手机、一台电脑就能满足几乎生活、学习、工作等各方面的需求.但人们在享受数字时代便捷的同时,却也在滋长着知识产权侵权行为的不断出现,而对
软件缺陷的高效自动分派是保障开源软件质量的重要手段.已有研究多基于机器学习技术,从缺陷报告的文本内容和开发者之间的关系入手,研究软件缺陷的自动分派,而对缺陷报告之间