文本分割相关论文
自然场景中的图形符号不仅存在于设计图纸、考卷中,还存在于道路指示牌、广告牌等场景中。目前,图形符号的检测与识别已成为计算机......
需求工程是设计和编写工业软件的关键步骤。以人工为主的需求建模方式非常耗时且容易出错,现有的需求建模方法大多需要人工来完成,......
文本分割的主要任务是将文本按照主题相关的原则划分为若干个相对独立的文本块。针对现有文本分割模型提取文本段落结构信息、语义......
[目的]使用预训练语言模型进行长文本的分类的过程中,目前受到预训练语言模型输入长度的限制而无法有效利用长文本中的所有文本信息......
图像视频中的人工文本包含了大量重要信息,是作为对图像视频内容的说明、解释及补充。由于语义鸿沟(Semantic gap)的存在,造成计算......
本文介绍了文本分割的历史发展和现状,对当前文本分割领域的主流方法进行了讨论,并结合文本分类任务对文本分割任务中所存在的问题......
学位
随着统计自然语言处理技术的快速发展,文本分割日益成为一个重要的研究方向,并在多个应用领域发挥愈来愈大的作用。TextTiling算法作......
一篇文档通常涉及多个子主题,然而传统的文本处理系统如信息检索和文本摘要以整篇文档作为基本处理单元,隐性假设文档主要讨论一个主......
随着网络上丰富且可用的评论资源不断增加,针对观点分析和观点挖掘的研究应运而生。它们针对这些来自网络上对产品或社会问题的公......
在当今信息爆炸的时代,海量数据不断涌现,而且这些数据仍在以每三个月增长一倍的速度持续增长着。因此,如果不借助有效的信息挖掘......
学位
随着互联网技术的迅猛发展,数码产品的普及以及存储器容量的提升,视频数据量呈现出指数级增长,如何对海量视频数据进行有效的检索......
文本分割的本质是根据文本内部的主题相似性获得分割之间的边界位置,使得分割内部具有最大的语义一致性而分割之间的语义一致相对......
文本分割是信息检索和多文档摘要技术中的一个重要的处理步骤。通常一篇文本是由多个主题构成的,文本分割的主要任务是通过对文档......
整体阅读教学是针对分析阅读教学模式的弊端提出的,它主张避免解剖式地讲解文本,避免把作为整体涌现的文本分割开来。整体阅读教学的......
为了躲过学术不端检测,剽窃者们通常都不整段的复制粘贴,而是通过较智能的替换词语、调整语序、调整篇章结构等行为来进行剽窃或者......
自然场景票据识别是对手机拍摄的票据图像进行文本识别的过程,从收据和发票中提取关键文本,并将文本内容保存,有利于进行高效存档......
进入21世纪以来,互联网的蓬勃发展推动了各种电子商务平台的诞生。这些平台上发布的在线评论文本所包含的情感倾向有着特别重要的......
文本图像处理一直是图像处理的热门分支,在图像检索、图像分析、智能交通、票据和证件的自动处理中都有着广泛的应用。它包括图像......
视频中的文本信息对于视频内容的检索具有非常重要的价值。由于受到背景复杂度、字符与背景的对比度、字符分辨率、字符排列方向和......
随着计算机科学、多媒体技术的飞速发展,彩色视频成为电视以及网络中最受欢迎的媒体形式。在彩色视频中,文字信息(例如新闻标题、旁白......
因特网上的信息以前所未有的速度剧烈膨胀,促使对信息过滤的研究成为热点。该本文比较了在基于中文的信息过滤中,不同的文本分割方......
在车辆识别和车辆年检时,正确识别车架上金属刻印的车辆识别代号(VIN)是非常重要的环节。针对VIN序列,本文提出了一种基于神经网络......
为实现数字图书馆馆藏资源内容本身的多粒度关联数据的创建与发布,本文提出一种多粒度关联数据创建与发布方法。该方法首先依据主题......
自动提取图像中的文本对图像视频检索具有重要意义。提出了一种基于颜色和笔画特征,应用无监督聚类方法进行复杂背景下的文本分割......
新闻字幕的分割在基于语义的新闻视频检索系统中具有重要的意义,为此提出一种基于梯度增强的新闻字幕分割算法.该算法使用图像多方......
为解决复杂背景中准确地进行文字分割的问题,提出了一种应用stroke滤波器进行文本分割的新方法。首先进行stroke滤波器的合理设计,......
本文在文本分割和像素矢量化的基础上,针对尺寸文本区域提出了一种尺寸标注框架的几何重建方法。首先介绍所采用的文本分割与扫描像......
本文针对文本图像首先提出了一种基于小波域多状态隐马尔科夫树模型的自适应文本图像分割算法(Context-Adapted wavelet-domain Hid......
本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由......
作为文章内容的浓缩表达,摘要蕴含着文章关键的发现和结论。自动分析挖掘摘要内容,对于充分利用快速增长的科技文献具有重要意义。......
针对短篇幅文本数据稀疏的特性,提出了一种利用外部语料库知识提高短篇幅文本分割准确率的方法.该方法分2个步骤完成:①利用Gibbs采样......
在文本初定位、文本验证及笔画提取基础上,设计了一种基于笔画(Stroke)滤波器的图像文本提取实验。首先充分利用文本的笔画特性,借......
计算机大容量硬盘及大数据的海量内容导致硬盘存储的信息越来越多,这给数据挖掘、敏感信息发现等技术提出了新的挑战。针对这一问......
文本分割是信息检索的一个重要问题。文本分割是指在一个书面文档或语音序列中自动识别具有独立意义的单元(片段)之间的边界,其分割对......
随着Internet网络资源的快速膨胀,海量的非结构化文本处理任务成为巨大的挑战。文本分割作为文本处理的一个重要的预处理步骤,其性能......
提高复杂背景及噪声干扰文本图像的文本分割性能是文本识别研究中的重要问题和难点,为更好地解决这一难题,提出一种基于超像素融合......
本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白。本方法首先对预处理后的文本图片进行池化处......
本文针对文本信息资源的特征,提出了一个基于XML的文本信息可视化的通用模型,详细介绍了模型的三个对象空间——XML文档库、XML特征......
提出一种基于文本分割技术的多文档自动文摘方法。该方法使用HowNet作为概念获取工具,通过建立句子概念向量空间模型和利用改进的D......
文本分割,即对文本中的长段落进行切分,得到多个独立的子主题模块,模块内信息内聚度大,模块间信息耦合度小。传统的文本处理技术或......
文本分割是自然语言文本处理的一项重要研究内容。该文针对现有模型无法有效分割概括性小文本的不足,提出基于隐马尔可夫模型的统计......
主要研究科技期刊及论文的版面分析方法,通过版面分析,将文档版面进行分割及分类,划分出文本和图像区域,有利于进一步的研究。在文......
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏......
文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段。为了解决现有文本主题句提取中一些局部主题容易被忽略......
文本分割在文本摘要、信息检索等诸多领域都有重要的应用。主题模型是该领域研究中的重要方法,但目前基于主题模型的方法普遍依赖......
文本分割在信息检索、摘要生成、问答系统、信息抽取等领域发挥着重要作用。在总结现有的国内外文本分割方法的基础上,提出了一种......