基于场景文本阅读的机器人物体识别方法研究

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:wcs_ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人物体识别问题是服务机器人关键技术发展中的重点。在复杂环境中,机器人能否对场景中的目标物体进行精确的感知和识别,是目前机器人技术的一个挑战。场景文本阅读可以加深机器人对环境的智能感知、更好地规划路线、进行实时视觉翻译,也可以有效地帮助视觉障碍群体。随着人工智能和机器人技术的快速发展以及老龄化社会的到来,家庭服务机器人的需求会明显增长。取物是常见的任务之一,即机器人根据人类的指令取送日常用品。家居环境的物体种类繁多,而且对物体识别的精准度要求较高,如药品的外形大多相似,取物错误会导致严重的后果,所以机器人要具有很强的物体识别能力。目前基于深度学习的物体识别方法主要是通过物体的形状,用大量不同类别的物体图片进行训练,然后进行分类识别。但家庭取物操作往往要求识别同一类物品中不同物体,或者识别不同类别但形状类似的物体,因此识别的难度很大。为了解决复杂场景中机器人的物体感知问题,本文提出了一种基于场景文本识别的智能感知方法。提出的方法模拟人的行为,通过仔细阅读物体上的文本准确识别。机器人检测并识别图像中的文本,然后将识别结果存储在文本文件中。当用户向机器人发出指令时,机器人从文本文件中搜索指令的关键字,获得场景图像中物体的置信度。具有最大置信度的物体即为目标物体。结果表明,本文提出的方法能够准确区分任意形状和任意类别的物体,有效解决了复杂环境下机器人的物体识别问题。本文的主要贡献包括以下三个方面:(1)提出了一种基于场景文本阅读的物体识别方法。创新性地将文本的检测与识别和机器人物体识别相结合,采用这种方法,机器人可以识别任意形状和任意类别的物体。此外,该方法加快了机器人模仿人类识别行为的速度。(2)为了提高模型的识别精度,本文生成了一个新的数据集及其反转数据集。生成的数据集包含102000个带标签文档的图像,反转数据集在不更改标签的情况下反转生成图像的像素值。通过这些数据集的训练,模型的识别精度提高了1.26%。(3)对文本框的置信阈值与识别效果的关系进行了实验研究。置信阈值越高,识别结果越准确。然而这可能会丢失一些有用的信息。通过对测试样本的统计,本文将置信阈值设为0.97。这是一个很好的平衡点,在保留了关键信息的同时减少了错别字、提高了识别的准确率。
其他文献
近年来,随着对篮球运动员身体素质理论的深入研究,对核心稳定性训练的理论研究和应用也得到了加强。教练和运动员越来越意识到并认识到核心稳定训练对运动员身体的良好影响,核心稳定训练已越来越广泛地用于各种体育赛事中。迄今为止,国外将核心稳定性训练理论应用于竞技体育训练的研究已经逐渐成熟,而国内相关的实验研究仍处于起步阶段。篮球具有快速的进攻和防守节奏,复杂的技术战术和激烈的对抗,这对运动员的耐力提出了更高
利率市场化是我国金融改革的重要举措。2013年,央行正式开放对金融机构贷款利率的管制,实行贷款利率管制宽松化的政策,这代表着利率市场化成为我国金融改革与深化的重要突破口。但利率市场化能促进市场发展的前提是需要市场中的投资者是足够聪明的,这样利率才能准确地反映出来市场的需求。在此前提下,关注投资者的风险识别能力以及投资行为特征,对于维护金融市场的稳定,完善金融市场体系有着十分重要的战略意义。虽然P2
股市波动对于好坏消息的不同反应是股市波动的特征之一,这种对好坏信息的不同反应称为波动的非对称性。我国股票市场长期以来缺乏做空机制,并且与机构投资者相比个人投资者居多,不够成熟的市场机制以及非理性的投资决策使得波动的非对称性现象长期存在。我国第一只股指期货沪深300股指期货于2010年4月16日正式上市交易。股指期货作为一种做空机制能否稳定股市波动以及改善股市波动的非对称性一度成为许多专家学者研究的
在我国,普惠金融的发展已经进入了全新的阶段。过去数据整合和处理手段得益于云计算、区块链、人工智能等数字化技术的诞生有了很大的进步。普惠金融与大数据的结合开创了崭新的发展模式,给了城乡居民更多的机会去感受数字时代带给生活的巨大改变。近日,中央经济工作会议提出,要充分挖掘农村居民的消费潜力。我国农村居民的消费总量一直在稳步增长,消费水平也在不断提高。数字普惠金融对农村居民总体消费以及各项消费有什么影响
近些年来,中国经济不断取得新的突破,中国现在是仅次于美国的全球第二大经济体。但同时值得注意的是,目前我国正面临着资源约束趋紧、环境污染恶化、生态环境退化的严峻形势。对此,十八大提出“转变经济发展方式,推进绿色发展”。在绿色发展背景下,为绿色产业进行融资的绿色金融应运而生。绿色债券是绿色金融体系的重要组成部分,对推动绿色发展有着重要作用。信息不对称可以说是金融发展过程中最大的阻碍,绿色债券市场发展也
融资约束是企业发展的瓶颈所在,是促进国家可持续发展、形成新发展格局必须要解决的问题。然而当前世界经济局势不稳定,且受政治周期影响严重,使得经济复苏变缓。同时,国内正处在产业变革与经济转型的新阶段。如此,国内和国际的双重压力相互叠加,使得融资约束成为了阻碍企业发展的第一大难题。在货币政策传导不畅,对企业融资调节不力的背景下,货币政策沟通引起了学界的注意。同时考虑到在我国特殊的融资结构中,商业银行在中
山右,旧指山西,因居太行山之右,故称之。自公元398年北魏定都平城,山西在北方社会的地位日益突出,成为北魏、东魏和北齐政权的重要根据地,留存下来的北朝石刻蕴含着丰富的历史信息。清代学者胡聘之在山西任官期间主持编撰的《山右石刻丛编》,堪称山西石刻学著作的集大成者,极具史料价值。而此书仅著录至清代,山西后世出土的诸多北朝石刻未及著录。因而本文从《山右石刻丛编》切入,并补充其余具有代表性的山西北朝石刻,
存世李放著述有《中国艺术家征略》、《八旗画录》、《画家知希录》、《皇清书史》等,其中《皇清书史》散录李放先前所作《木叶厱法书记》、《郁栖书话》、《畿辅书录》等,历二十一年而成,收录有清一代书家五千余人,虽然其中所列条目大多为“引证他人成说以示非私”,但亦有李放旧撰书论近五百则,涵盖书法鉴赏、书迹收藏、书家品评等众多层面。总而论之,作为清代书法家名录的集大成者,《皇清书史》的问世,为研究清代书法史者
在建筑领域中,水泥基材料是应用最广泛的材料之一。然而,水泥基材料容易产生裂缝从而降低建筑结构的耐久性。为了修复水泥基材料中出现的裂缝,具有自修复功能的新型智能水泥基材料被广泛研究。水泥自修复技术一般分为自体自修复技术和自主自修复技术。自体自修复技术主要是通过水泥的水化过程产生Ca CO3沉淀填补裂缝达到修复效果,自主自修复技术是在水泥基质中添加工程水泥基晶体掺合料、聚合物、形状记忆合金和微生物,用
伴随着全球经济的飞速发展,企业面临的生存环境也在不断发展变化,企业不仅要应对自身发展带来的挑战,还要努力争取在激烈的市场竞争中立足。因此企业必须要加强自身的内部控制手段,提高整体经营管理水平。而建筑行业作为国民经济的中坚力量,由于其重资产高风险等特点,尤其需要重点关注其财务内部控制体系的建设。DX建筑公司作为建筑施工类企业,同时拥有国有企业改制为民营企业的背景,其在财务内部控制方面存在较多问题仍待