【摘 要】
:
无线射频识别(Radio Frequency Identification,RFID),具有非接触、自动识别等特点,使其在室内定位中具有广泛的应用前景。现有的RFID室内定位技术在应对复杂的定位环境和高密度的定位空间时,对于定位精度,定位稳定性,定位时间,环境适应能力等方面仍存在较多问题。近年来,人们将机器学习引入RFID室内定位中,利用神经网络来拟合RFID定位目标位置,但面对大规模定位时,传统
论文部分内容阅读
无线射频识别(Radio Frequency Identification,RFID),具有非接触、自动识别等特点,使其在室内定位中具有广泛的应用前景。现有的RFID室内定位技术在应对复杂的定位环境和高密度的定位空间时,对于定位精度,定位稳定性,定位时间,环境适应能力等方面仍存在较多问题。近年来,人们将机器学习引入RFID室内定位中,利用神经网络来拟合RFID定位目标位置,但面对大规模定位时,传统机器学习中浅层神经网络定位拟合能力有限。因此,本文将深度强化学习的思想引入到RFID室内定位中,它具有自我修正和反馈机制,适用于大规模多目标的RFID动态定位。本文的主要研究内容和创新点如下:1、提出一种基于异步优势动作评价(Asynchronous Advantage Actor Critic,A3C)的RFID室内定位算法。该算法在基于神经网络的RFID室内定位算法深入分析的基础上,不再直接将信号强度值(received signal arrival intensity,RSSI)或其他定位信息直接输入神经网络中,而是引入强化学习的奖励反馈机制。将RFID室内定位过程看作马尔可夫决策过程,同时将强化学习中动作评价与深度神经网络相结合,建立定位的动作,环境,回报,并使用多线程并行网络训练定位模型,使模型能动态适应环境,实现动态定位。实验结果表明,该算法在定位精度,定位性能,定位效率等方面均优于其他定位算法。2、提出一种基于半监督动作评价协同训练(Semi-supervised Actor Critic Co-training,SACC)的RFID室内定位算法,该算法将动作评价与随机动作相结合,结合半监督协同定位训练方法,选出标记的最优RSSI值,利用标记的RSSI值和未标记的RSSI值数据进行协同定位,再利用克罗内克因子约数计算自然梯度,然后利用自然梯度分别更新动作网络和评价网络,最终得到RFID室内定位模型。该方法除了可以动态适应环境外,还可以显著减少标记参加标签的数量,减少定位成本。实验结果表明,基于SACC的RFID室内定位算法能更快收敛,定位成本更少,具有更好的定位能力和定位效率。3、提出一种基于近端策略优化(Proximal Policy Optimization,PPO)的RFID室内定位算法。该算法将动作评价与随机动作相结合,并进一步使动作回报值最大化,选择最优坐标值。同时引入剪切概率比,将动作限制在一定范围内,交替使用来自动作策略的采样数据,并使用随机梯度对多个时期的动作策略进行小批量更新,并用评价网络对动作进行评估,最后训练得到PPO定位模型。实验结果表明,该方法在有效减少定位误差,提高定位效率的同时,具备更快的收敛速度,特别是在处理大量定位目标时,可大大降低计算复杂度。
其他文献
按照形式逻辑的观点,概念是反映事物具有的本质属性(或特有属性)的思维形式。准确地区分概念,是人们正确认识事物的基础,也是人们对事物进行准确判断和推理的前提。但2019年高考江苏政治卷36A《经济学常识》第(1)问试题,却混淆了"劳动生产力"与"劳动生产率"这两个基本的经济学概念。36A《经济学常识》第一问试题是这样的:亚当·斯密认为,凡是能够采用分工的工艺,一经采用分工便能相应地增进劳动生产
新能源接入比例的不断提高恶化着电力系统的小干扰稳定性,系统面临的低频振荡挑战不容忽视,如何进一步提高系统的阻尼能力是当前亟待解决的问题之一。优化阻尼控制器参数是增强系统小干扰稳定性的重要手段,但该参数优化问题涉及到特征值优化,属于非光滑优化问题。非光滑优化问题的求解原是数学上的一大难题,前人虽尝试利用启发式算法或数学规划法来求解非光滑优化问题,但这些算法在处理这类问题时难以同时保证最优性和收敛性。
新课标将“培养学生的地理空间观念”作为核心观点,并提出地理空间观念教育是地理新课程教学应重点关注的领域。地理空间思维是地理空间观念的重要组成部分,而学会区位分析是培养学生地理空间思维的重要途径。本文以探究新中国成立以来上海市主要工业部门的区位条件变化为例,落实地理空间思维能力与地理实践力的培育。
由于通信网络和视频压缩技术的快速发展,人们可以在各种媒体终端设备上观看视频。由于终端设备的显示屏幕不尽相同,需要对原始视频的尺寸进行缩放调整,以适应设备屏幕的大小。传统的视频缩放方法如传统裁剪、均匀缩放及边缘填充等,在没有考虑视频重要内容的情况下直接调整视频尺寸,极易造成视频重要内容的变形和失真,视频观感差。因此,如何根据视频内容自适应地调整视频的尺寸,同时最大限度地保护视频重要内容信息,保证视频
猪繁殖与呼吸综合征(PRRS),病原为猪繁殖与呼吸综合征病毒(PRRSV),所有猪均易感。1987年,该病首次于美国发现,随后迅速席卷全球养猪业,仅有极少数的国家得以幸免,我国台湾地区于1991年出现了该病的报道。PRRSV一直危害着我国乃至世界养猪业的发展,但是到目前为止还没有针对PRRSV比较行之有效的手段。一直以来,国内外研制出很多种关于PRRSV的灭活疫苗和弱毒疫苗,甚至是重组疫苗,但都存
猪的呼吸道上皮细胞拥有能同时感染人和禽两种流感病毒的受体,因此猪被看作是流感病毒的“混合容器”。一旦新型重配病毒产生,将会对人类健康造成潜在的威胁。我们的前期研究(2013-2015年)中,已经从广西多个地区分离获得了不同基因型的新型重配流感病毒(H1N1和H3N2亚型)。因此,本研究继续对广西猪场进行了持续监测,分离获得了1株H1N1和1株H3N2亚型的猪流感病毒(Swine influenza
近年来针对电力系统的恶意网络攻击日益频繁,将攻击行为特点纳入风险评估环节有助于判断电力系统风险态势并采取有效防御措施。当前电力系统风险评估关于攻击行为要素的考虑主要基于攻击过程描述,考虑的攻击意图单一,未考虑多元行为影响因素对攻击行为的影响。本文考虑包括攻击者主观攻击偏好与电力系统环境信息在内的多类因素,将基于效用的行为分析模型纳入风险评估环节,提出一种考虑攻击者行为的风险评估方法与防御策略,结合