基于情节序列训练的电子市场智能定价算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:caolippp123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以B2B电子市场中卖方agent的智能定价问题为应用背景,在库诺特短视调整基础上,应用Q学习算法,提出了基于情节序列训练的学习方法,将纯粹以结果为反馈的强化学习方法和以推理为目标的慎思过程结合起来,提高了算法的在线学习性能。仿真实验验证了算法的有效性,为推向实际应用奠定了基础。
其他文献
在对VTP方法分析的基础上,对基于V11P的实时在线计算Hurst参数技术进行了性能分析,得出了其具有高效性的结论。并利用这种技术,对NIT的林肯实验室数据进行了分析,得出了DDoS攻击
医院感染控制已经成为医疗管理的重要核心部分,医院感染管理成效也逐渐成为医院综合治疗评价的主要指标之一。检验科为医院核心科室,工作人员需要接触患者带病菌标本接触,如
采用基于Helmholtz自由能推导的混凝土损伤本构方程,结合弹性模量损伤因子和残余应变影响因子,构建了CRTSⅢ型板式轨道充填层自密实混凝土(Self-compacting Concrete,SCC)疲
小学语文教学中问题教学法的应用具有极其重要的价值。在教育改革背景下,小学语文教师要积极改变过去单向传授的教育模式,科学提出问题,引导学生分析和解决问题,促使学生语文
目的:了解河北省某高校大学生营养知信行情况,分析其可能存在的问题,为后期健康宣教提供科学依据。方法:采用随机整群抽样方法,于2017年3月在河北省保定市某高校抽取调查对象
左右页图:清咸丰十年《南川县志》里的《南川县地域图》,清楚的描绘出南川各地的十七座廊桥,其中半溪河上的南门桥.至今依然跨立在南川城里。
传统的频率域图像配准方法有两种:基于互相关的图像配准方法和基于相位相关的图像配准方法。这两种方法都是通过确定逆傅立叶变换域最大峰值位置来获得配准信息。互相关图像配准方法与相位相关图像配准方法相比,主要存在两个缺点:一是峰值的跨度过大,二是有时存在多个峰值。对传统方法进行了改进,提出了频率域基于梯度预处理互相关的图像配准方法,该方法首先对待配准图像进行梯度预处理,然后对预处理后的图像用传统的互相关方
介绍了近年来我校的热能与动力工程专业在理论教学的课程设置和实践教学的安排上所做的教学改革及成果,重点介绍了实践教学中实习环节的内容安排,以及目前在实习企业的选择、
目的探讨非酒精性脂肪肝(NFL)肝脏脂肪浸润程度与胰岛素抵抗的关系.方法检测NFL组26例和正常对照组18例的血脂、血糖、胰岛素、游离脂肪酸(FFA),采用稳态模式评价胰岛素抵抗(
中共中央关于《推进领导干部能上能下若干规定(试行)》印发以来,德令哈市委严格按照全面从严治党、从严治吏要求,立足德令哈实际,在推进领导干部能上能下相关要求落地生根方面