Rich-text document styling restoration via reinforcement learning

来源 :计算机科学前沿 | 被引量 : 0次 | 上传用户:yh124712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Richly formatted documents,such as financial dis-closures,scientific articles,government regulations,widely ex-ist on Web.However,since most of these documents are only for public reading,the styling information inside them is usu-ally missing,making them improper or even burdensome to be displayed and edited in different formats and platforms.In this study we formulate the task of document styling restoration as an optimization problem,which aims to identify the styling set-tings on the document elements,e.g.,lines,table cells,text,so that rendering with the output styling settings results in a document,where each element inside it holds the (closely) ex-act position with the one in the original document.Considering that each styling setting is a decision,this problem can be trans-formed as a multi-step decision-making task over all the docu-ment elements,and then be solved by reinforcement learning.Specifically,Monte-Carlo Tree Search (MCTS) is leveraged to explore the different styling settings,and the policy function is learnt under the supervision of the delayed rewards.As a case study,we restore the styling information inside tables,where structural and functional data in the documents are usually pre-sented.Experiment shows that,our best reinforcement method successfully restores the stylings in 87.65% of the tables,with 25.75% absolute improvement over the greedy method.We also discuss the tradeoff between the inference time and restoration success rate,and argue that although the reinforcement meth-ods cannot be used in real-time scenarios,it is suitable for the offline tasks with high-quality requirement.Finally,this model has been applied in a PDF parser to support cross-format dis-play.
其他文献
以湖北宜昌某码头为依托,探讨了钢管混凝土桩基中桩径、钢管壁厚、砼强度等级、排架桩数、排架横撑对码头结构位移的影响,为基于钢管混凝土桩基码头设计提供参考.
本文介绍了模块式振动挤密桩新工法的概念,并介绍了本工法在日照港某项目的可液化地基中的应用.工法采用大功率振动锤和特制楔形模块,成孔后回填填料,经多次振动挤密,在地基中形成大断面置换桩体.工法具有穿透硬层能力强、施工效率高、造价适中、振动影响力小、安全环保要求等优点.在处理存在较硬夹层的液化土、对振动影响敏感的场地等地基处理可提供选择方案.
为了对建筑工程竣工项目进行准确的测量,将连续运行(卫星定位服务)参考站CORS(Continuously Operating Reference Stations)技术和项目精益化管理相结合进行了本次研究.采用建筑工程项目精益化管理实施准时制生产方式(Just In Time,JIT)采购计划;基于CORS技术构建并实现了监测平台自动化,在对数据进行跳周处理和相位中心改进的基础上将毫米级别层面的监测化为可能.对某基站在建工程在2019年第四季度实施了JIT采购计划,该项目的板材使用量和库存量明显较前三个季
中国水电孟加拉帕德玛大桥河道整治项目,地处孟加拉境内的帕德玛河.该河流水文条件复杂,汛期流速高,干季、雨季水位变化大,对项目施工及水下测量带来极大挑战.干季低水位期的多波束水下测量沿用普通的安装方式很难测到水深小于3m的浅水区域,多波束倾斜安装的应用可以很大程度解决这一问题,使浅水区域可测,并提高了测量过程中船舶设备的安全.
针对推力圆柱滚子轴承工作过程中滚子两端线速度不同引起的滚动体打滑、温度升高等现象,结合双列推力圆柱滚子轴承的结构特点,对滚动体布置方式及保持器结构进行优化,提出两种优化方案.优化后轴承充分利用轴承内部空间,且改善因滚动体两端线速度不同导致的回转不平稳现象;优化后轴承与同尺寸的传统轴承相比,具有承载能力高、结构紧凑、回转稳定性好,且部分零件能通用等优点.
以小规格高精度圆柱滚子的加工方法研究为主要目的,在传统加工工艺基础上,通过对两端面、外径面、滚动面等加工工序的工艺研究试验,得出一种新的加工工艺路线,解决了长径比大于1的高精度滚子出现倾斜反倒无法加工问题.
轴承装配车间属于典型的离散型制造车间,产线涉及手工设备、半自动设备、全自动设备,设备水平参差不齐,生产数据统计、处理、存储方式原始化,生产效率低下,质量问题难以追溯,严重影响了角接触球轴承的生产管理和质量管理.为了解决这一难题,融合二维码打印、扫描技术、OPC数据接口技术、数据库管理技术等多种技术,建立了一套角接触球轴承的二维码追溯系统,安全高效地解决了角接触球轴承各工序数据管理原始化、质量问题追溯困难的行业弊端,实现了角接触球轴承装配生产的数据化、信息化,提高了角接触球轴承的生产效率和生产质量.
对某型号发动机用圆柱滚子主轴承在安装内圈组件时,运转出现卡滞的问题进行了分析.通过建立模型、仿真分析和试验验证,指出了轴承运转出现卡滞是由轴承内圈退刀槽尺寸设计不合理以及制造精度超差所造成的.对该轴承结构退刀槽尺寸进行设计改进,改进后轴承再生产时,严格控制退刀槽加工尺寸和精度,装机后再没有出现滚子与滚道卡滞,运转不灵活的问题.
针对某风电齿轮箱项目,行星轮位置处的轴承出现多处磕碰伤,有些部位甚至出现大块材料掉落的现象,从结构形式及工作原理等方面进行了分析.改进了滚动体及套圈挡边的设计,改变了轴承在实际运转过程中滚动体与挡边的接触方式,有效缓解了轴承的磕碰伤.
本文针对某大型推力圆锥滚子轴承保持架的结构进行了改进,改进后的保持架,取消了锁紧槽的加工,增加了保持架的孔梁宽度和孔梁内侧槽,避免了在扩张锁紧槽时造成保持架变形等问题.有效地保证了保持架和滚动体组合件的稳定性、可靠性,提高了该类型轴承的整体质量,减轻员工劳动强度,节约生产成本.