正则表达式在专利信息提取中的应用

来源 :第十五届全国机械设计年会 | 被引量 : 0次 | 上传用户:francis123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对图像格式的专利文献难以进行深层分析和利用的问题,有效引入光学字符识别技术和正则表达式,根据专利文献的结构特点,给出了一组正则表达式,实现了专利信息的提取,并开发了相应的软件系统,从而获得专利的结构化信息,形成统一格式的专利数据库,为后续对专利文献进行高效率地深入分析和知识挖掘提供了基础。
其他文献
本文以正在研发的某电动车为对象,按动力性能要求,运用汽车理论、电动机和电池有关知识,结合设计要求,对整车的基本结构参数以及电动机的功率、传动比,蓄电池的容量、组数,整车续驶
会议
货币的国际化是一国非实体经济在开放经济下发展的必然产物,中国随着经济持续高速的发展和金融开放的进行,同样也将面临人民币走出国界,充当国际货币的问题,本文总结了国内学
可重构制造系统(RMS)的宗旨是提高企业对市场需求剧烈变化的敏捷反应能力,为有效提高RMS的可重构能力,合理的设备布局设计至关重要。本文首先通过介绍设备布局问题的概念及发展
今年是我党通信战线和情报战线的无名英雄李白同志诞辰100周年。新中国成立前,我们在延安中央军委三局总台党组担任联络敌占区我地下党电台的工作,那时我们还不到20岁,李白同
本文主要介绍了箱体类结构拓扑研究的重要意义,随后介绍了连续体结构拓扑优化研究的发展史以及国内外研究概况,最后对该课题的研究难点进行了分析和展望。
物体的序列及其分布很大程度上决定了该材料的性能。本文讨论了物体的各种晶体结构,分析了序列的对称性、自组织变化特性和序列间信息的传递,在序列的自组织变化中讨论了序列的
本文介绍了绿色制造的概念,研究了机械产品从设计,生产、包装、使用到回收处理整个生命周期过程中如何结合绿色制造技术,实现保护环境和资源的优化利用。
通过ADMAS建立参数化模型,对一类含有平行四边形链的轴间距可变等角速平面铰链机构进行运动学及动力学仿真分析,结论表明:参数化建模可以直观方便的获得满足确定双曲柄条件的含
会议
本文对流噪声的预测原理,水下自由湍流、有固壁影响的湍流和声比拟理论研究及辐射噪声机理、数值预报方法,混合求解方法进行了全面的回顾,特别对湍流噪声的源场与远场计算模拟分
轮轨关系是轨道交通中的关键技术问题,对列车运行的安全性和可靠性具有重要意义。近二十年以来,我国轨道交通不断提速,相关科研单位做了大量的研究工作,涉及的内容包括轮轨接触力