论文部分内容阅读
专利文献代码化对于专利无纸化审查、专利分析、专利检索和专利管理都非常重要。本文提出一种以专利文献OCR校对词典和技术领域特征为基础.利用中文分词、隐马尔科夫模型为方法的专利文献OCR校对框架和专利文献OCR中文文本的拼写校对方法,降低了人力成本投入.提高了专利文献代码化效率和代码化质量。本文最后给出了实验系统和实现结果。