论文部分内容阅读
不论对于国家、企业还是研究机构,对研究领域技术发展方向的准确把控和对该领域新兴技术的敏锐捕捉,抢占先机,在某一领域竞争尚未激烈之前占据先导优势地位,都将对组织机构发展战略的决策制定起到非常重要的作用。然而新兴技术具有高度不确定性、创造性毁灭、爆发性增长、不连续性变化与“赢者通吃”的特征,要实现对产业或技术方向主导权的把握,需要时刻监测全球技术变化的前沿动态,在新兴技术轨道形成的早期就准确捕捉,予以关注并采取行动。由于新兴技术常出现在主流技术之外的边缘地带,且发展初期科学知识基础、技术架构标准、功能收益尚不明朗,特征不明显,容易被忽略,有征兆意义的弱信号常隐藏在大量噪声信号、竞争技术信号和主流信号之中,如何从纷繁复杂的信号中进行弱信号的甄别,发现潜在的技术发展趋势,捕捉技术发展初期的信号特征,是本论文研究的主要目的。本论文以德温特专利信息为数据源,从专利元数据信息和语义文本信息两个方面入手,一方面运用商业智能工具对专利元数据进行数据整合,构造专利数据的自动化规范模型,以形成高质量的干净完整的专利元数据集;一方面运用文本挖掘、信息抽取、模式识别的相关理论和技术,以SAO-C结构抽取为构造专利的语义特征抽取算法的基础,结合模式识别的相关方法构造深度标注算法,实现专利信息的语义表征和领域专利特征树的构建。并以此为基础,先从相应内容的专利数量上确定潜在弱信号集合,然后构建弱信号评价指标体系,运用数据集对模型进行训练和测试。论文的创新点主要有以下三点:一是提出了基于SAO-C结构抽取的专利信息语义标注方法,二是提出了基于专利语义特征抽取的领域专利特征树构建方法,三是提出了针对专利语义、基于文本挖掘、专利特征树构造技术和TRIZ理论的新兴技术弱信号辨识检测方法。