论文部分内容阅读
2019年10月18日,河南安阳,甲骨文的故乡,由当代甲骨学领军人物、中国社会科学院甲骨学殷商史研究中心主任宋镇豪指导,安阳师范学院甲骨文信息处理教育部重点实验室完成的“殷契文渊”甲骨文大数据平台正式上线。
登录“殷契文渊”网站,在字形库中选择甲骨字“人”字形,所有包含该字形的402个甲骨片信息就全部显示出来。甲骨文信息处理教育部重点实验室主任刘永革介绍,“殷契文渊”网站的甲骨文信息检索按照著录、文献和字形分为三类,极大地方便了研究者的查询与使用。
“殷契文渊”从2018年开始规划构建,其中字形库收录了已识未识的甲骨文单字4000多个,呈现每个字的部首、原形;著录库收集整理了公开出版的246种甲骨著录,目前发布了46部;甲骨文献库汇集公开发表的论文、学术会议论文、硕博论文等两万多种。
本科毕业于河南师范大学数学系的刘永革,后又在西北工业大学获得计算机软件与理论硕士学位,他不曾想到,自己的专业会与甲骨文产生关系。
2000年,刘永革从甲骨文输入法的研发开始,到目前,安阳师范学院已经组建了一支跨专业、多学科的甲骨文信息化处理团队,刘永革和同事们将3000年的古老文字同当代科技建立了亲密关系。2017年,甲骨文信息处理团队获批河南省科技创新团队和教育部创新团队;2018年,甲骨文信息处理实验室获批教育部重点实验室立项建设。
刘永革和团队走遍全国甲骨文研究和收藏机构,亲眼见证研究者置身卷帙浩繁的资料和形态各异的甲骨原片中,将书斋中的“冷门绝学”变成了“半体力劳动”。
刘永革時常提起安阳师范学院郭青萍教授的故事。郭青萍本是中文系教授,退休后开始自学甲骨文。历代研究者将甲骨原片的拓片、照片及摹本整理集合为甲骨著录,这是甲骨研习者的必备书籍。但电子化之前,研习者想要找到著录中某一字相对应的某一片甲骨,只能手工翻查各种资料。
初步建立的数字化甲骨图文资料库帮了郭青萍大忙。“2004年左右,郭教授要从《甲骨文合集》中找一个甲骨文字出现的甲骨片,合集一共13卷,当时已经81岁的老先生只凭手翻不知道要找到什么时候。我用当时做成的甲骨文图文资料库,几分钟就找到了有那个字出现的全部34片甲骨。老先生惊呆了,问我你是神仙吗?”
甲骨文大数据平台,最基础也最核心的是信息的采集和录入。为此,刘永革带领团队,用2年的时间,共30多名老师和50多名学生,对甲骨研究的权威资料逐条、逐页进行扫描、裁切、编号,寻找释文。
刘永革介绍,平台接下来将继续补充基础数据,同时采用人工智能技术进行数据分析,包括甲骨文识别与字形分析、甲骨文语言计算、甲骨文知识图谱、计算机自动缀合甲骨文系统等,有可能成为海内外最详瞻、最完备的甲骨文大数据平台。
“甲骨片材质特殊,片多易碎,并且分布全球各地,语言信息大多不完整。所以我们试着提取甲骨照片、拓片等图像的边缘信息,在库中搜索满足匹配条件的甲骨图像。”刘永革说,实验室已初步开发出甲骨图像拼接软件,并缀合出10多组甲骨图像,其中“属于新发现、可缀合、被专家认可的甲骨图像2组。下一步将统一甲骨图像的DPI(图像每英寸长度内的像素点数),并进行智能拼接研究,训练有边缘特征记忆功能的神经网络模型,提高甲骨图像拼接的成功率。”此外,实验室开始探索运用计算机大数据对甲骨文进行语义、语法处理和知识挖掘,为甲骨文考释提供新的辅助方法。
在“殷契文渊”网站首页上有这样一段话:“期望通过我们的平台,为甲骨文与甲骨学研习者提供便利,彰显甲骨文故土殷墟遗风之初心,共同致力于传承与弘扬中华民族优秀古典文化遗产。”
传承,在安阳,在安阳师范学院,不仅仅关系一校、一地。“殷契文渊”这样一个里程碑式的成果在安阳、在安阳师范学院诞生,看似理所当然,却也是几代学者背负担当、接力传承的结果。
1984年,第一届全国商史学术讨论会在安阳召开。这是冲破“文革”10年禁锢,也是殷墟甲骨文发现以来,第一次在甲骨文故乡召开的学术会议。作为会议的发起方,坐落于甲骨文故乡,浸润在殷商文化中的安阳师范学院以“继绝学”为己任,向著名甲骨学家胡厚宣表达了开展甲骨学与殷商文化研究的愿望。对此,胡厚宣表示强烈支持,并为学校题词:“地傍殷墟,开展殷商文化研究。”
1985年,安阳师范学院成立了殷商文化研究班,邀请当时国内甲骨学研究的著名专家胡厚宣、李学勤、田昌五、李民、赵诚、王宇信等到校任教。研究班开设了甲骨学、殷商史、先秦文献、殷商考古等课程。
在甲骨学界多年的悉心培养下,安阳师范学院的甲骨学与殷商文化研究不断取得进步。20世纪80年代后期开始,形成了以申斌、连波、郭青萍、聂玉海、郭胜强等青年教师和殷商文化研究班成员为骨干的研究队伍。他们大多参加了“1987·中国殷商文化国际学术研讨会”“1988·纪念殷墟科学发掘60年国际学术研讨会”等一系列学术活动,并拿出了较高水平的学术论文。校刊《殷都学刊》的《殷商文化研究》专栏逐步成为研究殷商文化的重要阵地。
而胡厚宣可能想不到,他当年亲手在安阳师范学院点燃的火种,将由自己的学生宋镇豪接过。
识别与释读是甲骨文研究的核心问题。在已发现的甲骨文单字中,大部分未获识别。在大数据、云计算迅猛发展的今天,如何有效利用这些现代科技手段,助力甲骨文研究工作,是各界一直在思考和努力的方向。在宋镇豪的指导下,安阳师范学院对甲骨文研究方法大胆创新,将云计算和大数据技术运用到甲骨文研究中,最终“殷契文渊”平台问世。
如今,宋镇豪还是坚持做着和老师一样的甲骨学的基础性工作,只不过过去留存的资料是黑白、平面的摹本,今天,宋镇豪等学者正将高清照片、摹本与拓本相结合,而未来,甲骨片的3D建模也提上了日程。
甲骨学大师董作宾1949年去台湾后,曾在《甲骨学六十年》(1959年)中无无比感伤地说:“展望世界,甲骨之前途至为暗淡”,“今日环顾宇内,则此学颇冷落。”
时光走入21世纪的今天,在安阳师范学院甲骨文信息处理教育部重点实验室的走廊里,实验室第一届学术委员会成员的名单中,有赫赫有名的计算机专家,自动化专家,考古学家,历史学家,学术委员会主任为中国工程院院士、清华大学自动化系戴琼海教授,他刚刚当选为中国人工智能学会的理事长。
新时代,新技术,新学人,甲骨文作为“冷门绝学”焕发了新的生机。这既是一种坚守的精神,也是一种信念的力量,这种精神和力量建立在具有5000多年中华文明传承基础的文化自信之上。
从“半体力劳动”到“人工智能”
登录“殷契文渊”网站,在字形库中选择甲骨字“人”字形,所有包含该字形的402个甲骨片信息就全部显示出来。甲骨文信息处理教育部重点实验室主任刘永革介绍,“殷契文渊”网站的甲骨文信息检索按照著录、文献和字形分为三类,极大地方便了研究者的查询与使用。
“殷契文渊”从2018年开始规划构建,其中字形库收录了已识未识的甲骨文单字4000多个,呈现每个字的部首、原形;著录库收集整理了公开出版的246种甲骨著录,目前发布了46部;甲骨文献库汇集公开发表的论文、学术会议论文、硕博论文等两万多种。
本科毕业于河南师范大学数学系的刘永革,后又在西北工业大学获得计算机软件与理论硕士学位,他不曾想到,自己的专业会与甲骨文产生关系。
2000年,刘永革从甲骨文输入法的研发开始,到目前,安阳师范学院已经组建了一支跨专业、多学科的甲骨文信息化处理团队,刘永革和同事们将3000年的古老文字同当代科技建立了亲密关系。2017年,甲骨文信息处理团队获批河南省科技创新团队和教育部创新团队;2018年,甲骨文信息处理实验室获批教育部重点实验室立项建设。
刘永革和团队走遍全国甲骨文研究和收藏机构,亲眼见证研究者置身卷帙浩繁的资料和形态各异的甲骨原片中,将书斋中的“冷门绝学”变成了“半体力劳动”。
刘永革時常提起安阳师范学院郭青萍教授的故事。郭青萍本是中文系教授,退休后开始自学甲骨文。历代研究者将甲骨原片的拓片、照片及摹本整理集合为甲骨著录,这是甲骨研习者的必备书籍。但电子化之前,研习者想要找到著录中某一字相对应的某一片甲骨,只能手工翻查各种资料。
初步建立的数字化甲骨图文资料库帮了郭青萍大忙。“2004年左右,郭教授要从《甲骨文合集》中找一个甲骨文字出现的甲骨片,合集一共13卷,当时已经81岁的老先生只凭手翻不知道要找到什么时候。我用当时做成的甲骨文图文资料库,几分钟就找到了有那个字出现的全部34片甲骨。老先生惊呆了,问我你是神仙吗?”
甲骨文大数据平台,最基础也最核心的是信息的采集和录入。为此,刘永革带领团队,用2年的时间,共30多名老师和50多名学生,对甲骨研究的权威资料逐条、逐页进行扫描、裁切、编号,寻找释文。
刘永革介绍,平台接下来将继续补充基础数据,同时采用人工智能技术进行数据分析,包括甲骨文识别与字形分析、甲骨文语言计算、甲骨文知识图谱、计算机自动缀合甲骨文系统等,有可能成为海内外最详瞻、最完备的甲骨文大数据平台。
“甲骨片材质特殊,片多易碎,并且分布全球各地,语言信息大多不完整。所以我们试着提取甲骨照片、拓片等图像的边缘信息,在库中搜索满足匹配条件的甲骨图像。”刘永革说,实验室已初步开发出甲骨图像拼接软件,并缀合出10多组甲骨图像,其中“属于新发现、可缀合、被专家认可的甲骨图像2组。下一步将统一甲骨图像的DPI(图像每英寸长度内的像素点数),并进行智能拼接研究,训练有边缘特征记忆功能的神经网络模型,提高甲骨图像拼接的成功率。”此外,实验室开始探索运用计算机大数据对甲骨文进行语义、语法处理和知识挖掘,为甲骨文考释提供新的辅助方法。
“有人做、有传承”
在“殷契文渊”网站首页上有这样一段话:“期望通过我们的平台,为甲骨文与甲骨学研习者提供便利,彰显甲骨文故土殷墟遗风之初心,共同致力于传承与弘扬中华民族优秀古典文化遗产。”
传承,在安阳,在安阳师范学院,不仅仅关系一校、一地。“殷契文渊”这样一个里程碑式的成果在安阳、在安阳师范学院诞生,看似理所当然,却也是几代学者背负担当、接力传承的结果。
1984年,第一届全国商史学术讨论会在安阳召开。这是冲破“文革”10年禁锢,也是殷墟甲骨文发现以来,第一次在甲骨文故乡召开的学术会议。作为会议的发起方,坐落于甲骨文故乡,浸润在殷商文化中的安阳师范学院以“继绝学”为己任,向著名甲骨学家胡厚宣表达了开展甲骨学与殷商文化研究的愿望。对此,胡厚宣表示强烈支持,并为学校题词:“地傍殷墟,开展殷商文化研究。”
1985年,安阳师范学院成立了殷商文化研究班,邀请当时国内甲骨学研究的著名专家胡厚宣、李学勤、田昌五、李民、赵诚、王宇信等到校任教。研究班开设了甲骨学、殷商史、先秦文献、殷商考古等课程。
在甲骨学界多年的悉心培养下,安阳师范学院的甲骨学与殷商文化研究不断取得进步。20世纪80年代后期开始,形成了以申斌、连波、郭青萍、聂玉海、郭胜强等青年教师和殷商文化研究班成员为骨干的研究队伍。他们大多参加了“1987·中国殷商文化国际学术研讨会”“1988·纪念殷墟科学发掘60年国际学术研讨会”等一系列学术活动,并拿出了较高水平的学术论文。校刊《殷都学刊》的《殷商文化研究》专栏逐步成为研究殷商文化的重要阵地。
而胡厚宣可能想不到,他当年亲手在安阳师范学院点燃的火种,将由自己的学生宋镇豪接过。
识别与释读是甲骨文研究的核心问题。在已发现的甲骨文单字中,大部分未获识别。在大数据、云计算迅猛发展的今天,如何有效利用这些现代科技手段,助力甲骨文研究工作,是各界一直在思考和努力的方向。在宋镇豪的指导下,安阳师范学院对甲骨文研究方法大胆创新,将云计算和大数据技术运用到甲骨文研究中,最终“殷契文渊”平台问世。
如今,宋镇豪还是坚持做着和老师一样的甲骨学的基础性工作,只不过过去留存的资料是黑白、平面的摹本,今天,宋镇豪等学者正将高清照片、摹本与拓本相结合,而未来,甲骨片的3D建模也提上了日程。
甲骨学大师董作宾1949年去台湾后,曾在《甲骨学六十年》(1959年)中无无比感伤地说:“展望世界,甲骨之前途至为暗淡”,“今日环顾宇内,则此学颇冷落。”
时光走入21世纪的今天,在安阳师范学院甲骨文信息处理教育部重点实验室的走廊里,实验室第一届学术委员会成员的名单中,有赫赫有名的计算机专家,自动化专家,考古学家,历史学家,学术委员会主任为中国工程院院士、清华大学自动化系戴琼海教授,他刚刚当选为中国人工智能学会的理事长。
新时代,新技术,新学人,甲骨文作为“冷门绝学”焕发了新的生机。这既是一种坚守的精神,也是一种信念的力量,这种精神和力量建立在具有5000多年中华文明传承基础的文化自信之上。