论文部分内容阅读
20世纪90年代以来,在信息技术迅猛发展和全球网络化的影响下,越来越多的学生及从业者投身于科研事业。学科的基础理论研究日趋完善,学科内容逐渐丰富,新的研究领域不断开阔,研究人员及研究文献也在不断增长。在这种背景下,以往对于作者或主题单方面的研究,或者多方面单因素的考量,已经无法揭示当前科研成果中所隐含的作者分布及主题分布特征了。同时考虑到与研究数据领域息息相关的区域划分方式——城市群对主题及作者的区域性分布带来的影响。因此本文以此为切入点,展开对以城市群为研究对象及区域划分方式的作者及主题分布的联合性研究,以期为学科领域及作者、主题分布的研究方向研究提出新的思路。
本文首先利用空间计量分析方法分别对以5个指定城市群为研究对象的作者分布进行城市粒度下的空间分布研究;其次对以2个特定城市群为研究对象的论文摘要进行word2vec词嵌入并用K-Means进行向量聚类,而后采用TF-IDF主题词抽取方法完成主题分布性研究;最后针对以“长三角”城市群为研究对象的论文进行“本地作者”及“外地作者”的主题分布差异性研究。本研究主要得出以下结论:
第一,当数据量足够大时,以不同城市群为研究对象的论文的作者分布中,高产量被高产量包围的城市主要分布于自身城市群内及北京市、天津市及周边少量城市。说明除自身城市群关注于自身问题外,以北京市、天津市为中心的其他少量城市的作者关注全国各大城市群的问题。第二,以不同城市群为研究对象的论文主题分布存在相同性及差异性,相同性可认为学者对于各区域有相同的关注点,差异性可以认为受该城市群所处地理位置,经济状况,产业资源等存在差异,从而产生了主题分布的差异性。第三,“本地作者”及“外地作者”对以相同城市群为研究对象的论文主题分布存在异同。相同性为该城市群自身共同受关注的问题;差异性在于科研人员所处地理位置所导致的实验资源、个人研究偏好等客观及主观条件不同所引起的主题分布差异。
本文目的在于揭示以不同城市群为研究对象的论文作者分布差异及以相同城市群为研究对象的不同地理位置的科研人员研究主题偏好,以期为促进科研产出,科学地引导科研资源调配提供理论依据。在后续的研究中,需要进一步扩展研究广度与深度,不断探索不同学科领域,不同研究方法,不同地域划分方式下作者分布及主题分布的差异,从而得出更加科学的结论。
本文首先利用空间计量分析方法分别对以5个指定城市群为研究对象的作者分布进行城市粒度下的空间分布研究;其次对以2个特定城市群为研究对象的论文摘要进行word2vec词嵌入并用K-Means进行向量聚类,而后采用TF-IDF主题词抽取方法完成主题分布性研究;最后针对以“长三角”城市群为研究对象的论文进行“本地作者”及“外地作者”的主题分布差异性研究。本研究主要得出以下结论:
第一,当数据量足够大时,以不同城市群为研究对象的论文的作者分布中,高产量被高产量包围的城市主要分布于自身城市群内及北京市、天津市及周边少量城市。说明除自身城市群关注于自身问题外,以北京市、天津市为中心的其他少量城市的作者关注全国各大城市群的问题。第二,以不同城市群为研究对象的论文主题分布存在相同性及差异性,相同性可认为学者对于各区域有相同的关注点,差异性可以认为受该城市群所处地理位置,经济状况,产业资源等存在差异,从而产生了主题分布的差异性。第三,“本地作者”及“外地作者”对以相同城市群为研究对象的论文主题分布存在异同。相同性为该城市群自身共同受关注的问题;差异性在于科研人员所处地理位置所导致的实验资源、个人研究偏好等客观及主观条件不同所引起的主题分布差异。
本文目的在于揭示以不同城市群为研究对象的论文作者分布差异及以相同城市群为研究对象的不同地理位置的科研人员研究主题偏好,以期为促进科研产出,科学地引导科研资源调配提供理论依据。在后续的研究中,需要进一步扩展研究广度与深度,不断探索不同学科领域,不同研究方法,不同地域划分方式下作者分布及主题分布的差异,从而得出更加科学的结论。