论文部分内容阅读
本次调查,通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计并进行统计数据的分析,旨在得出网页内容主题与网页题名、文章标题、第一段首句、第一段尾句、第二段首句、第二段尾句、首段、尾段以及HTML标记等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据.