面向SEO的网络编辑助手研究与实现

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:playboy200000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络编辑作为网站内容的设计师和建设者,其创作内容直接影响到网站访问量以及网站品牌的建设。但网络编辑员一般仅从选稿、编改、撰写等创作的角度来考虑网站建设,却不重视网站推广,大多没有从便于搜索引擎访问的角度进行网站内容建设,而网站流量的70%左右来自各大搜索引擎,因此,这在很大程度上减少了网站的访问量,不利于网站销售及品牌建设的实现。SEO是研究提高网站排名的技术,其核心包括关键词、内容、链接三方面。目前国内外对SEO的研究方兴未艾,尤其是针对关键词的自动选择和分析方法方面的研究报道较少,如何自动选择关键词并对其进行竞争强度分析将是本课题面临的核心问题。充分考虑到SEO对网络编辑工作的重要作用,并针对以上问题,本论文主要对SEO关键词的自动选择和分析方法进行了研究,并在此基础之上完成网络编辑助手的开发,主要的工作内容包括:(1)在关键词的选择上,提出了一种关键词扩展方法。通过对搜索引擎检索结果页面结构的分析,发现其“相关搜索”罗列出的关键词是依据历史搜索量的多少而生成,并且“相关搜索”中的关键词呈图状结构排列。因此,本文采用反向爬虫技术对搜索引擎“相关搜索”进行遍历以采集符合用户需求的关键词,并以百度为例实施了关键词扩展。(2)将C4.5决策树算法应用到历史优化数据的分类挖掘,分析出影响关键词竞争程度的主要因素有:使用intitle指令搜索得到的结果页面数、关键词在搜索结果第一页标题中出现的次数、关键词长度和关键词搜索结果数量等,并建立了关键词竞争程度预测模型,对模型准确性进行了评估。(3)设计了基于网页爬虫和正文抽取的信息收集子系统,该部分主要分为两大子模块,一是对行业网站信息的抓取,主要通过基于HTTP协议的网页爬虫并运用不重复和定期重访策略实现;二是对抓取的原始网页信息进行正文抽取,主要以方差为指标,通过逐步分析网页中文本节点的分布情况,最终完成对正文部分的抽取。(4)应用本文的研究成果,设计并实现了面向SEO的网络编辑助手。在创作前期,系统为网络编辑分析出适合创作的主题关键词;在创作过程中,系统实时对正文进行SEO要素分析;另外,本文实现了信息收集子系统,很大程度提高了网络编辑收集行业信息的效率。
其他文献
<正>【备课思考】《阿西莫夫短文两篇》——《恐龙无处不在》和《被压扁的沙子》,是人教版义务教育课程标准实验教科书《语文》八年级上册中一篇科技作品,对这类形式新颖的科
国内外学者对转移因子口服给药进行了大量的研究,包括转移因子生物学特性、转移因子口服给药的体内动力学、药效学、毒理学及临床疗效等各个方面。总结果表明,转移因子口服时不
目前,商品住房价格的溢出问题引起了全社会的广泛关注。以珠三角地区9个城市2004-2013年的商品住房价格数据为基础,研究城市之间商品住房价格的溢出效应;采用Moran’s I指数
随着国内汽车产业日益激烈的市场竞争,如何有效提高项目管理效率,降低汽车企业成本,从而在市场竞争中获得优势,成为各大汽车制造企业亟需解决的问题。“无缝隙”项目管理理论和方
存款保险定价是存款保险制度建设中的核心内容,合理的保费厘定关乎存款保险制度的建立和存款机构的参与程度。从传统的Merton模型入手,在模型中引入了存款机构和保险公司所得
使用2010年7月针对珠三角和长三角19城市农民工的问卷调查数据,采用明瑟工资方程并利用OLS方法对农民工参与技能培训的收入效应进行了估算。结果表明:参与技能培训总体上能使
税法与会计制度对收入的确认时间与标准存在差异,在企业所得税汇算中,需要对会计账面利润按税法规定进行纳税调整。有些事项不仅在业务发生当期需要进行调整,还会涉及到以后
随着银行间的竞争日趋激烈,优质客户的竞争更是进入白热化阶段。商业银行如何优化现有的客户经理绩效考核制度,促使客户经理不断去适应客户新情况、掌握新知识、提高新技能、
随着互联网的日益发展,对海量图片进行高速有效的处理已经成为一个重要的课题。互联空间、微博、社区网站等各种网络服务都需要海量图片存储与处理技术的支持。本论文将围绕海
在疾病诊断方面,随着生物医疗仪器和生物医学技术的发展,除了对蛋白和核酸等生物大分子的研究外,细胞水平的研究也越来越受关注。然而,与细胞研究密切相关的问题是如何有效地从复