论文部分内容阅读
目的了解网络健康信息易读性的研究现状,探讨网络健康信息易读性高低的影响因素,为健康信息传播者的信息编辑发布和用户信息选择提供建议。方法采用NLPIR汉语分词系统对互联网健康信息类浏览排名前30个网站的网络健康信息进行自适应分词;利用结构化的数据查询语言工具SQL sever从汉字等级大纲、特殊词汇的角度分析文本词汇难度,分析网络健康信息的外部特征对易读性的影响。结果调查发现网络健康信息平均每百字句数在0.91-3.64之间,健康信息的每百字非常用词数在20左右,远远大于一般的汉语文本材料。此外,还存在网络健康信息医术语词汇量较多,网页版面呈现效果差,文本感情值较低等现象。结论网络健康信息平均句长偏大,文本信息中长句较多且每百字包含的非常用字偏多。网络健康信息易读性难度水平明显高于一般的汉语言文本材料难度。