论文部分内容阅读
由于INTERNET的讯速发展,INTERNET上存在的各种信息都与日俱增,每天都有不清的站点加入,并且已有的站点也有不断充实丰富,新的信息不断补充,据统计,仅新闻组每天增添的文字信息可达三百兆字节之多,WEB上增加的信息就会更多.加上各类BBS、邮件列表,由此可见每天互联网上增加的各类信息远非一个人能够看得过来.对于医学信息而言,由于人们对健康的重视,加上医学类信息可以涵盖的范围很广,医学信息已经成为各个类别信息中增长最快的类另之一.及时了解这些新增医学信息,对于人们了解科学进展,进行科学研究,减少重复工作,及时发现问题,认识人体自身,掌握医学知识是很有帮助的.然而从众多分布于各地的网上寻找所需信息是一件很困难的事,加之用户接入网络的速度经常会很慢,影响着对信息的访问,该文通过对INTERNET上信息资源及其分布的研究,找到一套行之有效的方法,从网络上搜集医学信息,存放入本地数据库,然后对这些医学信息进行分类、整理,对内容相关的页面进行初步文本聚类处理,最后完成医学信息检索与其在WEB上的发 布,从而建立一个试验性位于线联网上的医学信息管理系统,容纳各类医学信息,方便用户使用.该文还涉及了通过HTTP协议获取多种类型页面的方法,数据库的规划及设计,IIS服 务器的安全及使用IIS的信息发布.