论文部分内容阅读
【摘 要】 本文从信息检索与计算机科学与技术专业的关系出发,接着对计算机信息检索存在的问题进行了研究,最后探讨了计算机信息检索的应用与发展
【关键词】 计算机;信息检索;应用与发展
一、前言
随着科技水平的不断提高,人们对计算机信息检索的应用与发展的要求也越来越高。现如今,信息检索的应用中还存在很多问题,急需解决,因此,我们要加强先进理论与先进技术的学习与应用,不断进行计算机信息检索的应用与发展的探讨,计算机信息检索的应用更加广泛。
二、信息检索与计算机科学与技术专业的关系
1、信息系统
是由硬件、软件与人三个要素组成的一个整体,三个要素之间必须十分协调地工作,才能充分发挥信息系统的效能,达到预期目标。
2、硬件
是对信息系统的所有物理的实际设施的通称,包括信息存储设备,信息传输设备,信息输入、输出设备以及信息处理设备等几类。
3、信息存储设备
信息在传播之前需要存储起来,如用于存放声音与图像信息的录像录音设备、用于存放程序与数据的计算机内存外存都是信息存储设备。按照信息的组织方式的不同,信息存储设备可以分内部存储设备。按照信息的组织方式的不同,信息存储设备可以分为内部存储器、顺序存储设备、随机存储设备。信息输入、输出设备。输入设备包括字符输入设备、位置输入设备、图像图形信息输入设备、声音信息输入设备、各种传感器。输出设备包括视觉输出设备。
4、信息处理设备
功能最为全面与强大的是计算机。信息传输设备,网络成了人们社会生活中的重要信息传输设备。软件是信息技术系统中用于控制和指示硬件如何进行信息采集、信息处理、信息存储、信息传播与信息产生等工作内容的部分。操作系统,指用于管理计算机系统的各种资源的系统软件。工具软件,包括维护工具和通用工具。软件开发工具,如各种程序语言、媒体管理工具、信息浏览工具。
5、应用软件
指各种专门用来从事不同工作的信息系统软件。人是信息系统中最重要的因素,信息系统的协调是一项非常重要的工作,作为信息检索的重要部分,信息知识是不可或缺的内容。作为一个有信息检索的人,应了解:信息技术的基本常识(各种术语、各种技术、信息技术的特点、信息技术的发展历史与趋势等);信息系统的工作原理(数字化原理、程序、算法与数据、信息传播原理);信息系统的结构与各个组成部分(硬件、软件、系统);信息技术的作用与影响(使用信息技术的利弊、局限性等);与信息技术有关的法律与道德常识。
三、计算机信息检索存在的问题
1、在搜索引擎方面中存在的问题
搜索引擎起着网络导航的作用,在给我们提供方便的同时,也存在一些问题。目前搜索引擎存在缺陷且智能化程度低状况,用户在使用搜索引擎检索信息时,经常会搜索出一些毫不相干的内容,大大降低了检索所需信息的效率。[2]目录式搜索引擎由于人工分类成本高,费时费力,标引速度慢,使得采集信息的速度远远跟不上网络资源的增长速度,这就造成了目录式搜索引擎所建立的数据库规模较小,某些类目下搜集的信息数量有限而且难以随时更新等缺陷,查全率低。关键词式全文搜索引擎采用机器人搜索技术,但是自动标引不完善,虽然數据库更新快,检索功能强,但是信息关联难以控制且重复链接太多,查准率低。
2、在信息资源组织分类方面存在的问题
目前有些网站质量差,栏目设置很是混乱,也没有导航措施,内容无特色、陈旧,长期不更新。信息类型庞杂,垃圾、虚假、过时信息等增加了信息的不确定性,造成了信息污染。而且在信息资源的分类组织上都存在着混乱状况,表现在类目划分标准不是很合理,对信息资源在同一层次的划分标准不统一,甚至可能会出现同时用两个或两个以上标准划分的现象。这样就会产生重复和遗漏的现象。而且,有时还会产生不符合基本逻辑的现象,存在整体不能包含局部的现象,我觉得应该明确事物的外延和内涵,在信息分类时做到概念清晰,检索结果力求达到查准率和查全率的恰当的结合。只有这样,才能确实方便我们用户能及时地了解最新的信息,但时有过多的动态信息使信息组织显得没有规律和层次,也会给用户的检索带来不便。
3、在多媒体技术方面存在的问题
多媒体信息检索技术是一种新的检索技术。[3]多媒体信息检索,是针对数值、文本、图形、图像、动画、声音等各种形式信息的全方位需求,采用具有集成性,实时性和交互性的计算机对这些多媒体信息进行采集、编码、储存、传输等数字化的处理,集成一个具有交互性的存取系统的检索过程。在进行多媒体信息检索时,存在用户查询界面和途径不够丰富多样,多媒体特征信息表达方式不够完善的缺陷。以及进行基于内容的识别和解释,多媒体特征的表述在检索中占有重要地位,多媒体的许多特征并不能用简单的数值和字符来精确表达,需要能表达多媒体内容特征的查询方式及用户接口,如在检索一幅图画时,很难解决内容描述的问题,因为同一幅图像,每个人可能有不同的见解,从而检索出来的结果很可能也不一样。
4、在个性化需求方面存在的问题
个性化服务也就是针对性的个别服务,具体来说就是指以用户为中心,有针对性地为用户提供服务。目前综合性搜索引擎提供是大众化服务较多,而个性化服务很少,它们没有有效地手段理解用户准确的个性化信息需求,不能提供长期的主动的信息服务。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息是远远不够的,只有针对不同用户的不同需求提供个性化服务,才有可能使每位用户都感到满意以求最大限度地为用户提供所需信息。
四、计算机信息检索的应用与发展
1、智能化
现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。
2、标准化
现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。
3、个性化
科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。
五、结束语
通过对新时期下,计算机信息检索的分析,进一步明确了检索的应用与发展方向,为计算机信息检索的优化完善奠定了坚实基础,有助于提高息检索的应用水平的提高。
参考文献:
[1]黄玠华译.《IBM知识管理经验谈(二):信息检索技术的发展》.2003
[2]张宏斌,朱明富,陈德军.智能化搜索引擎技术的研究进展,信息与控制.2003,6.
[3]孙建军.《信息检索技术》.科学出版社.2004
【关键词】 计算机;信息检索;应用与发展
一、前言
随着科技水平的不断提高,人们对计算机信息检索的应用与发展的要求也越来越高。现如今,信息检索的应用中还存在很多问题,急需解决,因此,我们要加强先进理论与先进技术的学习与应用,不断进行计算机信息检索的应用与发展的探讨,计算机信息检索的应用更加广泛。
二、信息检索与计算机科学与技术专业的关系
1、信息系统
是由硬件、软件与人三个要素组成的一个整体,三个要素之间必须十分协调地工作,才能充分发挥信息系统的效能,达到预期目标。
2、硬件
是对信息系统的所有物理的实际设施的通称,包括信息存储设备,信息传输设备,信息输入、输出设备以及信息处理设备等几类。
3、信息存储设备
信息在传播之前需要存储起来,如用于存放声音与图像信息的录像录音设备、用于存放程序与数据的计算机内存外存都是信息存储设备。按照信息的组织方式的不同,信息存储设备可以分内部存储设备。按照信息的组织方式的不同,信息存储设备可以分为内部存储器、顺序存储设备、随机存储设备。信息输入、输出设备。输入设备包括字符输入设备、位置输入设备、图像图形信息输入设备、声音信息输入设备、各种传感器。输出设备包括视觉输出设备。
4、信息处理设备
功能最为全面与强大的是计算机。信息传输设备,网络成了人们社会生活中的重要信息传输设备。软件是信息技术系统中用于控制和指示硬件如何进行信息采集、信息处理、信息存储、信息传播与信息产生等工作内容的部分。操作系统,指用于管理计算机系统的各种资源的系统软件。工具软件,包括维护工具和通用工具。软件开发工具,如各种程序语言、媒体管理工具、信息浏览工具。
5、应用软件
指各种专门用来从事不同工作的信息系统软件。人是信息系统中最重要的因素,信息系统的协调是一项非常重要的工作,作为信息检索的重要部分,信息知识是不可或缺的内容。作为一个有信息检索的人,应了解:信息技术的基本常识(各种术语、各种技术、信息技术的特点、信息技术的发展历史与趋势等);信息系统的工作原理(数字化原理、程序、算法与数据、信息传播原理);信息系统的结构与各个组成部分(硬件、软件、系统);信息技术的作用与影响(使用信息技术的利弊、局限性等);与信息技术有关的法律与道德常识。
三、计算机信息检索存在的问题
1、在搜索引擎方面中存在的问题
搜索引擎起着网络导航的作用,在给我们提供方便的同时,也存在一些问题。目前搜索引擎存在缺陷且智能化程度低状况,用户在使用搜索引擎检索信息时,经常会搜索出一些毫不相干的内容,大大降低了检索所需信息的效率。[2]目录式搜索引擎由于人工分类成本高,费时费力,标引速度慢,使得采集信息的速度远远跟不上网络资源的增长速度,这就造成了目录式搜索引擎所建立的数据库规模较小,某些类目下搜集的信息数量有限而且难以随时更新等缺陷,查全率低。关键词式全文搜索引擎采用机器人搜索技术,但是自动标引不完善,虽然數据库更新快,检索功能强,但是信息关联难以控制且重复链接太多,查准率低。
2、在信息资源组织分类方面存在的问题
目前有些网站质量差,栏目设置很是混乱,也没有导航措施,内容无特色、陈旧,长期不更新。信息类型庞杂,垃圾、虚假、过时信息等增加了信息的不确定性,造成了信息污染。而且在信息资源的分类组织上都存在着混乱状况,表现在类目划分标准不是很合理,对信息资源在同一层次的划分标准不统一,甚至可能会出现同时用两个或两个以上标准划分的现象。这样就会产生重复和遗漏的现象。而且,有时还会产生不符合基本逻辑的现象,存在整体不能包含局部的现象,我觉得应该明确事物的外延和内涵,在信息分类时做到概念清晰,检索结果力求达到查准率和查全率的恰当的结合。只有这样,才能确实方便我们用户能及时地了解最新的信息,但时有过多的动态信息使信息组织显得没有规律和层次,也会给用户的检索带来不便。
3、在多媒体技术方面存在的问题
多媒体信息检索技术是一种新的检索技术。[3]多媒体信息检索,是针对数值、文本、图形、图像、动画、声音等各种形式信息的全方位需求,采用具有集成性,实时性和交互性的计算机对这些多媒体信息进行采集、编码、储存、传输等数字化的处理,集成一个具有交互性的存取系统的检索过程。在进行多媒体信息检索时,存在用户查询界面和途径不够丰富多样,多媒体特征信息表达方式不够完善的缺陷。以及进行基于内容的识别和解释,多媒体特征的表述在检索中占有重要地位,多媒体的许多特征并不能用简单的数值和字符来精确表达,需要能表达多媒体内容特征的查询方式及用户接口,如在检索一幅图画时,很难解决内容描述的问题,因为同一幅图像,每个人可能有不同的见解,从而检索出来的结果很可能也不一样。
4、在个性化需求方面存在的问题
个性化服务也就是针对性的个别服务,具体来说就是指以用户为中心,有针对性地为用户提供服务。目前综合性搜索引擎提供是大众化服务较多,而个性化服务很少,它们没有有效地手段理解用户准确的个性化信息需求,不能提供长期的主动的信息服务。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息是远远不够的,只有针对不同用户的不同需求提供个性化服务,才有可能使每位用户都感到满意以求最大限度地为用户提供所需信息。
四、计算机信息检索的应用与发展
1、智能化
现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。
2、标准化
现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。
3、个性化
科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。
五、结束语
通过对新时期下,计算机信息检索的分析,进一步明确了检索的应用与发展方向,为计算机信息检索的优化完善奠定了坚实基础,有助于提高息检索的应用水平的提高。
参考文献:
[1]黄玠华译.《IBM知识管理经验谈(二):信息检索技术的发展》.2003
[2]张宏斌,朱明富,陈德军.智能化搜索引擎技术的研究进展,信息与控制.2003,6.
[3]孙建军.《信息检索技术》.科学出版社.2004