信息资源组织的步骤
- 提问者网友:棒棒糖
- 2021-05-09 17:47
- 五星知识达人网友:行路难
- 2021-05-09 18:18
信息资源组织的步骤
随着数字化革命的深入和Internet的飞速发展,大量信息涌入Internet,使其成为世界上覆盖面最广泛的全球信息网,并将成为未来高速信息网络的基础和信息时代的重要支柱。如何对网络信息资源进行整序组织与揭示,使用户更加充分、有效地了解和利用网上资源,是图书馆——这个信息资源管理机构面临的重大课题。笔者现就网络信息资源组织管理的方式、方法问题进行阐述,相信,无论是对图书馆业务的深入发展,还是对用户的理解掌握都有着非同寻常的意义和实用价值。
1 网络信息资源的组织方式
网络环境为信息资源的管理制造了空前复杂的环境,对信息资源的组织与管理提出了更高的要求。目前,使用较为普遍的网络信息资源组织方式主要有文件方式、主题树方式、数据库方式、超媒体方式,其中数据库方式与超媒体方式是网络环境下文献资源组织方式的主流。
1.1 数据库组织方式。即将所有获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组配查询就可以找到所需要的信息线索,再通过信息线索联接到相应的网络信息资源。其主要特点有:①能高速处理大量结构化和非结构化的数据。如今的关系数据库在DBMS(数据库管理系统)中增加了对图形、图像、声音、超文本等多媒体数据的存储、管理、存取和处理功能,实现了从数据管理到对象管理的扩展,大大提高了信息管理的效率;面向对象数据库比传统数据库包含更多的数据语义信息,对复杂数据对象的表达能力更强。②以信息项作为数据的最小存取单位。数据库技术既可以存取数据库中某一个或某一组数据字段,也可以存取一个或一组记录,还可以根据用户需求灵活地改变查询结果集的大小,从而降低网络数据传输的负载。数据库方式对于信息处理也更加规范化,特别是在大数据量的环境下,其优点更为突出,但它对用户提出了一定的要求,要求用户必须掌握一定的检索技巧,包括关键词及其组配的选择。数据库方式是当前普遍使用的网络信息资源的组织方式。
1.2 超媒体方式。超媒体方式是超文本技术与多媒体技术相结合的产物。它将文字、表格、声音、图形、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库或知识库中自由航行,找到所需要的任何媒体的信息或知识。超媒体方式在组织网络信息资源上的优点表现为:①具有联想式的信息组织方式。超媒体采用非线性的由节点和链组成的网状结构组织块状信息,类似于人类的联想记忆结构,用户可以在网络中主动浏览和航行。②具有图、文、声并茂的信息服务功能。超媒体技术把数字、文本、声音、图形、视频等有机地整合,方便地描述和建立各媒体信息之间的语义关系,能满足人们自然交流信息的过程。但是由于采用浏览的方式进行信息搜索,当超媒体网络过于庞大时,用户很难迅速而准确地定位于真正需要的信息节点上,也难以避免地会造成用户“迷航”的现象。因此,现代网络信息资源组织的方式最好是数据库方式和超媒体方式的结合。这也是网络信息资源组织的未来发展趋势。
2 网络信息资源组织的工具
很多人认为,有了互联网,图书馆印刷型文献全部数字化上网后,就可以轻而易举地查找到自己所需要的信息。实际上并非如此。没有经过有序化组织的网络信息犹如一堆堆积在地上而没有经过分类加工的图书一样。因此必须将无序信息经过分类、编目组成有序信息,才能方便传递网络信息资源和用户利用。
2.1 分类法。分类法是将表示各种知识领域(学科及其研究问题)的类目按知识分类原理进行系统排列并以代表类目的数字、字母符号(分类号)作为文献主题标识的一类情报检索语言。目前网络上已有美国的《杜威十进分类法》(DDC)、《美国国会图书馆分类法》(LCC)、欧洲的《国际十进分类法》(UDC)、我国的《中国图书馆分类法》(简称《中图法》)等作为分类工具进行资源组织的检索系统。这些系统多以现有的文献分类法为依据,其中使用最多的是DDC。中国的教育与科研网络CERnet则使用《中图法》来组织其资源。传统的文献分类法在组织网络信息资源中发挥着有效的作用,并且随着网络使用的普及,它在网络资源中的应用必将逐步加强。当然,由于文献分类体系并不是按照网络资源的特点编制的,因此,在对网络资源进行处理时,应采取相应的调整措施。如对类目进行必要的调整,对类目体系的深度进行控制,加强类下说明等。同时以分类法编制的检索系统还应该做到界面显示形式多样,多种检索途径相结合,处理对象层次多样化,编制方式多种途径等。
2.2 主题法。主题法即主题检索语言,是以自然语言的语词经过规范处理后直接作为文献主题标识,并按字顺排列,结合参照体系和其他方法来间接地显示概念之间的关系,提供从事物名称检索文献的途径。由于主题法能使概念相同的信息聚集在一起,能为户提供最直接、直观、简便的查询途径。同时还能充分地描述信息资源的知识内涵,无论知识多专深、高新都可以充分地加以表述。因此,主题法成为搜索引擎的主要检索方法。使用主题法组织网络信息资源,用户能够对各网站及每篇文章中(全文搜索)的每个词进行搜索,真正向用户提供了对网上所有信息资源进行检索的手段,给用户以最全面、最广泛的搜索结果。主题法主要有两个标准,美国国会图书馆的主题表LCSH和医学主题表MeSH。LCSH的主题是综合性的,而MeSH则是专业医学的。
2.3 Dublin Core元数据编目。元数据(metadata)是关于数据的数据,它用来描述Internet上的信息资源的属性,它能帮助信息的识别、定位、发现、描述和选择等。1995年3月在美国俄亥俄州都柏林召开了第一届元数据研讨会。这次会议最主要的成果是确定了“都柏林核心元素集”(Dublin Core)。目前DC (Dublin Core)已从最初的13个元素扩展到15个元素,每个元素相当于MARC格式的一个字段,这15个元素大致可分成三大类:对资源内容的描述;对知识产权的描述;对外部属性的描述。各类包括的元素如下:
资源内容描述类 知识产权描述类 外部属性描述类
题名(Title) 创建者(Creator) 日期(Date)
主题(Subject) 出版者(Publisher) 类型(Type)
描述(Description) 责任者(Contributors) 格式(Format)
来源(Source) 权限管理(Rights) 标识(Identifier)
语种(Language)
关联(Relation)
覆盖范围(Coverage)
DC元素集在描述网络信息资源方面具有内在的本质性、灵活的可扩展性、独立句法结构、可选择性、可重复性、可修改性与适用性等特性。并且DC元数据集采用最小集简洁地提供了资源查询和检索属性的描述,这种简洁描述体系具有良好的易用性。由于DC元数据已被结构化,并支持字段查询,为从根本上解决网络信息资源组织与整理问题提供了切实有效的方法。此外,DC的著录标准已日益成为国际通用的适用于网络资源发现系统的元数据标准。如果说传统图书馆的文献编目,是为了方便读者对所需文献的检索,那么DC集元数据就是通过对网上电子资源属性的描述来提高网上信息检索的有效性。据统计,DC对网页进行描述后,其检索的查准率比没有进行描述的网页高10倍。
对于网络信息资源的组织和揭示的研究工作,在美国已经取得了一定的进展,而在我国还方兴未艾。必须看到,网络资源蕴涵着人类智慧的结晶,我们应充分发挥图书馆人在信息资源组织方面的专长,积极致力于网络信息资源的组织和揭示方式方法的研究,使网络信息资源的价值得到最大限度的实现。