计算机信息检索的批判性思考

上传人:san****019 文档编号:15903609 上传时间:2020-09-13 格式:PPT 页数:22 大小:259KB
收藏 版权申诉 举报 下载
计算机信息检索的批判性思考_第1页
第1页 / 共22页
计算机信息检索的批判性思考_第2页
第2页 / 共22页
计算机信息检索的批判性思考_第3页
第3页 / 共22页
资源描述:

《计算机信息检索的批判性思考》由会员分享,可在线阅读,更多相关《计算机信息检索的批判性思考(22页珍藏版)》请在装配图网上搜索。

1、1,计算机信息检索的批判性思考,谢 新 洲 北京大学新闻与传播学院 2006.8,2,目录 网络信息资源与用户的发展 计算机信息检索应用的发展 专业检索人员面临的问题 数字信息资源面临的问题,3,一.网络信息资源与用户的发展,1.搜索引擎标引网页数量的急剧攀升,图1.1 全球前五大搜索引擎标引网页数量(单位:十亿) 数据来源:,4,2.网络用户数量的飞速增长,图1.2 1996年至2005年全球网络用户增长趋势(单位:百万人) 数据来源:http:/global-reach.biz/globstats/evol.html,5,3.网络用户信息检索需求不断提高,图1.3全球主要搜索引擎每日提交用

2、户检索请求次数(单位:百万人次) 数据来源:,6,4.网络用户查找网页途径,图1.4网络用户查找网页途径统计 数据来源: http:/www.gvu.gatech.edu/user_surveys/survey-1998-10/graphs/use/q52.htm,7,二.计算机信息检索应用的发展 1.申报科研项目:选题的意义、研究现状、研究方法、研究思路等。 2.申报科研奖项:新颖性、独创性(创新性)。 3.科研成果评估:从项目成果到一般成果评价。 4.申报专利:新颖性、独占性、先进性。,8,5.高校中的特殊应用 1)学生信息获取能力是学习能力和研究能力的基础,是学生综合素质的表现。 2)硕

3、士、博士论文开题:选题确定、文献综述等。 3)硕、博士论文的质量评价,课堂论文的评价。 4)学科发展与评估。,9,三.专业检索人员面临的问题 信息资源数字化、网络化和大众化带来了一系列问题: 1.面临用户需求的多元化和多样性。 2.计算机检索的本质是个性化和个人化的一种信息服务,在网络环境下如何进一步强化。 3.网络信息资源丰富性带来了信息甄别的困难。 4.网络信息资源的丰富对保证查全率提出了新问题,容易漏检。,10,5.网络信息资源的丰富对保证查准率提出了新问题,容易误检。 6.网络信息资源的质量与评价。 7.基于搜索引擎“快餐式”检索带来的问题。 8.用户要求信息分析式的咨询。 9.大学师

4、生的检索知识的教育培训。,11,四.数字信息资源面临的问题 1.数字老化,没有反应最新的研究成果。 这是由于从学术成果的产生,到发布,最后进入数据库需要一个相对较长的周期。,12,解决的办法:由专职的馆员采集最新学术成果,并集成到图书馆数据库中,比如,大多数学术期刊会将自己的下期目录提前刊登出来,放到网上或印刷本期刊中,这应该成为重要的学术资源;一些专业性研究团体会在网上构建自己的学术交流区域,这些网络中包含了他们的最新研究成果、研究计划和思路,图书馆应该把这些资源集成起来,为研究者提供这些学术资源的简介和链接。,13,2 数据形式单一 现在图书馆主要提供的还是文本信息的检索,怎么样有效地提供

5、多媒体信息的检索是需要解决的问题。现在文本已经不是人们获取信息的唯一来源,多媒体信息由于其直观,生动的展示效果,在信息传播中将会发挥越来越重要的作用。比如记录专家学者讲座的视频文件,记录实验过程的图片文件等等。怎么为这些资源提供有效的检索途径和手段是当前需要解决的问题。,14,3.传统数据库面临生存问题。 1)一些主要文献数据库在市场化过程中难以得到资金的支持。 2)一些数据库的运做模式面临挑战。,15,4.数据资源的重复 主要表现在两个方面: 第一是不同的文章内容的重复,比如以竞争情报为关键词能检索出2500篇文献,但是其中可能只需要500篇就可以涵盖所有的内容了。怎么将这500篇文献挑选出

6、来,并且提供给用户检索,提高用户检索的准确性和效率,是需要解决的问题;,16,第二是图书馆资源的重复建设,比如,目前很多图书馆都购买了中国期刊网的数据库和维普中文科技期刊数据库系统。但是,这两个数据库系统中的绝大多数内容是重复的。如果能为用户提供一个统一的检索界面,并且实现两个系统检索结果的去重和排序,将会大大节约用户的检索成本。,17,5.浅层次的数据处理。 目前,图书馆提供的检索途径主要是基于关键词和文献的外部特征检索,很难让用户进行基于内容的检索,甚至不能提供全文检索功能。这就决定了用户检索结果的低相关度。提供对PDF等格式的文档的全文标引和检索是目前需要解决的问题。,18,6 .信息检

7、索与服务 图书馆提供的检索功能的易用性和友好性是决定图书馆信息服务质量和用户满意度的重要因素。针对高校图书馆,主要有以下几个问题:,19,目前,老师和学生的电脑拥有比例不断提高,他们在家里或宿舍就可以轻易进入图书馆的网站。但是,他们在家里或宿舍却得不到图书馆的某些服务。比如,不能进行全文下载。这大大增加了用户利用图书馆资源的负担,限制了图书馆资源效用的发挥。,20,图书馆网站界面设计没有体现用户友好性。像百度和Google这种专业的、面向大众的搜索引擎,其检索界面十分简单,提高了用户的易用性。而当进到图书馆网站时,会发现首页上面充满了用户不关心的信息。并且,图书馆的资源被分散在不同的目录下,这样用户首先需要判断哪些目录包含了哪些内容,增加了用户检索的难度。,21,谢 谢 !,22,

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!