郑州航院信息管理学半开半闭考试

上传人:痛*** 文档编号:45545598 上传时间:2021-12-07 格式:DOC 页数:34 大小:985KB
收藏 版权申诉 举报 下载
郑州航院信息管理学半开半闭考试_第1页
第1页 / 共34页
郑州航院信息管理学半开半闭考试_第2页
第2页 / 共34页
郑州航院信息管理学半开半闭考试_第3页
第3页 / 共34页
资源描述:

《郑州航院信息管理学半开半闭考试》由会员分享,可在线阅读,更多相关《郑州航院信息管理学半开半闭考试(34页珍藏版)》请在装配图网上搜索。

1、信息管理学整理-邱振东1、事物存在的方式和运动状态的表现形式,这指的是本体论层次的信息。2、主体所感知或表述的事物存在的方式和运动状态,这指的是认识论层次的信息。3、信息链(Information Chain)中最高级别的环节是智能。4、信息分布的“富集”和“贫集”现象实际上是人类社会特有的选择机制支配的结果。5、信息分布中的“核心趋势”和“集中取向”有什么不同?核心趋势如高产作者群体的形成、期刊信息密度增大、高频词汇的确立等都是信息生产主体的主动期望与采取实际步骤的结果。集中取向则不同,是社会选择和影响的结果,信息生产者基本处于被动状态。核心趋势和集中取向的效果是一致的,仅仅是累积的程度不一

2、样。前者是相乘的累积,后者是相加的累积;前者是主动的选择,后者是被动的接受;前者称为自增生的过程,后者倾向大变量分布过程。6、布拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。7、分析影响文献增长的因素1、不同的学科发展态势2、学科发展的不同阶段3、学科研究人员的增加4、受到物质、经济、智力、时间等因素的影响和限制8、普赖斯指数,即某一学科领域内,对发表年限不超过5年的文献的引用次数与总的引用次数之比值。9、文献的半衰期,是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。10、结合信息服务实践,谈谈信息服务

3、设计应注意哪些方面的设计?信息产品设计、信息服务体验设计、信息服务传递设计三个方面很重要。同时从用户的角度来说,体验好,易获得,低成本,高效益。11、请结合自身经历,分析retrieval 与 browsing 两种行为之间的关系。retrieval是检索,是用户带有目的性的主动行为.browsing是浏览,是用户通过搜索引擎的反馈信息而进行的.12、试分析查全率与查准率二者的关系查全率(检索出的相关信息量/系统中的相关信息总量)*100%查准率(检索出的相关信息量/检索出的信息总量)*100%二者之间具互逆关系,成互逆相关曲线,在一个信息检索系统中,当查全率和查准率达到一定程度以后,两者就会

4、呈现出非线性的反变关系。也就是说,在查准率不断提高的同时,查全率会持续下降;反之,在查全率不断提高的同时,查准率也会持续下降。13、信息栈的增值功能是对信息进行加工和处理。14、分析信息化在当代社会经济发展中的地位和作用地位: 是社会经济发展的基础也是社会经济快速发展的必要保证和强有力的推动力作用:1是社会经济快速发展的必要保证 2是社会经济快速发展的强有力的推动力 3为社会经济发展提供了方向,与时俱进15、齐夫定律:如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级这样一直到D级,

5、如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr=c,式中,c为常数。16、在社会信息流的产生、传递和利用过程中,我们发现信息及相关因素常常表现出明显的核心趋势和集中取向。17、布拉德福定律(Bradfords Law of Scattering):“如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的核心部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系(a1)。”18、经典的洛特卡表达式又称平方反比分布。19、布拉德福定律还可用图形表示。如果横坐标取期刊按载文量递减排列

6、时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数量,我们将绘制出的曲线称为布拉德福分散曲线。20、受洛特卡定律的启示,普赖斯提出了核心生产者分布的平方根定律21、信息的离散分布是信息的重要属性,它表现为信息的内容单元以不同方式从不同角度分布于各种载体中。22、齐夫定律具有广泛的应用,在词表管理和控制、信息系统建设、信息储存与检索、自动标引方面都取得了许多应用成果。23、文献信息的老化一般指这样几种情形:文献中的信息仍旧有用,但为后来的著作所超越、信息不再有用、文献中所含的信息仍然有用,但现在已被包含在更新的其他论著中、文献中信息仍旧有用,但现在正处于一个人们对其兴趣下降的学科。24、布

7、拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。25、当前信息服务的载体形式主要表现为(网络载体)。26、在信息服务过程中,信息源、信息活动和信息用户是3个最基本的构成要素,而信息机构不是。27、信息服务的服务原则包括( 易用性原则、及时性原则 )28、信息需求的特征有哪些?( 知识性、多样性、模糊性 )29、RSS是个性化信息服务的一种表现形式。30、人机交互是网络信息交互行为的表现形式之一。31、用户对提供信息服务及信息资料的时间要求有一个总趋势(更快更新 )。32、信息搜寻开始于( 感知到的需要或差距,或非常态知识。 )

8、。33、归纳起来,我们认为:信息资源由信息生产者、信息、信息技术三大要素组成,信息生产者是最关键的因素。34、信息科学源于香农的信息论,形成于“三论”的统合,这里所说的“三论”是指(信息论、系统论和控制论)。35、信息论的创始人是(香农)36、90年代,我国文献情报领域的学者们更多地吸收了欧洲学者的信息管理思想,形成了(信息管理学派 ) 37、信息系统学派主要代表人物包括(霍顿)、马钱德(D. A. Marchand)等,是三大流派最系统、最成熟的理论学派。38、(信息管理学派)是三大派流派中内部分歧最大的理论流派,代表人物有马丁、克罗宁。39、1986年,信息管理学者马钱德和(霍顿)出版了信

9、息趋势:如何从你的信息资源中获利,在这本书中将信息管理发展过程划分为五个阶段,信息战略规划成为信息管理发展过程的最新阶段。40、41、按信息活动的应用层次,可以将信息分为(宏观信息与微观信息)。42、按主体的认识层次由低到高划分,信息可分为(语法信息语义信息语用信息)43、“对涉及信息活动的各种要素进行合理地计划、集成和控制”指的是(中观信息管理)44、按预测的性质可分为定性预测和(定量预测)45、(BPR)是企业再造工程的核心领域。46、信息论产生于20世纪40年代末,它的主要创立者是美国的数学家(香农(Shannon)和维纳(Norbertw、Wiener)。47、一般认为,香农的(通讯的

10、数学理论)(1948)的发表,标志着信息论的诞生。48、作为科学术语,控制的概念首先是由(维纳)于1948年在他的著作控制论关于在动物和机器中控制和通讯的科学一书中正式提出来的。49、早在二十世纪七十年代,美国学者(诺兰(RNolan)曾把一个单位计算机的应用过程划分为初装、蔓延、控制、集成、数据管理和成熟六个阶段。50、MRP是(物料需求计划)、ERP是(企业资源计划)、MRPII是(制造资源计划)、ERP的核心管理思想是(供需链(SupplyChain)管理)。51、信息对物质载体具有依附性52、“三金”工程是指“金桥”“金卡”“金关”三大基础工程的简称53、核心信息源是马太效应优势积累的

11、结果54、我们可以通过对信息源、信息准确度、信息费用三方面的评价来判断信息是否有价值55、信息组织的特性是渗透性、依附性、增效性56、从便于对信息管理的角度将信息源划分为记录型、智力型、实物型、零次型57、信息检索的特性是相关性、不确定性、逻辑性58、控制论的创始人是维纳59、按照空间状态分类,可以把信息分为宏观信息、中观信息、微观信息60、物质、能量和信息一起是构成现实世界的三大要素61、归纳起来,我们认为:信息资源由信息生产者、信息、信息技术三大要素组成62、记录管理学派的代表人物是瑞克斯、高和库克63、信息管理的系统原则的内容包括整体性原则、历时性原则、满意化原则三个原则64、信息管理的

12、原则有:系统原则、激活原则、共享原则、搜索原则和整序原则65、根据载体的不同,我们可将信息分成文字信息、声像信息和实物信息66、信息科学的方法论体系包括信息论、系统论和控制论。67、控制系统主要包括以下几个方面:控制的目标、控制的主体、控制的客体、控制的方法和手段68、信息资源:狭义的信息资源是指信息本身或信息内容,即经过加工处理,对决策有用的数据。广义的信息资源是指信息活动中各种要素的总称。主要由信息生产者、信息、信息技术三大要素组成。69、70、信息管理学:以信息资源和信息活动管理为研究对象,研究各种信息管理活动的基本规律、普遍原理和通用方法的学科。71、(1)管理特征:一般性特征,如:基

13、本职能是计划、组织、领导、控制;对象是组织活动;独有特征:第一,信息管理的对象主要是信息资源和信息活动;第二,信息管理贯穿于整个管理过程之中。(2)时代特征:信息量迅速增长、信息处理和传播速度更快、信息处理的方法日趋复杂、信息管理所涉及的领域不断扩大原则(1)系统原则(2)整序原则(3)激活原则(4)搜索原则(5)共享原则72、信息交流的障碍有哪些?造成信息交流障碍的原因。(1)信息失真(物理失真、语义改变、语用衰减) 原因:技术或通道障碍;信息栈过多;社会因素;自然因素。(2)信息附加原因:自然、社会、技术因素。73、简述信息分布的规律。(从信息生产者、离散、和时间三方面论述)(共25分)1

14、、信息生产者分布规律 洛特卡定律;普莱斯定律;2、 信息离散分布规律 布拉德福定律;齐夫定律;3、信息对时间的分布规律指数增长率;逐渐过时率。74、Mooers定律是齐夫定律的具体应用75、B2C:指的是企业与消费者之间的商务模式,英文为Business to Customer,简称B2C.76、信息管理的传统管理阶段是以信息源管理为核心。77、多向主动传递是专业信息服务开展的各种信息传递中最基本、最重要的信息传递。78、普赖斯曲线:文献数量随着时间呈指数增长的曲线79、社会信息:为了特定的目的产生、传递、交流并应用于人类社会实践活动,包括一切由人类创造的语言、符号和其他物质载体表达记录的数据

15、、消息、经验、知识。信息交流:不同时间或不同空间上的认知主体之间相互交换信息的过程。80、洛特卡定律是指某一学科领域内所有写了X篇论文的作者数是所有写了1篇论文作者数量的1/X2。81、数据处理系统就是DPS系统。课件:第一章重点:信息及信息管理的涵义;信息管理学研究对象难点:信息管理学研究对象、信息度量(2)不同学科的研究者对“信息”的理解经济管理学家认为“信息是提供决策的有效数据”物理学家认为信息是熵电子学家、计算机科学家认为信息是电子线路中传输的信号社会科学:“信息”大多是指消息、情报(4)我国著名信息学专家钟义信教授的信息定义本体论层次的信息定义:是指事物存在方式和运动状态的表现形式。

16、 事物:泛指存在于人类社会、思维活动和自然界中一切可能的对象。 存在方式:指事物的内部结构和外部联系。 运动状态:指事物在时间和空间上变化所展示的特征、态势和规律。认识论层次的信息定义:是指主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。(1)数据(data)数据是载荷或记录信息的按照一定规则排列组合的物理符号。它可以是数字、文字、图像,也可以是声音或计算机代码。数据 + 背景(Context) = 信息(2)知识(knowledge):是人的大脑通过思维重新组合的、系统化的信息集合;是对信息加工、吸收、提取和评价的产物,包括显性知识和隐性知识。“系统化、组织化的信息

17、”。信息 + 经验 = 知识三者关系:数据是信息的原材料,信息是数据所载荷的内容;信息是知识的原材料,知识是由信息提炼出来的抽象产物(3)情报(intelligence)是特定的信息,它产生于特定的领域。它具有其他类信息所不具备的保密性、难获得性的特点。情报一般定义为“有用的信息”。(4)消息(message,news) 消息往往用于指那些最新的动态。消息是信息的外壳,信息是消息的内核。零次信息:以自然物为载体的口头信息或实物信息,是一切信息产生的源信息,即客观存在于社会生活中,通过人的视觉、听觉、触觉等形成的言语、神情、动作、气氛等表象形式。 一次信息:指未经加工或略微加工的原始信息,是人类

18、社会实践活动中直接产生或得到的各种数据、概念、知识、经验及其总结。如新闻、阅读性图书、会议记录、论文、专著、统计报表等。二次信息:对一次信息的加工整理,目的是为了检索一次信息。如:文摘、索引、目录等。三次信息:利用二次信息对一次信息加工整理的结果。字典、词典、百科全书、年鉴、综述、述评、参考型图书等。信息的特征:1、普遍性 本体论层次的信息是事物的运动状态和状态变化的方式,这决定了信息具有普遍性。2、无限性和有限性 物质的无限性决定了本体论层次信息的无限性; 人类认知的有限性,决定了认识论层次信息的有限性。3、客观性与主观性(绝对性和相对性) 本体论层次信息决定了信息的客观性和绝对性; 认识论

19、层次信息决定了信息的主观性和相对性4、依附性和独立性 任何信息都必须有一定的载体,没有物质载体,信息便无法存在; 载体的转换不会改变信息的性质和含义。5、传递性 信息可以从空间或时间的一点传到另一点。6、动态性与时效性 信息是事物的运动状态,决定了信息是不断变化的,同时,信息只有在特定的时刻或时期,才有利用价值。7、信息的可共享性(苹果交换)信息在利用中不被消耗,可以在同一时间或不同时间提供给众多的用户利用。信息不会因为与别人分享而减少;1.1.5 信息的度量(1)基于经验的信息度量基本原理:不论如何进行评价,信息的价值认可都有一定的主观性,都是建立在定性分析之上或定性与定量相结合分析之上的,

20、基于研究者、管理者、使用者的经验而进行的。基于经验的信息度量的基础是对信息价值的基本认识布鲁克斯信息度量经验方程式:K(S)为原有的知识结构,I为吸收的情报量,即能够理解、整合到自己知识结构中的信息;KS+S为吸收了新的信息后形成的信息知识结构。基于经验的信息度量主要有以下几种方法:信息计量方法、社会调查方法、评估研究方法、层次分析方法 (2)基于数据量的信息度量在计算机信息处理中,常用的信息度量方法,是按表达信息内容的数据所占用的计算机存储空间的大小来衡量。常用度量单位:B (byte,字节)。KB(KiloByte,千字节)MB(MegaByte,兆字节)GB(GigaByte,千兆字节或

21、吉咖字节)TB(TeraByte,兆兆字节或太拉字节)PB(PetaByte,拍它字节)EB(ExaByte,艾可萨字节) 在传统的信息处理领域,也就是对报刊、书籍等非计算机信息的处理,通常直接采用发行种类、发行量或者文本的字数来进行度量。(3)基于概率的信息度量基本理念:信息量的大小取决于信息内容消除人们认识的不确定程度; 消除的不确定程度大,则发出的信息量就大;消除的不确定程度小,则发出的信息量就小;如果事先就确切地知道消息的内容,即消除的不确定程度为零。因此,消息中所包含的信息量就等于零。1.1.6 信息的功能(1)信息是人类社会生存的条件和发展的源泉。(2)信息是人类认识世界的中介(3

22、)信息是人类改造世界的重要资源和成果 信息管理的概念信息管理(狭义)就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;信息管理(广义)不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。信息管理的目标信息管理的总目标为:保证社会信息流在不同渠道中有序流动,信息的开发和利用在有领导、有组织的统一规划和管理下,协调一致、有条不紊地进行,使各类信息以更高的效率、效能,更低的成本在国家社会进步、经济发

23、展、人民物质文化生活水平提高中充分发挥作用。分目标 (1)信息的生产与开发分目标 (2)信息利用分目标。 (3)信息管理机制分目标。信息管理的基本原理1.信息增值原理 2.信息管理服务原理 3.信息管理的增效原理4.市场调节原理5依法管理原理信息管理的发展历程(1)古代信息管理活动时期(2)近代信息管理活动时期(3)现代信息管理活动时期信息管理发展阶段分类国外对信息管理发展阶段的研究马灿德和克雷斯莱茵的“四阶段说” 信息的物理控制;自动化技术的管理;信息资源管理; 知识管理马灿德和霍顿的“五阶段说” 信息的物理控制;公司自动化技术管理;信息资源管理;竞争者分析和竞争情报;战略信息管理史密斯和梅

24、德利的“五阶段说” 数据处理;信息系统;管理信息系统; 终端用户及其战略影响;信息资源管理我国对信息管理发展阶段的研究孟广均等 信息资源管理的萌芽时期(20世纪40年代中70年代中);信息资源管理的形成时期(20世纪70年代中80年代末);信息资源管理的发展时期(20世纪90年代);马费成等 传统管理阶段;信息管理阶段;信息资源管理阶段; 知识管理阶段卢泰宏传统管理时期(19001950),以图书馆为特征;技术管理时期(19501980),以信息系统为特征;资源管理时期(1980),以信息资源管理为特征信息管理学理论体系 1.信息管理学基础理论 (1)系统科学理论 系统论、控制论、信息学、运筹

25、学、系统自组织理论、非线性科学、复杂适应系统理论。 (2)管理科学理论 科学管理理论、组织管理理论、行为管理理论、数量管理理论、系统管理理论、权变管理理论、全面质量管理理论、目标管理理论。2.信息管理学应用理论 (1)信息整序理论 理论基础新三论 耗散结构理论 1969年由比利时布鲁塞尔自由大学教授普里高津(Prigoging)提出。维持系统的耗散结构必须具备如下条件:第一,系统必须是一个开放系统;第二,系统必须处于远离平衡状态;第三,系统内部各要素之间产生相互协调动作和相干效应,才能使系统从杂乱无章变为井然有序;第四,涨落导致有序。 协同理论 1977年由西德理论物理学家赫尔曼哈肯(Hake

26、n)教授提出。 a.论述系统从无序到有序和从有序到无序相互转变的条件与规律。b.揭示类比事物之间相同的内在固有属性。c.研究远离平衡态的开放系统。d.在一定的条件下,系统原来所处的稳定平衡状态可以变成为非稳定的,然后在非稳定状态的基础上,由于涨落的作用,系统有可能过渡到一个新的稳定的平衡状态,从而形成系统的自组织过程,完成了从无序到有序的转变。 突变理论 1972年由法国数学家雷诺托姆(R.Thom)提出。突变理论的主要特点:用形象而精确的数学模型来描述和预测事物的连续性中断的质变过程。突变理论在信息管理学中有着广泛的应用。突变理论方法可应用于研究信息对知识结构改变的影响;还可应用于信息系统的

27、设计。 旧三论申农的信息论、维纳的控制论、贝塔朗菲的系统论 (2)信息检索理论一般是指检索语言、检索策略、检索效率、检索系统及检索自动化、网络化等方面的理论。 (3)信息交流理论1)信息交流模型理论 通信过程的一般模式传播学模型社会学模型以美国社会学家门泽尔(Menzel)为代表提出的正式交流与非正式交流(formal and informal communication)模型,在社会学研究中较有影响。正式交流:依法组织、具有正规合法渠道、受法律保护,是社会组织机构运行的必要条件。有种说法是借助于文献的间接交流属于正式交流,其余是非正式交流。科学交流模式管理学模型(法约尔跳板模型)2)信息交流

28、的栈理论3)信息衰减与增值原理信息衰减原理: 在从信息生产者到信息接受者的信息流中会发生3种形式的衰减:物理衰减、语义衰减、语用衰减。信息增值原理:即在信息交流过程中,附加信息的生成与传递。4)信息传递的保真原理与冗余原理信息保真原理: 信息保真即信息守恒。信息冗余原理:冗余原理是为实现信息准确传递,使用各种冗余方法来加强信息传递的准确性效果,以减少信息衰减和信息增值的一种基本方法。 (4)信息系统理论信息系统理论是将系统科学的理论和方法应用于信息组织和管理的一门分支学科,现代化的信息系统是信息系统的发展方向,而现代化的信息系统主要是指计算机化的信息系统,或称之为基于计算机的信息系统(Comp

29、uter Based Information System,CBIS)。 从其发展历程看,计算机信息系统经历了DPS/EDPS/TPS、MIS、DSS/ES、ERP 4个阶段。 (5)信息资源管理理论 一般理论从总体上研究信息资源管理活动的基本理论和一般规律,其分支学科主要包括信息资源理论、信息资源管理理论、信息资源管理学方法论、信息资源管理学学科史、信息资源管理的比较研究、相关学科理论与方法的应用研究等。 应用理论研究信息资源管理活动某个环节和局部与规律的问题,其分支学科主要有文献信息学、图书馆学、情报学、档案学、大众传播学、编辑学和出版发行学等。国内外信息管理理论流派信息管理理论的形成开始

30、于20世纪70年代后期,最初萌芽于两个领域:工商管理领域和政府部门。目前主要有三大学派:信息系统学派、信息系统学派是欧美信息资源管理理论研究的主流。 主要代表人物包括霍顿、马钱德、史密斯、梅德利、博蒙特、萨瑟兰、D.侯赛因、K.M.侯赛因等。信息系统学派的理论学说是3大流派中最为系统最为成熟的理论学说。信息系统学派的特点:注重信息的资源特性和财产特性 注重信息系统理论与管理理论的结合 注重信息资源的实用分析 注重信息资源管理的战略性质 注重案例研究,注重集体研究 其面向对象主要是工商管理领域的管理者、管理信息系统专业师生及一般信息管理者记录管理学派、该学派的代表作:里克斯和高的信息资源管理(I

31、nformation Resource Management)美国学者罗贝克(Mary F.Robek)等所著的信息与记录管理(Information and Records Management)英国学者库克(Michael Cook)所著的信息管理与档案数据(Information Management and Archival Data)等。 记录管理学派理论学说的主要特点:将信息资源等同于记录 注重记录的生命周期 注重多种媒体的集成管理没有上升到战略管理的层次 未能真正统一文献信息管理,其实质是一种扩大化的档案和文书管理虽然也应用了信息系统理论和管理理论,但这些理论在这里只是一种框架,

32、它所装的仍是记录管理的内容。信息管理学派信息管理学派是3大流派中内部分歧最大的理论流派,主要有:马丁(W.J.Martin)的信息管理理论马丁在1988年出版的信息社会中专门有“信息管理”一章,涉及:信息管理的内涵和意义、要素、原则、认知、制约因素、实施与信息管理的过程克罗宁(B.Cronin)和达文波特(E.Davenport)的信息管理理论克罗宁和达文波特的信息管理理论:信息管理归纳为三种模型:隐喻模型:是根据事物描述目标事物的方法,常见的隐喻包括资源、武器、资产、财产、商品等;转喻模型:是以部分代表整体的方法,常用的转喻包括肖像、关键词、文摘、概要、屏幕菜单等;分类模型:是基于共同的明显

33、的因素来约束分离的实体,常用的分类方法包括等级分类、综合分类、语义网、图形理论、结群分类等。 斯特洛特曼(K.A.Stroetmann)的信息管理理论 他认为:信息管理是信息服务的内核;信息管理的背景分为三个层次:信息服务是第一重背景,图书馆和情报服务是信息服务的有机组成部分;信息市场是中观背景;信息环境是宏观背景。信息管理学科的发展趋势:(1)从技术角度看,信息管理正逐步实现科学化和现代化,不断开拓信息管理的新局面和新领域。 (2)从学科发展的角度看,信息研究的多学科、跨学科或交叉学科的特征十分明显。 信息管理学是系统科学和管理科学两大学科相互渗透、相互作用而形成的综合性交叉科学。这种学科整

34、合式的发展也反映了现代科学日益走向集成化、整体化的大趋势。课件:第二章重点:数据挖掘技术术语,信息安全威胁和对策难点:知识组织技术网格的概念:网格是可以作为虚拟的整体而使用的在地理上分散的异构资源,这些资源可能属于不同管理域,它们包括网络可达的异构计算机、数据库、科学仪器、文件和超级计算系统等。网格技术的本质网格的本质不是它的规模,而是充分利用互连网络中的现有软硬件资源,支持广域环境上的计算数据、存储、信息和知识资源的共享、互通与互用,消除资源孤岛。以较低成本获得较高的性能。共享与协同是网格的本质问题。 共享是将网络上海量、自治、分布、异构的资源进行有效组织,以服务的方式为网格用户提供统一透明

35、的访问机制。这些资源包括计算、存储、数据、软件、仪器设备、传感器、信息库、知识库和专家等。 协同是指资源可以相互交互、理解、协作,以期共同完成复杂的网格应用。包括人人、人资源、资源资源的协同。网格技术的特点 (1)分布性(2)异构性(3)自治性(4)动态性(5)自相似性 网格的分类按网格主体分为科学网格、地球系统网格、地震网格、军事网格、物理网格、游戏网格、教育网格等许多种。按网格客体分为数据网格、计算网格和服务网格。按网格客体的不同层次可以分为资源网格、信息网格 和知识网格。知识发现(Knowledge discovery of database):知识发现是从数据集中识别出有效的、新颖的、

36、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘(data mining):数据挖掘在技术上的定义:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘在商业角度定义 数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘的主要流程(四个阶段)系统的数据挖掘过程是一个不断循环、优化的过程。 数据挖掘的任务:1)描述性挖掘任务:用数据挖掘算法来描述大量数据的特性;2

37、)预测性挖掘任务:用当前的数据进行分析,来预测未知事物或者事件的发生。应用实例:电信 :客户流失百货公司/超市:购物篮分析 保险:交叉销售,流失信用卡: 欺诈探测电子商务: 网站日志分析,个性化服务税务部门:偷漏税行为探测警察机关:犯罪行为分析医学: 医疗保健,病症原因分析数据仓库的概念:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。数据仓库是知识发现、数据挖掘的基础数据仓库的几个重要概念:ETL(Extract/Transformation/Load):用户从数据源抽取出所需的数据,经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库

38、中去。元数据:关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。 Data Mart:数据集市 - 小型的,面向部门或工作组级数据仓库。 Operation Data Store操作数据存储 ODS是能支持企业日常的全局应用的数据集合,是不同于DB的一种新的数据环境, 是DW 扩展后得到的一个混合形式。四个基本特点:面向主题的(Subject -Oriented)、集成的、可变的、 当前或接近当前的。粒度:数据仓库的数据单元中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒

39、度级就越大。分割:结构相同的数据可以被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。数据仓库的特点:面向主题:典型的主题领域:客户;产品;交易;帐目集成的:数据提取、净化、转换、装载非易失的:数据仓库的数据通常是一起载入和访问的,但并不进行一般意义上的数据更新随时间的变化性:数据仓库的键码结构总是包含某时间元素。网络爬虫概述狭义上指遵循标准的 http 协议,利用超链接和 Web 文档检索方法遍历万维网的软件程序;而广义的定义则是能遵循 http 协议,检索 Web 文档的软件都称之为网络爬虫。网络爬虫是搜索引擎中最核心的部分,整个搜索引擎的素材库来源于网络爬虫的采集,从搜索引

40、擎整个产业链来看,网络爬虫是处于最上游的产业。信息过滤的定义信息过滤是根据用户的信息需求,在动态的信息流中,搜索用户感兴趣的信息,屏蔽其它无用和不良的信息。信息过滤的分类主动(Active)的 IF系统 主动搜集信息,并将相关信息发送给用户通常采用Push操作会造成信息过载问题,所以该系统要尽力建立精确的用户需求。被动(Passive)的 IF系统不负责为用户搜集信息通常用于邮件和新闻组信息过滤信息安全的概念所谓网络信息安全就是指网络系统的硬件、软件及其系统中的数据受到保护,不受偶然的或者恶意的原因而遭到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。信息安全的威胁 (1)病毒(2)

41、网络犯罪和黑客对网络攻击(3)拒绝服务攻击(4)信息泄漏指信息被泄漏给非授权的人(5)非授权访问(6)窃取(7)截取(8)伪造(9)篡改(10)假冒(11)行为否认信息安全的策略(1)保护物理安全(2)访问控制策略(3)保护信息安全传输(4)为服务器安装安全操作系统(5)防止黑客利用系统漏洞攻击(6)口令机制是资源访问的第一道屏障 (7)安装防火墙(8)网络安全管理课件:第三章重点:信息源概念、信息源分布规律难点:信息源分布规律;引文分析方法信息源概述信息源是信息的来源;是蕴含信息的一切事物;信息源可以不断转化为信息资源,但不全是信息资源;信息源分为:原始信息源、信息服务机构、信息系统三个层次

42、。原始信息源是没有经过任何加工处理,产生一些无序的、复杂的、真实可靠的信息。信息服务机构是专门从事信息的采集、组织、分析、存储的组织。他们要对将原始信息进行加工处理后,传递给用户,为用户提供信息服务的信息源。信息系统存储了大量的有序信息,通过 现代信息网络进行传递,为各类信息部门和信息机构提供更专业的服务。信息源定义(标准)信息源是人们在科研活动、生产经营活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的成品都是借以获得信息的源泉。信息源内涵丰富,包括各种信息载体,也包括各种信息机构;包括传统印刷型文献资料,也包括现代电子图书报刊;包括各种信息储存和信息传递

43、机构,也包括各种信息生产机构。 信息源的种类(1)按信息产生的时间顺序先导信息源:天气(地震)预报、股市展望实时信息源:实验记录、产品测试报告、股市行情滞后信息源:报刊文章、科技报告、论文等。(2)按信息的可保存性正式记录的信息源非正式记录的信息源(3)按信息的生产过程 原始信息源、二次信息源、三次信息源、精粹信息源:利用二次和三次信息源对某一学科、某一专题、某一研究方向中最有研究价值的某些数据、论述、文章、观点等按一定标准加以编制而成的信息源。(4)按信息存在的形式实物信息源:年轮、各种展品等。特点:直观性、客观性、隐蔽性文献信息源:用文字、图形、符号、声频、视频等技术手段将系统化的信息 内

44、容存储在纸张、胶片、磁带和光盘等物质载体上而形成的一类信息源。特点:系统性、时滞性、稳定性 组织机构信息源:研究机构、信息中心、图书馆、档案馆、标准化组织、学术团体、高校、新闻出版单位等。特点:权威性、垄断性数据库信息源:清华同方、重庆维普,提高了信息检索效率;有利于信息共享。特点:动态管理性、多用性、技术依赖性(5)按信息源的形式文献型信息源、档案型信息源 、统计型信息源、图像型信息源3、信息源的分布规律3.1文献信息的增长规律文献信息增长规律是用于解决文献增长同时间的关系的规律,以文献为计量单位研究科学知识的增长,是建立在两个假设之上:1)所有的知识都包含在已发表的文献中;2)每篇文献含有

45、等量的知识。(1)指数增长规律普赖斯曲线 a统计初始时刻的文献量、b文献的持续增长率、F(t)t时刻的文献量、e自然对数的底数,约等于2.718文献指数增长规律的局限性: 1) 科学文献并不总是按指数函数关系增长 2) 指数规律不能预测文献的未来增长趋势。文献指数增长规律存在局限性的原因:1)对科学文献增长的机理研究不够2)普赖斯没有也难以考虑文献日益老化的因素;3)在统计某年的科学期刊累积总数时,普赖斯没有排除已停刊的期刊。(2)逻辑增长规律逻辑曲线b老化率kt时科技文献的累计量,即科技文献累积量的最大值, F(t)为t年的文献累积量,逻辑曲线也其局限性它表明科学技术发展到一定阶段时,科技文

46、献的增长率趋于零科技文献总量将达到不可逾越的最大值k,这显然是与实际情况不相符的。3.2文献信息的老化律3.2.1老化的表现:有些文献的内容会被之后的证明是不可靠的或错误的,有些文献信息的内容尽管仍是正确的 ,被新的文献形式所替代,导致原有文献逐渐很少被人使用;文献信息尽管仍有用,但正处于一个人们对其兴趣下降的时期;文献信息不再有用。 文献老化文献没有用文献老化的具体表现形式文献所包含的信息失效、文献被替代、文献中的知识成为常识、文献的内容不再是研究热点 3.2.2文献老化的量度指标一般来讲,利用半衰期及普莱斯指数等具体指标来衡量文献的老化过程,能够比较客观地反映科技文献老化的规律。 文献的半

47、衰期:是指某学科领域内,现在尚在利用的全部文献中的一半是在多长一段时间内发表的。 半衰期越大,文献老化越慢。普赖斯指数普赖斯把发表时间超过5年仍被利用的科技文献定义为“档案性文献”,把发表时间在5年之内的“新”文献定义为“现时有用文献”,并将“新”文献的引用数量与文献的总引用量之比为指数,作为衡量科技文献老化的测度。 “普赖斯指数”的表达式为:普赖斯指数 = “新”文献引用量/文献总引用量普赖斯指数:某学科领域内,对发表时间不超过5年的文献的引用次数与总的引用次数之比。 普赖斯指数越大,文献老化的速度就越快。 剩余有益性某一年份的某一期刊被用户所利用的文献数被称为期刊有益性。剩余有益性是指若干

48、年后,期刊还保留的有益性,是期刊老化程度的一个量度。3.2.3影响文献信息老化的因素科学文献的增长静态老化:不考虑文献增长因素影响(可不抄)动态老化:考虑文献增长因素影响学科性质的差异基础理论学科的半衰期较长,文献老化较慢;而对应的应用技术学科半衰期相对较短,文献老化较快;经验与事实性学科的半衰期较长,文献老化较慢。学科的发展阶段不同在学科诞生和高速发展阶段,文献老化较快;在学科稳定成熟阶段,文献老化较慢。科学文献的出版类型不同科技期刊、科技报告、专利文献、学位论文等老化速度较快;而科技专著、科技档案等老化速度较慢。会议文献的老化速度因其内容变化形式不同而区别较大。用户需求与情报环境的影响对不

49、同素质和研究目的的用户而言,相同的文献的老化速度不同。相同的文献在不同的情报环境中的老化速度不同。文献信息老化的根本原因:科学技术的发展所带来的科学知识的更新。3.3文献信息的分散规律布拉德夫定律1934年,布拉德福发表了专门学科的情报源(Source of Information on Specific Subject)一文,首次公开提出了定量描述文献分散规律的经验定律;布拉德福定律的区域描述:若将科学期刊按其刊载某一学科文献数量的多少,以递减顺序排列,便可把期刊划分为直接服务于该学科的核心区域及其他几个区域,每个区域的期刊所载的文献总数相同。这时,核心区域与相继各区域的期刊数量呈 1 :a

50、 :a2 的关系。 n1: n2 :n3=1:a:a2(a 1) n1:(n1+n2):(n1+n2+n3)=1:b:b2 a和b是一比例常数,或称布拉德福常数。布氏经统计分析得出,a值大约为5.0。对于不同的学科专业而言,其a也不尽相同。布氏两种描述方法的对比图像描述和区域描述不一致;图像描述更加准确,与实际情况更加接近;区域描述来自于实际统计的具体数据,是一种近似的经验方法;两者都是对实际情况的近似描述,不可能达到绝对的准确。应用领域:1. 确定核心期刊2. 用于文献检索3. 考察专著的分布4. 动态馆藏的维护5. 检索工具完整性测定6. 学科幅度的比较7. 指导读者利用期刊8. 指导期刊

51、订购工作3.4著者分布规律洛特卡定律1926年,当时在纽约大都会人寿保险公司工作,在华盛顿科学院学报上,发表了题为科学生产率的频率分布一文,形成了经典的洛特卡定律。X轴表示作者发表论文数量的对数值;Y轴表示发表x篇论文的作者的百分比的对数值;3.5词频分布规律齐普夫定律齐普夫提出了“最省力法则”;人们利用语言表达思想时,会受到两个相反力的作用,单一化和多样化力。在这一法则的基础上,齐普夫提出了词频分布规律,即齐普夫定律。齐普夫经验法则: f.r=Cc是一个常数,但是会围绕一个中心数值上下波动。3.6 马太效应凡有的,还要加给他,让他多余;没有的,连他现在有的也要夺过来。美国社会学家罗伯特默顿引

52、用这句话,用以论述社会科学中的评价和奖励机制,并将其称为“马太效应”(Matthew Effect)。信息管理中的马太效应主要表现为信息分布的核心趋势和集中取向。优点:便于选取核心信息源,提高信息选择和筛选的效率,马太效应负面的影响:(1)马太效应描述信息对象的优势和劣势过度集中,容易使信息工作者按简单的优劣进行信息的选择、评价、传播和利用,而且使评价工作落入俗套,不利于评价工作的创新和激励创新人才的发展。(2)马太效应形成的信息分布有时只是表面的、外在的,背后还隐藏着许多不为人知的多种因素,会造成一些虚假的繁荣现象,使得学术界的评价和信息的选择太过于浮躁。(3)不利于年轻学者的发展,过于纵容

53、权威学者等。 3.7长尾理论2004年,美国人克里斯.安德森提出的“长尾理论”,打破了人们的传统思维方式。4.引文分析概述引文分析(citation analysis),就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用和被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。引文分析步骤:选取统计对象、统计引文数据、引文分析、作出结论同被引分析方法(co-citation analysis)又称为共引或者同引或者共被引分析方法。1981年,怀特(White)和格里夫斯(Griffith)提出了一种揭示科学知识结构的方法

54、,作者共被引方法(ACA)。包括三类: 文献共被引 作者共被引 期刊共被引文献耦合方法(bibliographic coupling,BC).1963M. M. Kessler首次提出“引文耦合”(Bibliographic Coupling,书目对)的概念引文耦合是指源文献通过被引文献建立起来的耦合关系耦合关系的程可用耦合强(或称耦合频率)的指标衡;耦合强取决于A和B共有的考文献的数量“引文耦合”理论基本的出发点是,凡共同引用一篇或多篇文献的两篇文献之间必有相互关系课件:第四章重点:相关概念。难点:信息分析、信息检索、信息预测的方法。微观信息管理的概念:微观信息管理就是根据用户信息需求对信息

55、进行搜集与组织、存储和检索、分析与预测,并提供信息服务的过程。4.1.1 信息搜集信息搜集是指根据特定目的和要求,运用一定的信息搜集方法,选择并寻找相关信息,将分散在不同时空域的有关信息搜集起来并加以提取整合的过程 。(1)信息搜集原则:针对性原则:根据用户需求,特定目的。系统性原则:全面、时间的连续性预见性原则:立足现实,但有一定的前瞻性经济性原则:考虑成本效益真实性原则:筛选和甄别信息及时性原则:信息的时效性(2)信息搜集的基本程序1)确定信息搜集目标2)制定信息搜集计划3)实施信息搜集工作4)整理数据与编写报告5)搜集结果评价6)后续信息管理工作(3)信息搜集途径内部途径信息部门:信息资

56、源集中地管理部门:各种文件存储中心营销部门:企业与外部交流的媒介研发部门:掌握企业核心资源内部信息网络Intranet:内部资源共享外部途径互联网Internet 、大众传播媒介、政府部门与行业协会、用户与消费者、个人交往与观察、各类会议、文献部门等。(4)信息搜集方法1)文献法:年鉴、报告、名录、手册等。2)观察法3)访谈法 调查表型访谈、固定问题组访谈、纲要型访谈4)问卷调查法 问卷设计、选取样本、实施调查 5) 网络调查法观察法 优点:客观性较好,准确性较高 缺点:观察不到内在因素,有时需做长时间的观察始能求得结果,受调查者主观因素的影响;同时也需要调查者有较高的观察水平及一定的实践经验

57、,才能取得良好的效果。 调查表的设计应注意以下问题: 调查问卷应该简明扼要,语言通俗易懂,便于回答填写。 提问要集中并具层次和针对性。 不要介入个人的观点。抽样方法主要包括非概率抽样(便利抽样、配额抽样、判断抽样、雪球抽样)和概率抽样(随机抽样、类型抽样)。提高问卷回收率的方法: 指明信息调查的意义; 使用鼓励信函; 有针对性地发放问卷; 赠品的搭配; 有吸引被调查者的内容,提高被调查者对问题的关注程度。网络信息调查的优缺点:优势:及时性和共享性便捷性和低费用无时空、地域限制 减少调查的故意回答误差可检验性和可控制性灵活性和界面友好劣势:样本偏差问题注意信息搜集的质量监控 4.1.2信息组织

58、信息组织是指根据信息的内容特征和外部特征,采用一定的原则和方法,对信息进行加工处理,使之有序可用的过程。 4.1.2 信息组织包括的主要内容(1)信息组织的内容信息揭示:也称为信息标引,是对信息的主要内容和其他形式特征进行选择、概括和提炼的过程。信息描述:也称为信息著录,是根据一定的管理规则和技术标准,对信息的外在特征和部分内容特征进行描述并给予记录的过程。信息加工信息序化信息存储(2)信息组织的原则客观性原则 系统性原则目的性原则标准化原则 信息组织的标准化主要体现在信息组织工作的统一性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的通用性方面。 (3)信息组织的基本程序 信息标

59、引分类标引是指对信息进行主题分析,用分类语言表达分析出的主题,赋予文献信息分类标识(分类号)的过程。 主题标引是指对信息进行主题分析,用主题语言表达分析出的主题,赋予分类检索标识(标题词、叙词等)的过程。信息描述国家标准书目著录ISBD(International Standard Bibliographic Description) 机读目录MARC(Machine-readable Catalogue) 书目记录的功能需求FRBR(Functional Requirements for Bibliographic Records)元数据(Metadata)元数据的出现是为了适应信息在网络时

60、代的组织,对于信息资源挖掘、组织电子资源、数字鉴别、信息开放与存取等方面发挥了巨大的功效。都伯林核心集(Dublin Core Element Set)是目前国际上最有影响力的元数据格式。信息分类编码。信息分类编码是把国民经济和其他社会活动中各种信息通过一种被计算机和人识别的符号体系表示出来的过程。信息分类编码是信息标准化的一项重要内容。 改编重组组织排序(4)信息组织的基本方法语法信息组织方法:字顺组织法、代码组织法、地序组织法、时序组织法 语义信息组织方法:分类组织法、主题组织法:主题组织法是从事物内涵的主题或涉及的问题与事物的属性出发,以语词作为概念标识,并通过概念标识的字顺排列和参照方法等间接地揭示概念之间相互关系的一种信息组织方法。 语用信息组织方法:重要性大小组织法、权重值组织法、概率组织法、特色组织法(5)网络信息资源的组织方法网络一次信息资源的组织方法:超文本方法、自由文本方法、主页方式 网络二次信息的组织方式:搜索引擎方法、主题树方法、图书馆编目方式、数字图书馆方式 (6)信息组织的基本成果二次信息 索引、目录、题录、文摘等三次信息 手册、百科全书、年鉴等4.2.1信息存储 信息存储是指将经过组织的信息按照一定的规定记录在相应的信息载体上,并将这些载体按照一定特征和内容性质组织成系统化的检索体系。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!