信息分析复习资料Word格式文档下载.docx
- 文档编号:16576511
- 上传时间:2022-11-24
- 格式:DOCX
- 页数:22
- 大小:134.48KB
信息分析复习资料Word格式文档下载.docx
《信息分析复习资料Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《信息分析复习资料Word格式文档下载.docx(22页珍藏版)》请在冰豆网上搜索。
(3)基于数据挖掘和知识发现的信息分析方法
(4)其他方法
4.试论信息分析的产生和发展趋势:
信息分析的产生:
信息分析是信息工作的重要组成部分,它的产生首先体现于科技领域,是科技、经济和信息工作发展到一定阶段的产物。
1)信息生产与利用矛盾日益突出
2)科技领域尤其如此
3)
信息分析的发展概况:
(16页)
(1)国内概况
●1956~1966年的产生和初步发展时期
●1966~1976年的停滞时期
●1976~1992年的恢复和重新发展时期
●1992年以后的发展新时期
纵观我国信息分的发展历程,可以发现,信息分析工作本身经理下列几个方面的根本性变化:
第一,在服务目的上,从作为科学研究的前期工作转向直接参与科学决策、研究与开发、市场开拓活动,成为现代科学决策、研究与开发、市场开拓活动的首要环节。
第二,在服务的内容范围上,从单纯的科技领域的信息服务转向科技、经济、社会等广泛领域的信息服务,从简单的“发生了什么事”的情况研究发展到“应该怎么办”的综合性的对策研究和面向宏观决策的战略研究,从以传播国外科技信息为主转向国内与国外信息分析相结合,特别是注重国内外信息的分析和比较研究。
第三,在服务方式上,从全盘无偿服务转向以无偿服务为基础、以有偿服务为主流的服务模式。
第四,在研究方法上,从单纯的定性研究转向定性与定量方法相结合,从传统的单层次、单目标的单因素研究转向多层次、多目标的多因素及其间相互关系的综合研究。
(2)国外概况
●美国——政治斗争的工具(信息分析中心;
思想库;
咨询机构;
联邦信息机构;
企业信息机构)
●日本——企业竞争优势的源泉(为决策服务的官方思想库、民间思想库以及进行技术、行业信息分析的情报调查机构和企业情报调查机构)
●其他国家的信息分析——各有千秋
信息分析发展趋势:
(1)信息分析面临的机遇和挑战
•陈旧的信息分析体制已不能满足知识经济时代的社会发展和用户需求
•面对社会信息量的激增,必须通过提高搜集、分析、处理、加工和存储信息的能力,增加信息“吞吐量”
•面对新旧信息更迭加快,必须提高信息分析工作的节奏,缩短从搜集信息到产生和发布信息分析产品的周期
•必须逐步提高定量分析的比重
•需要进一步改善信息分析队伍的知识结构
(2)信息分析的发展前景
•信息分析国际化
•信息分析领域扩展化
•信息分析市场化
•信息分析机构多样化
•信息分析手段现代化、网络化
•信息分析管理正规化
•信息分析队伍专业化
•信息分析经费体系化
第二章信息分析的流程和内容
1.试论信息分析的流程:
信息分析的流程:
规划与定向→信息搜集、整理与鉴别→信息分析和提炼→信息分析铲平的形成→信息传递、利用和反馈→(循环)
2.试论选题的原则和程序:
原则:
①可能性:
同样一个课题对某一机构适用,但对另一机构不适用,这就涉及一个可能性问题
②必要性:
信息分析的选题是必要的,而不是重复的,可有可无的
③效益性:
信息分析活动本身有人力、物力、时间投入,因而信息分析选题不能不讲效益
④政策性:
信息分析是为国民经济和社会发展各领域的科学决策,必须以各项政策为依据。
选题的程序:
3.信息分析中的课题计划包括哪些内容
•调查方式
•调查范围
•调查步骤
•调查广度与深度
课题计划的内容:
●课题目的
●
调查大纲
●研究方法与技术路线
●产品形式及其提交方式
●组织分工
●完成时间和实施步骤
●其他,如人员、经费、技术、设备条件
4.简述信息源的类型、特点以及信息搜集的原则
信息源类型:
42页
1)文献信息源:
载体(印刷型、微缩型、机读型、声像型);
获取途径难易程度(白色、黑色、灰色)
2)非文献信息源:
口头信息源:
优点:
内容新颖、传递迅速;
含有文献信息源所没有的信息
缺点:
信息容易失真;
信息搜集困难;
信息保管困难;
信息传播范围小
实物信息源:
信息成熟、可靠;
信息内容丰富
信息挖掘困难;
信息搜集、保管、传播困难;
容易引起知识产权纠纷
信息搜集原则:
全面性、系统性、针对性、新颖性、可靠性、科学性、计划性。
5.文献调查包括哪些途径?
(1)系统检索法(以描述文献内容特征或外部特征的检索标识为检索突破口,以检索工具的李永伟检索手段具有较强的系统性和较高的检索效率,是文献调查的主要方法。
)
①需求分析;
检索策略构造;
③文献信息或文献线索的查找。
(2)追溯检索法;
(3)浏览检索法。
6.什么是社会调查?
请列举常见的社会调查方法。
社会调查:
社会调查又称为实际情况调查,是一切以信息搜集为目的的社会实践活动的总称。
他既包括对人的访问,也包括对实物、现场的实地考察。
是提高信息分析活动效果的一项有力措施,是搜集非文献信息的主要途径。
(常见方法:
现场、访问、样品、问卷调查)
7.在问卷调查表的设计时应当注意哪些问题?
网络调查有哪些优点和缺点?
调查问卷设计注意事项:
•用语准确、含义清楚,避免模糊或双关词汇。
•考虑提问的必要性。
•考虑提问的可能性。
•把握所提问题的数量和难易程度。
•避免引导性或一般化的提问。
•避免双重提问。
•尽量避免假设性提问。
•避免学术专用名词和冷僻的专用术语。
•使用说明词。
•其他。
网络调查优点:
更高的应答率
更准确的应答
更多的乐趣
更多的美感
更少的花费
更快的回收速度
瞬间的全球到达、定制问卷调查、找出非常具体的调查目标
网络调查缺点:
被调查者必须是网民(网民总数很少)
网民在年龄、性别、婚姻状况、文化程度、行业、职业、地域分布等方面存在明显的不均匀性
自荐偏差(很难对样本进行验证)
网民不是大众百姓的代表
多文化因素(全球性特点所决定)
担心泄露个人信息
短暂的注意力集中时间(25至30个问题后失去兴趣)
缺少人与人交流的明察秋毫
应答者的真实性和重复作答
应答率会越来越低(新鲜感消失)
8.信息整理分为哪两个层次?
在信息整理过程中,一般从哪些方面鉴别信息的价值?
信息整理的主要任务是对所搜集的信息进行初步加工,目的是使信息从无序变为有序,成为便于利用的形式。
分为:
形式整理和内容整理
形式整理基本上不涉及信息的具体内容,而是凭借某一处在依据或特征对原生信息进行分门别类处理。
形式整理方式因人而异,但从实践上看,①按承载信息的载体分类整理;
②按信息使用方向整理;
③按内容线索或部分要点进行整理是三种最基本的整理方式。
内容整理是在形式整理基础上的进一步深化,是从内容分角度对信息的再处理,通常包括①信息内容的理解;
②信息内容的揭示;
③信息内容的细分归类三阶段。
应从下列方面鉴别信息的价值?
可靠性鉴别:
(真实性、完整性、科学性、典型性)
①文献信息可靠性鉴别(看作者、看出版机构、看文献类型、看来源、看被引用率;
看引文、看程度、看密级、看内容、看实践)
②实物信息可靠性鉴别(看实物研制者、看生产机构、看商标、看关键技术内容、看实践效果)
③口头信息可靠性鉴别。
(看发言者、看场合、看内容、看其他听众的反应)
新颖性鉴别:
①文献信息新颖性鉴别(文献外部特征、文献计量学特征、文献内容特征、信息发生源、实践效果)
②实物信息新颖性鉴别(看生产日期、看生产机构、看生产手段、看信息内容、看实践效果)
③口头信息新颖性鉴别(看发言者、看发言时间、看发言场合、看发言内容)
适用性鉴别:
①看信息发生源和信息吸收者吸收条件的相似性②看实践效果;
③看战略需要
9.试述信息分析和提炼的本质:
信息分析和提炼的本质:
对原生信息进行精加工;
具有综合性研究的特点;
是一项综合性很强的思维活动
信息分析和提炼的内容:
(1)从研究对象看:
信息分析和提炼包含了科技、经济、军事、政治、文化、市场等社会广泛领域的一切竞争性和非竞争性的信息分析和提炼,由于信息分析和提炼的核心内容可为科学决策、研究、开发、市场开拓活动提供的一句,其涉及范围比一般的科学研究要广泛得多。
(2)从研究目标和任务看:
①中间目标和任务,即解释研究对象本身所固有的、文职的规律。
②是最终目标和任务,即利用所揭示的本质的规律为用户服务。
10.信息分析产品包括哪些类型?
各有何特点?
信息分析产品的类型:
(1)消息类产品:
负责跟踪监视和及时报道特定领域的国内外发展的最新水平、动态和趋势。
(特点:
内容简洁、新颖;
报道迅速、及时;
推荐性质)
(2)数据类产品:
以有关课题的各种系统的资料或数据为主要对象,经过加工整理和分析研究所形成的一种信息分析产品。
密度高、系统性强、完整性和准确性好)
(3)研究报告类产品:
以数据统计和分析、归纳提炼、论证推测为宗旨(特点:
结构严谨、分析深刻、结论明确。
)常见类型有:
①综述性研究报告:
在一定的时空范围内对某一课题的大量相关信息进行综合分析和浓缩加工后所形成的一种产品。
特点包括:
叙述性、综合性、浓缩型,具体性。
②述评性研究报告
③预测性研究报告
④评估性研究报告
⑤背景性研究报告
第三章定性分析方法
1.比较在信息分析中有哪些作用?
比较就是对照各个事物,以确定期间差异点和共同点的逻辑方法。
事物的差异性和同一性是进行比较的客观基础。
比较在信息分析中的作用主要体现在:
第一:
揭示事物的水平和差距。
通过比较,可以发现事物间本质上的异同,揭示国家、地区、行业、部门等当前的水平和差距,以便于扬长避短、相互借鉴或明确赶超目标。
第二:
认识事物发展的过程和规律。
通过对事物不同时期发展状况的水平的比较,可以事物的过去和现在,了解其发展轨迹,揭示其发展规律,判明其发展方向,以便于总结经验、吸取教训。
第三:
判定事物优劣、真伪。
通过比较不同的方案,可以明确优劣、真伪、从而为识别、判断和选择提供依据。
2.在信息分析中,因果分析主要有哪几种形式?
因果关系是客观事物各种现象之间的一种普遍的联系形式。
从客观事物的这种因果关系出发,有原因导出结果,或者有结果探究出原因的分析方法,就是因果分析。
主要有求同法、求异法、共变法和剩余法四种形式。
求同法:
如果在不同的场合观察到相同的现象,这些不同的场合各有若干原因,但其中只有一个原因相同,则可初步确定这个共同的原因就是产生该现象的共同原因。
求异法:
如果所观察的现象在第一种场合出现,在第二种场合不出现,而这两种场合只有一个原因不同,则可初步确定这个不同的原因就是引发该现象的原因。
共变法:
如果在所观察的现象发生变化的各种场合里,其他原因都没有变化,只有一个原因发生了变化,则可初步确定该发生变化了原因是使所观察的现象发生变化的原因。
剩余法:
如果已知某一现象是所观察的现象的原因,并且又知先行现象的某一部分是后续现象的某一部分的原因,则可初步确定先行现象中的其余部分是后续现象中的其余部分的原因。
3.试诉假言推理在信息分析中的应用:
假言推理:
从一个假言判断的结论出发,顺次推出其后件或逆向推出其前件,进而通过肯定它的后件或前件,来论证、检验原先假言判断结论的正确性的一种推理方法。
4.分析头脑分暴法的组织原则、优点和缺点。
头脑风暴法是借助专家的创造性思维来探索事物发展变化的未知的未来状态的一种直观预测方法。
一般用于对战略性问题的探索。
组织原则:
Ø
会议的组织领导工作——一般由熟悉研究对象和头脑风暴法的信息分析与预测人员来承担。
专家的选择——所选专家人数一般以5—15人为宜。
会议讨论的时间——会议讨论的时间一般以20—60分钟为宜。
会议的氛围——创造良好的、使专家能够真正自由发挥的环境。
①通过信息交流,有利于捕捉瞬间的思路、激发创造性思维,产生富有创见性的思想“火花”。
②通过头脑风暴会议,获取的信息量大,考虑的因素多,所提供的计划、方案等也比较全面和广泛。
①具备专家会议调查法的一些缺陷,如专家缺乏代表性,易受“权威”、会议“气氛”和“潮流”等因素的影响、易受表达能力的限制等。
②由于是即兴发言,因而普遍存在着逻辑不严密、意见不全面、论证不充分等问题
第四章半定量分析方法
1.试述德菲尔法的特点及预测征询的过程。
(1)匿名性;
(2)反馈性;
(3)统计性
预测征询的过程:
106页
(1)成立预测领导小组——对预测工作进行组织和指导
(2)明确预测目标——选择和规划预测课题,明确预测项目
(3)选择参加预测的专家
●专家的代表面应广泛
●专家的权威程度要高
●专家应有足够的时间和耐心填写调查表
●专家的范围应有所限制
●专家的人数一般控制在15--50人
●应事先约请专家不要向外透露参与征询调查这件事,以免相互商量,答案雷同
(4)编制调查表(调查表类型有:
目标——手段调查表、由专家简要回答的调查表、由专家详细回答的调查表)
(5)进行反馈调查和专家意见的汇总、统计分析与预测
●第一轮调查(调查表不带任何框框,只提出要预测的问题)
●第二轮调查(请专家对第一轮各种事件发生的时间、空间、规模大小等作具体预测,说明理由)
●第三轮调查(将第二轮统计结果及修订后调查表再发给专家,请专家再次做出具体预测,充分陈述理由)
●第四轮调查(将第三轮统计结果及修订后调查表再发给专家,请专家再次做出具体预测,并在必要时作出详细、充分的论证)
(6)编写和提交预测报告
2.试述派生的德菲尔法的类型及特点
两种类型:
①保持德菲尔法基本特点的派生德菲尔法:
列出预测事件一览表
向专家提供背景材料
减少应答轮数
对预测结果进行自我评价
给出事件的多个可能实现时间的日期
②部分地改变德菲尔法基本特点的派生德菲尔法:
部分取消匿名性
部分取消反馈
3.试述交叉影响分析法的原理
所谓交叉影响分析法,就是根据若干个事件之间的相互影响关系,分析当某一事件发生时,其他事件因受到影响而发生何种形式变化的一种方法。
由于事情之间的相互影响关系通常用矩阵的形式来表达,而各个事件的变化程度又是用概率值来描述的,所以这种方法又称为交叉影响矩阵法或交叉影响率法。
4.试述层次分析法的基本原理
层次分析法根据人类的辩证思维过程,先将一个复杂的研究对象划分为递阶层次机构,同一层的各元素具有大致相等的地位,不同层次元素之间具有某种联系;
再对单层次的元素构造判断矩阵,以得出层次单排序,并进行一致性检验;
最后,为了计算层次总排序,采用逐层叠加的方法,从最高层次开始,由高向低逐层进行计算,推算出所有层次对最高层次的层次总排序值。
对每一层递推,都必须作出相应的层次总排序的一致性检验。
5.利用层次分析法时为什么要进行一致性检验
由于客观事物的复杂性和人们认识能力的局限性,人们在对客观事物进行判断时,难免会出现一些或大或小的差错,若差错很小并且在允许的范围之内,则可以考虑接受所得到的结论;
但是,如果差错太大,超出了允许的范围,则所得到的结论不能被接受,专家的判断是无效的。
为了保证利用层次分析法得到的结论基本合理,必须对人们对客观事物的定性分析判断进行严格的“是否一致”的定量检验。
6.试述内容分析法特征、流程及在信息分析领域的应用
内容分析法(ContentAnalysis)是对文献内容进行系统分析的一种专门方法,其目的一般是弄清或测度文献中本质性的事实或趋势。
特征:
1)统计性:
对大量样本进行特征识别的系统方法,具有统计性。
2)系统性:
内容分析法是一种对大量样本进行特征识别的系统方法。
3)客观性:
内容分析法强调用事实和数据说话。
局限:
1)文献需具备两个条件:
形式化原则,即能从文献中抽出便于可靠统计的、具有语义特征的分析单元;
统计原则,即要有一定数量的文献。
2)方法的背景是归纳法。
即不可能超越和脱离所分析的文献。
不是一种发挥想象的开放式方法。
3)方法实施的工作量大,投入时间较长。
特别是长期跟踪或大范围扫描的内容分析工作,对人力和时间的要求更加突出,需要计算机辅助分析。
流程(135页):
确定目标→选择样本→定义分析单元→定制分析框架→频数统计→结论汇总。
(记忆粗体字即可,解释部分,了解后,自行解释)
确定目标——必须首先明确。
选择样本——力求样本信息量大,有连续性,便于统计分析并尽可能是分析人员所熟悉的。
分析单元——是内容的“指示器”。
一般先依据目的确定分析范畴,即确定符合目的要求的最一般的关键性概念。
确定范畴时应避免两个极端:
过大的范畴可能使分析结果表面化和简单化;
过细的范畴造成几乎重复原文。
范畴选择之后,再明确相对应的分析单元。
分析单元是不再细分析测度单位。
对文字对象,词是最小的分析单元。
此外,意义独立的词组、简单句、段和意群甚至独立的篇也可视作分析单元。
在复杂的内容分析中,可同时采用几种分析单元。
制定分析框架——体现分析思路和保证系统性的核心步骤。
要求分析人员对问题本身和分析对象二者都有深透的认识。
其基本出发点是使分析单元的测度结果能反映和说明实质性的问题。
例如,用图书馆中通用的主题词表作词频分析有时意义不大,原因在于通用的主题词表并不是为分析专门问题而设计的。
频数统计——一种规范性的操作,包括计数和数据处理,需要通过大数量的统计反映统计意义上的相关性。
在内容分析中,最常用的是词频统计。
结论汇总——在综合统计结果和定性分析的基础上,得出某些结论性的看法,同时指出所作的内容分析的适用范围或边界。
应用:
(1)20世纪初,人们提出在一般性阅读文献获得理解之外,采用半定量的统计方法对文献的内容进行深入分析和解释。
(2)二战中,美国传播学家拉斯韦尔等在进行战时军事情报研究中,组织了一项名为“战时通讯研究”的工作,以德国公开出版的报纸为分析对象,分析获取法西斯政权重要军政机密情报,取得了出乎意料的成功,使内容分析法显示出实际效果。
(3)20世纪70年代,有学者选择前苏联的莫斯科、列宁格勒和14个加盟共和国的16位地方党的领导人为分析对象,通过从这些政界人物在公开演说或著作中对领袖的称呼和提法中抽取指示词,借助词频统计和分析来推测地方领导人对勃列日涅夫的支持程度。
(4)2005年,美国中央情报局成立了“公开信息中心”,每天在全球各个网站、论坛里搜集各种各样的军事信息。
通过分析,美国不仅能发现别的国家最新的军事动向,而且连该国某些机密的武器发展计划,也可能由于网友的无意识透露而被美国情报机构掌握
(5)在我国,内容分析法也在图书情报、中医药、旅游、食品安全、危机事件、教育、网络隐私、收入分配等各种研究中不断得到尝试和应用。
例如,有人以“三鹿奶粉事件”为个案
第五章定量分析方法
1.试述回归分析的基本思想
变量之间本身具有某种关系(如线性关系),但因各种误差使之不具备该关系,通过回归,使之恢复该关系。
变量之间本身不具有某种关系,通过回归,抓主要矛盾,使之近似具有某种关系。
2.试述聚类分析的基本思想
聚类分析的基本思想是在样品之间定义距离,在变量之间定义相似系数。
距离或相似系数代表样品或变量之间的相似程度。
例如,在分层聚类中,按相似程度的大小,将样品或变量逐一归类,关系密切的样品或变量聚集到一个小的分类单位,然后逐步扩大,使得关系疏远的样品或变量聚集到一个大的分类单位,直到所有的样品或变量都聚集完毕,形成一个表示亲疏关系的谱系图,再对谱系图进行分析,并按照要求对样品或变量进行分类。
3.试述主成分分析的基本思想
在降维思想指导下产生的一种有效处理高维数据的方法。
在实际问题研究中,往往会涉及众多相关的变量。
虽然所涉及的每个变量都提供了一定的信息,但其重要性不同,且在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。
信息的重叠越大,变量间的相关性也越大。
如何对这些变量加以“改造”,用为数较少的、互不相关的、不可直接测量的新变量来反映原变量所提供的绝大部分信息,并通过对新变量的分析达到解决问题的目的,是基于主成分的因子分析法核心思想。
4.什么是移动平均法?
指数平滑法与移动平均法有何区别和联系
5.试述时间序列分解法的基本思想
是将时间序列上的构成波动的不同因素分离开来,对各因素分别进行分析。
这种方法有助于说明各种社会经济活动中的数量指标发生变动的分量原因,既有利于准确预测,又有利于有的放矢的进行控制和管理。
6.系统动力学建模包括哪些步骤
(1)明确问题。
(2)找出造成问题症状的因素。
(3)找出决策与行为间的因果信息反馈环路。
(4)定出可采纳的正式政策。
(5)建立数学模型。
(6)以计算机模拟产生随系统时间变化的模型行为。
(7)将模拟的结果与真实系统进行比较。
(8)修正模型设计,以符合真实情况。
(9)针对系统问题症状的改善,重新设计模型内各元素间的组成关系与政策。
(10)参考模型政策模拟的结果,应用于真实系统以期改变系统现状及改善和解决问题。
7.试述布拉德福定律、洛特卡定律和齐普夫定律的主要内容
布拉德福:
如果将科技期刊按其刊载某专业论文的数量的多少以递减顺序排列起来,则可以在这些期刊中区分出载文率最高的核心区和包含着与核心区同等数量论文的后继几区。
此时,核心区和后继各区中所含的期刊数成
...…的关系(n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 分析 复习资料