计算机书籍读书笔记Word文件下载.docx
- 文档编号:20945047
- 上传时间:2023-01-26
- 格式:DOCX
- 页数:9
- 大小:24.45KB
计算机书籍读书笔记Word文件下载.docx
《计算机书籍读书笔记Word文件下载.docx》由会员分享,可在线阅读,更多相关《计算机书籍读书笔记Word文件下载.docx(9页珍藏版)》请在冰豆网上搜索。
数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。
数据仓库是一个环境,而不是一件产品,提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。
数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问,的各种技术和模块的总称。
所做的一切都是为了让用户更快更方便查询所需要的信息,提供决策支持。
一、数据仓库拥有的四个特点
1、面向主题。
操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。
主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、集成的。
面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。
而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
3、相对稳定的。
操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
4、反映历史变化。
操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
二、数据仓库的组成
数据仓库数据库
是整个数据仓库环境的核心,是数据存放的地方和提供对数据检索的支持。
相对于操纵型数据库来说其突出的特点是对海量数据的支持和快速的检索技术。
数据抽取工具
把数据从各种各样的存储方式中拿出来,进行必要的转化、整理,再存放到数据仓库内。
对各种不同数据存储方式的访问能力是数据抽取工具的关键,应能生成COBOL程序、MVS作业控制语言(JCL)、UNIX脚本、和SQL语句等,以访问不同的数据。
数据转换都包括,删除对决策应用没有意义的数据段;
转换到统一的数据名称和定义;
计算统计和衍生数据;
给缺值数据赋给缺省值;
把不同的数据定义方式统一。
元数据
元数据是描述数据仓库内数据的结构和建立方法的数据。
可将其按用途的不同分为两类,技术元数据和商业元数据。
技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库是用的数据。
包括:
数据源信息;
数据转换的描述;
数据仓库内对象和数据结构的定义;
数据清理和数据更新时用的规则;
源数据到目的数据的映射;
用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。
商业元数据从商业业务的角度描述了数据仓库中的数据。
业务主题的描述,包含的数据、查询、报表;
元数据为访问数据仓库提供了一个信息目录(informationdirectory),这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的、和怎么访问这些数据。
是数据仓库运行和维护的中心,数据仓库服务器利用他来存贮和更新数据,用户通过他来了解和访问数据。
访问工具
为用户访问数据仓库提供手段。
有数据查询和报表工具;
应用开发工具;
管理信息系统(EIS)工具;
在线分析(OLAP)工具;
数据挖掘工具。
数据集市(DataMarts)
为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subjectarea)。
在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。
需要注意的就是再实施不同的数据集市时,同一含义的字段定义一定要相容,这样再以后实施数据仓库时才不会造成大麻烦。
数据仓库管理:
安全和特权管理;
跟踪数据的更新;
数据质量检查;
管理和更新元数据;
审计和报告数据仓库的使用和状态;
删除数据;
复制、分割和分发数据;
备份和恢复;
存储管理。
信息发布系统:
把数据仓库中的数据或其他相关的数据发送给不同的地点或用户。
基于Web的信息发布系统是对付多用户访问的最有效方法。
三、设计数据仓库的九个步骤
1)选择合适的主题(所要解决问题的领域)
2)明确定义fact表
3)确定和确认维
4)choosingthefacts
5)计算并存储fact表中的衍生数据段
6)roundingoutthedimensiontables
7)choosingthedurationofthedatabase
8)theneedtotrackslowlychangingdimensions
9)确定查询优先级和查询模式。
技术上
硬件平台:
数据仓库的硬盘容量通常要是操作数据库硬盘容量的2-3倍。
通常大型机具有更可靠的性能和和稳定性,也容易与历史遗留的系统结合在一起;
而PC服务器或UNIX服务器更加灵活,容易操作和提供动态生成查询请求进行查询的能力。
选择硬件平台时要考虑的问题:
是否提供并行的I/O吞吐?
对多CPU的支持能力如何?
数据仓库DBMS:
他的存储大数据量的能力、查询的性能、和对并行处理的支持如何。
网络结构:
数据仓库的实施在那部分网络段上会产生大量的数据通信,需不需要对网络结构进行改进。
四、建立数据仓库的步骤
1)收集和分析业务需求
2)建立数据模型和数据仓库的物理设计
3)定义数据源
4)选择数据仓库技术和平台
5)从操作型数据库中抽取、净化、和转换数据到数据仓库
6)选择访问和报表工具
7)选择数据库连接软件
8)选择数据分析和数据展示软件
9)更新数据仓库
数据抽取、清理、转换、和移植
1)数据转换工具要能从各种不同的数据源中读取数据。
2)支持平面文件、索引文件、和legacyDBMS。
3)能以不同类型数据源为输入整合数据。
4)具有规范的数据访问接口
5)最好具有从数据字典中读取数据的能力
6)工具生成的代码必须是在开发环境中可维护的
7)能只抽取满足指定条件的数据,和源数据的指定部分
8)能在抽取中进行数据类型转换和字符集转换
9)能在抽取的过程中计算生成衍生字段
10)能让数据仓库管理系统自动调用以定期进行数据抽取工作,或能将结果生成平面文件
11)必须对软件供应商的生命力和产品支持能力进行仔细评估
主要数据抽取工具供应商:
Prismsolutions.Carleton'
sPASSPORT.InformationBuildersInc.'
s
EDA/SQL.SASInstituteInc.
五、数据仓库带来了什么
每一家公司都有自己的数据。
并且,许多公司在计算机系统中储存有大量的数据,记录着企业购买、销售、生产过程中的大量信息和客户的信息。
通常这些数据都储存在许多不同的地方。
使用数据仓库之后,企业将所有收集来的信息存放在一个唯一的地方——数据仓库。
仓库中的数据按照一定的方式组织,从而使得信息容易存取并且有使用价值。
目前,已经开发出一些专门的软件工具,使数据仓库的过程实现可以半自动化,帮助企业将数据倒入数据仓库,并使用那些已经存入仓库的数据。
数据仓库给组织带来了巨大的变化。
数据仓库的建立给企业带来了一些新的工作流程,其他的流程也因此而改变。
数据仓库为企业带来了一些“以数据为基础的知识”,它们主要应用于对市场战略的评价,和为企业发现新的市场商机,同时,也用来控制库存、检查生产方法和定义客户群。
数据仓库将企业的数据按照特定的方式组织,从而产生新的商业知识,并为企业的运作带来新的视角。
六、为何要建立数据仓库
计算机发展的早期,人们已经提出了建立数据仓库的构想。
“数据仓库”一词最早是在1900年,由BillInmon先生提出的,其描述如下:
数据仓库是为支持企业决策而特别设计和建立的数据集合。
企业建立数据仓库是为了填补现有数据存储形式已经不能满足信息分析的需要。
数据仓库理论中的一个核心理念就是:
事务型数据和决策支持型数据的处理性能不同。
企业在它们的事务操作收集数据。
在企业运作过程中:
随着定货、销售记录的进行,这些事务型数据也连续的产生。
为了引入数据,我们必须优化事务型数据库。
处理决策支持型数据时,一些问题经常会被提出:
哪类客户会购买哪类产品?
促销后销售额会变化多少?
价格变化后或者商店地址变化后销售额又会变化多少呢?
在某一段时间内,相对其他产品来说哪类产品特别容易卖呢?
哪些客户增加了他们的购买额?
哪些客户又削减了他们的购买额呢?
事务型数据库可以为这些问题作出解答,但是它所给出的答案往往并不能让人十分满意。
在运用有限的计算机资源时常常存在着竞争。
在增加新信息的时候我们需要事务型数据库是空闲的。
而在解答一系列具体的有关信息分析的问题的时候,系统处理新数据的有效性又会被大大降低。
另一个问题就在于事务型数据总是在动态的变化之中的。
决策支持型处理需要相对稳定的数据,从而问题都能得到一致连续的解答。
数据仓库的解决方法包括:
将决策支持型数据处理从事务型数据处理中分离出来。
数据按照一定的周期(通常在每晚或者每周末),从事务型数据库中导入决策支持型数据库——既“数据仓库”。
数据仓库是按回答企业某方面的问题来分“主题”组织数据的,这是最有效的数据组织方式。
七、数据仓库和数据集市
有关决策支持型数据库的数据集市是面向企业中的某个部门或是项目小组的。
一些专家顾问将数据集市的建造描述为建立数据仓库全过程中的一步。
首先,一个储存企业全部信息的数据仓库被创建,其中,数据均具备有组织的、一致的、不变的格式。
数据集市随后被创立,其目的是为不同部门提供他们所需要的那部分信息。
数据仓库聚集了所有详细的信息,而数据集市中的数据则是针对用户们的特定需求总结而出的。
而另外一些专家则认为数据集市的建立并不需要首先建立一个数据仓库。
在这个模型中,数据直接由事务型数据库转入数据集市中。
一个公司可能建立有多个数据集市,而彼此之间毫无联系。
这种不在建立数据仓库的基础上创建数据集市的方式会更便宜、更快速,因为它的规模更加易于管理。
第二种观点的缺陷在于无法实现最初创建数据仓库的最主要的目的——将企业所有的数据统一为一致的格式。
现有的事务处理系统的数据往往是不一致、冗余的。
如果首先建立起一个全公司范围的数据仓库,组织就能够获得一个统一关于企业的活动和客户的知识库。
如果先建立起一个个独立的数据集市,那么数据仓库的诸多优势都能够得以实现,但是企业远远无法做到对数据的一致的储存。
第二篇CSS精粹之布局技巧
1.若有疑问立即检测。
在出错时若能对原始代码做简单检测可以省去很多头痛问题。
W3C对于XHTML与CSS都有检测工具可用,请见http:
//validator.w3.org请注意,在文件开头的错误,可能因为不当的结构等因素造成更多错误;
我们建议先修正一些最明显的错误之后重新检测,这样也许会让错误数量爆减。
2.使用浮动功能时记得适当清除指令。
浮动是个危险的功能,未必会产生您所期望的结果。
如果您遇到浮动元素延伸到外围器的边框或者其他不正常情况,请先确定您的做法是正确的。
3.边界重合时利用padding或border来避免。
您可能会为了一点不应该出现的空间而焦头烂额,或者您需要一点点空间时,怎样都挤不出来。
如果您有用到margin,那么很容易产生边界的重合;
AndyBudd在他的网站上解释了可能的做法。
4.尝试避免同时对元素指定padding/border以及高度或宽度。
Windows版IE经常导致width与height的计算问题。
有些方法可以解决此问题,但如果母元素需要指定高度与宽度时,最好能够在母元素之内的子元素套用margin,或者当子元素需要指定高度与宽度时,在母元素套用padding以达效果。
5.不要依赖min-width/min-height。
Windows版IE并不支援两种语法。
但是在某种程度下,windows版IE可以达到相当于min-width/min-height的效果,所以只要对IE做点过滤功能,即可达到您想要结果。
第二篇何为一个“丰满”的设计
1.“丰满”的含义并不代表将一个版面撑满。
每个设计都必须含有一个点子,点子以“产品特性”、“目标消费群”及“卖点”所支撑。
整个设计围绕其而发展,统一与一个中心,环环相扣,由浅入深或由深化浅,循序渐进,有规律,有节奏,有重点,才不失为一个“丰满”的设计。
2.做一个“不浪费”的设计
大多数设计由图片及文案两部分组成。
设计之前必须充分理解文案,读懂读通,再开始下一步工作。
因为你所需要达到的最理想结果(就设计本身而言)就是将图片和文案完美结合。
只有这样才能不使广告目的偏移,不使文案内容变质,发挥寸“字”寸金的广告文案的原汁原味。
广告不允许你有任何浪费(贵)。
第三篇页面空白空间的魅力
设计的意思就是策划,设计的过程就是从混乱和随意中找到条理,条理有利于读者,他们可以很轻松地理解一个条理清楚的信息。
斯蒂温-阿-克里蒙特的《建筑历史》杂志评论中写到:
“不要把时尚和风格混淆起来。
风格是在社会和顾客的实际需要中形成的。
时尚则是个些急于表现优雅或老练的人所表现出的一种肤浅的状态”。
这些必须通过和谐的排印、有效地利用图画和空白空间,有节制的利用(字行)来完成......多次重复,在视觉上形成必然联系可以引导视线和帮助读者快速浏览。
设计中,留出大量空白空间作为空白表现领域,使标题“突出”,大的图画得到视觉上的延伸。
页面空白空间的最佳使用能够帮助信息易于浏览,而不仅仅只是使页面看上去漂亮,那是自然而然的结果。
关键在于提高页面的可理解性。
第四章导航设计与信息架构
大部分时候我们讲导航,讲的是导航对内容和结构的一种表现。
就是说我们在讨论导航的时候,更多的去关注怎么与之交互,以及视觉上是怎么好看。
但是导航,不仅仅局限于交互方式和视觉形式。
不要为了导航而导航,前面一个导航是指表现形式,后面一个导航是指实际的导航系统。
对于导航的设计,信息架构比交互方式、视觉形式更加的重要。
导航不仅仅是内容的一种分类,也包括类似交互操作的分类。
导航的目的是为了让使用者高效的完成任务、达成目标。
情景式导航有可能是导航设计的一种发展趋势。
第五篇CSS六大密技
1.css字体简写规则
2.同时使用两个class
通常我们只为属性指定一个class,但这并不等于你只能指定一个,实际上,你想指定多少就可以指定多少
3.css中边框(border)的默认值
当编写一条边框的规则时,你通常会指定颜色、宽度以及样式(任何顺序均可)。
4.!
important会被IE忽略
在css中,通常最后指定的规则会获得优先权。
然而对除了IE以外的浏览器来说,任何后面标有!
important的语句将获得绝对的优先权
5.图片替换的技巧
使用标准的html而不是图片来显示文字通常更为明智,除了加快下载还可以获得更好的可用性。
但是如果你决心使用访问者的机器中可能没有的字体时,你只能选择图片。
6.css盒模型hack的另一选择
css盒模型hack被用来解决IE6之前的浏览器显示问题,IE6.0之前的版本会把某元素的边框值和填充值包含在宽度之内(而不是加在宽度值上)。
第六篇根据时段自动切换你的站点CSS风格
同样是切换风格。
不过他做了点小小的调整。
站点会根据当时的时间自动调整站点风格。
作者为站点制作了早上、下午、夜晚三套皮肤,主要是分别制作了背景。
12点以前系统会使用早上的皮肤,过了12点,站点会自动替换成下午的风格,5点后则替换成夜晚的风格。
主要的功能实现是靠在头部的这段判断代码:
CSS版代码如下:
linkrel="
stylesheet"
type="
text/css"
href="
?
php$hour=date("
H"
if($hour<
12)echo"
morning.css"
;
elseif($hour<
17)echo"
day.css"
elseecho"
night.css"
?
"
/>
ASP版代码如下:
href="
%
ifhour(now)<
12then
response.write"
a.css"
else
17then
b.css"
else
c.css"
endif
%>
"
第七篇list-style-type的用法
语法:
list-style-type:
disc|circle|square|decimal|lower-roman|upper-roman|lower-alpha|upper-alpha|none|armenian|cjk-ideographic|georgian|lower-greek|hebrew|hiragana|hiragana-iroha|katakana|katakana-iroha|lower-latin|upper-latin
取值:
disc:
CSS1默认值。
实心圆
circle:
CSS1空心圆
square:
CSS1实心方块
decimal:
CSS1阿拉伯数字
lower-roman:
CSS1小写罗马数字
upper-roman:
CSS1大写罗马数字
lower-alpha:
CSS1小写英文字母
upper-alpha:
CSS1大写英文字母
none:
CSS1不使用项目符号
armenianl:
CSS2未支持。
传统的亚美尼亚数字
cjk-ideographic:
浅白的表意数字
georgian:
传统的乔治数字
lower-greek:
基本的希腊小写字母
hebrew:
传统的希伯莱数字
hiragana:
日文平假名字符
hiragana-iroha:
日文平假名序号
katakana:
日文片假名字符
katakana-iroha:
日文片假名序号
lower-latin:
小写拉丁字母
upper-latin:
大写拉丁字母
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 书籍 读书笔记