数据结构导论复习题Word文档格式.docx
- 文档编号:21769059
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:14
- 大小:30.92KB
数据结构导论复习题Word文档格式.docx
《数据结构导论复习题Word文档格式.docx》由会员分享,可在线阅读,更多相关《数据结构导论复习题Word文档格式.docx(14页珍藏版)》请在冰豆网上搜索。
是指当问题规模趋向无穷大时,该算法时间复杂度的数量级。
评价一个算法的时间性能时,主要标准就是算法的渐近时间复杂度。
算法中语句的频度不仅与问题规模有关,还与输入实例中各元素的取值相关。
时间复杂度按数量级递增排列依次为:
常数阶O
(1)、对数阶O(log2n)、线性阶O(n)、线性对数阶O(nlog2n)、平方阶O(n^2)、立方阶O(n^3)、……k次方阶O(n^k)、指数阶O(2^n)。
空间复杂度:
是某个算法的空间耗费,它是该算法所求解问题规模n的函数。
算法的时间复杂度和空间复杂度合称算法复杂度。
概念:
数据结构:
是一门研究程序设计中计算机操作的对象以及它们之间的关系和运算的一门学科。
数据:
是描述额观事物的数、字符以及所有能输入到计算机中被计算机程序加工处理的信息的集合。
数据元素:
数据元素是数据的基本单位。
(一个数据项或多个数据项(域)。
数据项是数据的最小单位。
结点、顶点、记录。
数据对象:
是性质相同的数据元素的集合。
研究是是数据元素之间抽象化的相互关系和这种关系在计算机中的存贮表示,并对每种结构定义各自的运算,设计出相应的算法,而且经过运算后所得的新结构一般仍然是原来的结构类型。
是指程序设计语言中各变量可取的数据种类。
算法:
是执行特定计算的有穷过程。
特点:
动态有穷·
确定性·
输入·
输出·
可行性。
第二章线性表
线性表是由n≥0个数据元素组成的有限序列。
n=0是空表;
非空表,只能有一个开始结点,有且只能有一个终端结点。
线性表上定义的基本运算:
构造空表:
Initlist(L)
求表长:
Listlength(L)
取结点:
GetNode(L,i)
查找:
LocateNode(L,x)
插入:
InsertList(L,x,i)
删除:
Delete(L,i)
顺序表是按线性表的逻辑结构次序依次存放在一组地址连续的存储单元中。
在存储单元中的各元素的物理位置和逻辑结构中各结点相邻关系是一致的。
地址计算:
LOCa(i)=LOCa
(1)+(i-1)*d;
(首地址为1)
在顺序表中实现的基本运算:
平均移动结点次数为n/2;
平均时间复杂度均为O(n)。
平均移动结点次数为(n-1)/2;
线性表的链式存储结构中结点的逻辑次序和物理次序不一定相同,为了能正确表示结点间的逻辑关系,在存储每个结点值的同时,还存储了其后继结点的地址信息(即指针或链)。
这两部分信息组成链表中的结点结构。
一个单链表由头指针的名字来命名。
单链表运算:
建立单链表·
头插法:
s->
next=head;
head=s;
生成的顺序与输入顺序相反。
尾插法:
head=rear=null;
if(head=null)head=s;
elser->
next=s;
r=s;
平均时间复杂度均为O(n)
加头结点的算法:
对开始结点的操作无需特殊处理,统一了空表和非空表。
查找·
按序号:
与查找位置有关,平均时间复杂度均为O(n)。
按值:
与输入实例有关,平均时间复杂度均为O(n)。
插入运算:
p=GetNode(L,i-1);
next=p->
next;
p->
平均时间复杂度均为O(n)
删除运算:
r=p->
next=r->
free(r);
单循环链表是一种首尾相接的单链表,终端结点的指针域指向开始结点或头结点。
链表终止条件是以指针等于头指针或尾指针。
采用单循环链表在实用中多采用尾指针表示单循环链表。
优点是查找头指针和尾指针的时间都是O
(1),不用遍历整个链表。
双链表就是双向链表,就是在单链表的每个结点里再增加一个指向其直接前趋的指针域prior,形成两条不同方向的链。
由头指针head惟一确定。
双链表也可以头尾相链接构成双(向)循环链表。
双链表上的插入和删除时间复杂度均为O
(1)。
顺序表和链表的比较:
基于空间:
顺序表的存储空间是静态分配,存储密度为1;
适于线性表事先确定其大小时采用。
链表的存储空间是动态分配,存储密度<1;
适于线性表长度变化大时采用。
基于时间:
顺序表是随机存储结构,当线性表的操作主要是查找时,宜采用。
以插入和删除操作为主的线性表宜采用链表做存储结构。
若插入和删除主要发生在表的首尾两端,则宜采用尾指针表示的单循环链表。
线性表和数组
概念:
一、线性表:
是N个元素构成的有限序列。
顺序存贮结构:
地址计算,插入、删除。
链式存贮结构:
单链表,查找、插入、删除。
循环链表:
双向链表:
二、数组:
以行为主;
以列为主;
计算地址:
三、栈:
是一种特殊的线性表,这种表只能在固定的一端进行插入与删除运算。
队列:
是另一种特殊的线性表,删除运算限定在表的一端进行,而插入运算在另一端进行。
第三章栈和队列
栈(Stack)是仅限制在表的一端进行插入和删除运算的线性表,称插入、删除这一端为栈顶,另一端称为栈底。
表中无元素时为空栈。
栈的修改是按后进先出的原则进行的,我们又称栈为LIFO表(LastInFirstOut)。
通常栈有顺序栈和链栈两种存储结构。
栈的基本运算有六种:
·
构造空栈:
InitStack(S)
判栈空:
StackEmpty(S)
判栈满:
StackFull(S)
进栈:
Push(S,x)
退栈:
Pop(S)
取栈顶元素:
StackTop(S)
在顺序栈中有“上溢”和“下溢”的现象。
“上溢”是栈顶指针指出栈的外面是出错状态。
“下溢”可以表示栈为空栈,因此用来作为控制转移的条件。
顺序栈中的基本操作有六种:
构造空栈·
判栈空·
判栈满·
进栈·
退栈·
取栈顶元素
链栈则没有上溢的限制,因此进栈不要判栈满。
链栈不需要在头部附加头结点,只要有链表的头指针就可以了。
链栈中的基本操作有五种:
队列(Queue)是一种运算受限的线性表,插入在表的一端进行,而删除在表的另一端进行,允许删除的一端称为队头(front),允许插入的一端称为队尾(rear),队列的操作原则是先进先出的,又称作FIFO表(FirstInFirstOut).队列也有顺序存储和链式存储两种存储结构。
队列的基本运算有六种:
置空队:
InitQueue(Q)
判队空:
QueueEmpty(Q)
判队满:
QueueFull(Q)
入队:
EnQueue(Q,x)
出队:
DeQueue(Q)
取队头元素:
QueueFront(Q)
顺序队列的“假上溢”现象:
由于头尾指针不断前移,超出向量空间。
这时整个向量空间及队列是空的却产生了“上溢”现象。
为了克服“假上溢”现象引入循环向量的概念,是把向量空间形成一个头尾相接的环形,这时队列称循环队列。
判定循环队列是空还是满,方法有三种:
一种是另设一个布尔变量来判断;
第二种是少用一个元素空间,入队时先测试((rear+1)%m=front)?
满:
空;
第三种就是用一个计数器记录队列中的元素的总数。
队列的链式存储结构称为链队列,一个链队列就是一个操作受限的单链表。
为了便于在表尾进行插入(入队)的操作,在表尾增加一个尾指针,一个链队列就由一个头指针和一个尾指针唯一地确定。
链队列不存在队满和上溢的问题。
在链队列的出队算法中,要注意当原队中只有一个结点时,出队后要同进修改头尾指针并使队列变空。
第四章串
串是零个或多个字符组成的有限序列。
空串:
是指长度为零的串,也就是串中不包含任何字符(结点)。
空白串:
指串中包含一个或多个空格字符的串。
在一个串中任意个连续字符组成的子序列称为该串的子串,包含子串的串就称为主串。
子串在主串中的序号就是指子串在主串中首次出现的位置。
空串是任意串的子串,任意串是自身的子串。
串分为两种:
串常量在程序中只能引用不能改变;
串变量的值可以改变。
串的基本运算有:
求串长strlen(char*s)
串复制strcpy(char*to,char*from)
串联接strcat(char*to,char*from)
串比较charcmp(char*s1,char*s2)
字符定位strchr(char*s,charc)
。
串是特殊的线性表(结点是字符),所以串的存储结构与线性表的存储结构类似。
串的顺序存储结构简称为顺序串。
顺序串又可按存储分配的不同分为:
静态存储分配:
直接用定长的字符数组来定义。
优点是涉及串长的操作速度快,但不适合插入、链接操作。
动态存储分配:
是在定义串时不分配存储空间,需要使用时按所需串的长度分配存储单元。
串的链式存储就是用单链表的方式存储串值,串的这种链式存储结构简称为链串。
链串与单链表的差异只是它的结点数据域为单个字符。
为了解决“存储密度”低的状况,可以让一个结点存储多个字符,即结点的大小。
顺序串上子串定位的运算:
又称串的“模式匹配”或“串匹配”,是在主串中查找出子串出现的位置。
在串匹配中,将主串称为目标(串),子串称为模式(串)。
这是比较容易理解的,串匹配问题就是找出给定模式串P在给定目标串T中首次出现的有效位移或者是全部有效位移。
最坏的情况下时间复杂度是O((n-m+1)m),假如m与n同阶的话则它是O(n^2)。
链串上的子串定位运算位移是结点地址而不是整数
串
是由N个字符组成的有限序列。
存贮结构:
顺序表示法:
1、紧缩格式2、非紧缩格式3、以单字节为单位的存贮方式
链式表示法:
串名的存贮映象:
第五章多维数组和广义表
数组一般用顺序存储的方式表示。
存储的方式有:
行优先顺序,也就是把数组逐行依次排列。
PASCAL、C
列优先顺序,就是把数组逐列依次排列。
FORTRAN
地址的计算方法:
按行优先顺序排列的数组:
LOCa(ij)=LOCa(11)+((i-1)*n+(j-1))*d.
按列优先顺序排列的数组:
LOCa(ij)=LOCa(11)+((j-1)*n+(i-1))*d.
矩阵的压缩存储:
为多个相同的非零元素分配一个存储空间;
对零元素不分配空间。
特殊矩阵的概念:
所谓特殊矩阵是指非零元素或零元素分布有一定规律的矩阵。
稀疏矩阵的概念:
一个矩阵中若其非零元素的个数远远小于零元素的个数,则该矩阵称为稀疏矩阵。
特殊矩阵的类型:
对称矩阵:
满足a(ij)=a(ji)。
元素总数n(n+1)/2.I=max(i,j),J=min(i,j),LOCa(ij)=LOC(sa[0])+(I*
(I+1)/2+J)*d.
三角矩阵:
上三角阵:
k=i*(2n-i+1)/2+j-i,LOCa(ij)=LOC(sa[0])+k*d.
下三角阵:
k=i*(i+1)/2+j,LOCa(ij)=LOC(sa[0])+k*d.
对角矩阵:
k=2i+j,LOCa(ij)=LOC(sa[0])+k*d.
稀疏矩阵的压缩存储方式用三元组表把非零元素的值和它所在的行号列号做为一个结点存放在一起,用这些结点组成的一个线性表来表示。
但这种压缩存储方式将失去随机存储功能。
加入行表记录每行的非零元素在三元组表中的起始位置,即带行表的三元组表。
广义表是n(n≥0)个元素的有限序列,其中的元素是原子或者是一个广义表。
广义表表头和表尾的概念:
若广义表LS非空(n≥1),则这个广义表的第一个元素就是表头。
其余的元素组成的表称为LS的表尾,所以表尾必是一个子表。
广义表有两种表示法,一种是括号表示法,一种是图形表示法。
广义表与树(形结构)相对应,这个广义表就是纯表。
如果一个广义表的结点又可以被其他结点所共享,则这个表称为再入表。
允许递归的表称为递归表。
线性表∈纯表(树)∈再入表∈递归表.可见,广义表是对线性表和树的推广。
广义表有两个特殊的基本运算:
取表头head(LS):
取表中的第一个数据元素,不能对空表操作。
取表尾tail(LS);
取除表头外,其余数据元素构成的子表,不能对空表操作。
第六章树
树是n个结点的有限集合,非空时必须满足:
只有一个称为根的结点;
其余结点形成m个不相交的子集,并称根的子树。
根是开始结点;
结点的子树数称度;
度为0的结点称叶子(终端结点);
度不为0的结点称分支结点(非终端结点);
除根外的分支结点称内部结点;
有序树是子树有左,右之分的树;
无序树是子树没有左,右之分的树;
森林是m个互不相交的树的集合;
树的四种不同表示方法:
树形表示法;
嵌套集合表示法;
凹入表示法·
广义表表示法。
二叉树的定义:
是n≥0个结点的有限集,它是空集(n=0)或由一个根结点及两棵互不相交的分别称作这个根的左子树和右子树的二叉树组成。
二叉树不是树的特殊情形,与度数为2的有序树不同。
二叉树的4个重要性质:
。
二叉树上第i层上的结点数目最多为2^(i-1)(i≥1)。
;
深度为k的二叉树至多有(2^k)-1个结点(k≥1);
在任意一棵二叉树中,若终端结点的个数为n0,度为2的结点数为n2,则n0=n2+1;
具有n个结点的完全二叉树的深度为int(log2n)+1.
满二叉树是一棵深度为k,结点数为(2^k)-1的二叉树;
完全二叉树是满二叉树在最下层自右向左去处部分结点;
二叉树的顺序存储结构就是把二叉树的所有结点按照层次顺序存储到连续的存储单元中。
(存储前先将其画成完全二叉树)
树的存储结构多用的是链式存储。
BinTNode的结构为lchild|data|rchild,把所有BinTNode类型的结点,加上一个指向根结点的BinTree型头指针就构成了二叉树的链式存储结构,称为二叉链表。
它就是由根指针root唯一确定的。
共有2n个指针域,n+1个空指针。
根据访问结点的次序不同可得三种遍历:
先序遍历(前序遍历或先根遍历),中序遍历(或中根遍历)、后序遍历(或后根遍历)。
时间复杂度为O(n)。
利用二叉链表中的n+1个空指针域来存放指向某种遍历次序下的前趋结点和后继结点的指针,这些附加的指针就称为“线索”,加上线索的二叉链表就称为线索链表。
线索使得查找中序前趋和中序后继变得简单有效,但对于查找指定结点的前序前趋和后序后继并没有什么作用。
树和森林及二叉树的转换是唯一对应的。
转换方法:
树变二叉树:
兄弟相连,保留长子的连线。
二叉树变树:
结点的右孩子与其双亲连。
森林变二叉树:
树变二叉树,各个树的根相连。
树的存储结构:
有双亲链表表示法:
结点data|parent,对于求指定结点的双亲或祖先十分方便,但不适于求指定结点的孩子及后代。
孩子链表表示法:
为树中每个结点data|next设置一个孩子链表firstchild,并将data|firstchild存放在一个向量中。
双亲孩子链表表示法:
将双亲链表和孩子链表结合。
孩子兄弟链表表示法:
结点结构leftmostchild|data|rightsibing,附加两个分别指向该结点的最左孩子和右邻兄弟的指针域。
树的前序遍历与相对应的二叉树的前序遍历一致;
树的后序遍历与相对应的二叉树的中序遍历一致。
树的带权路径长度是树中所有叶结点的带权路径长度之和。
树的带权路径长度最小的二叉树就称为最优二叉树(即哈夫曼树)。
在叶子的权值相同的二叉树中,完全二叉树的路径长度最短。
哈夫曼树有n个叶结点,共有2n-1个结点,没有度为1的结点,这类树又称为严格二叉树。
变长编码技术可以使频度高的字符编码短,而频度低的字符编码长,但是变长编码可能使解码产生二义性。
如00、01、0001这三个码无法在解码时确定是哪一个,所以要求在字符编码时任一字符的编码都不是其他字符编码的前缀,这种码称为前缀码(其实是非前缀码)。
哈夫曼树的应用最广泛地是在编码技术上,它能够容易地求出给定字符集及其概率分布的最优前缀码。
哈夫曼编码的构造很容易,只要画好了哈夫曼树,按分支情况在左路径上写代码0,右路径上写代码1,然后从上到下到叶结点的相应路径上的代码的序列就是该结点的最优前缀码。
树
一、概念:
树:
是一个或多个结点的有穷集合T,且满足以下条件:
1、有且仅有一个指定的称作树根的结点;
2、除根以外的其余结点被分成m个不相交的集合,这些集合的每一个又都是树,并且称为根的子树。
结点的度:
结点N的子树数称为结点的度。
树的度:
树T中各结点的度的最大值称的树T的度。
叶子:
树中度为0的结点称为叶子(终端结点)。
分枝结点:
树中度不为0的结点称为分枝结点(非终端结点)。
双亲和孩子:
若树中结点P的一棵子树的根是结点C,则我们称P是C的双亲或父母,反之称C是P的孩子。
结点的层数:
树的层数为1,其余任一结点的层数等于它的双亲的层数加1.
树的深度:
树中各结点的层数的最大值称为T的深度(高度)。
兄弟和堂兄弟:
同一双亲的孩子之间互称为兄弟,其双亲在同一层的结点互为堂兄弟。
祖先和子孙:
一个点的祖先是指从树的根到该结点所经分枝上的所有结点。
一个结点的子树的所有结点都称为该结点的子孙。
有序树和无序树:
如果树中结点各棵子树规定从左至右是有次序的,则称树为有序树,否则为无序树。
森林:
N棵互不相交的树的集合称为森林。
二、树的存贮表示:
1、双亲数组表示:
记录型一维数组:
data,parent
2、孩子链表表示法:
多重链表表示法:
data,degree,link1,link2…
单链表表示法:
data,likn
3、左孩子右兄弟链表示法:
lchild,data,rsibling
三、二叉树:
1、概念:
是有限个结点的集合,它或者为空集,或者是由一个根结点以及两棵互不相交的且分别称为根的左子树和右子树的二叉树组成。
五种形态:
空,根,左,右,左右2、性质:
位于二叉树第I层上的结点,最多为2I-1;
(I)=1
深度为K的二叉树的结点总数,最多为2K-1(K)=1
N0=N2+1
满二叉树:
一棵深度为K的具有2K-1个结点的二叉树
完全二叉树:
在一棵二叉树中,若所有结点的度为0或为2的二叉树
顺序二叉树:
如果深度为K的具有N个结点的二叉树,它的每一个结点都与深度为K的满二叉树中顺序编号是1到N的结点相对应的二叉树。
三、二叉树的存贮表示:
1、顺序存贮:
2、链表表示:
lchild,data,rchlid
3、遍历:
前序:
根—左—右
中序:
左—根—右
后序:
左—右—根
四、线索二叉树:
五、树的二叉树表示,森林与二叉树的转换。
六、路径长度:
树中一个结点到另一个结点之关的路径由这两个结点之间的分枝所构成,路径上的分枝数目称为它的路径长度。
哈夫曼树:
WPL,哈夫曼码
第七章图
图的逻辑结构特征就是其结点(顶点)的前趋和后继的个数都是没有限制的,即任意两个结点之间之间都可能相关。
图GraphG=(V,E),V是顶点的有穷非空集合,E是顶点偶对的有穷集。
有向图Digraph:
每条边有方向;
无向图Undigraph:
每条边没有方向。
有向完全图:
具有n*(n-1)条边的有向图;
无向完全图:
具有n*(n-1)/2条边的无向图;
有根图:
有一个顶点有路径到达其它顶点的有向图;
简单路径:
是经过顶点不同的路径;
简单回路是开始和终端重合的简单路径;
网络:
是带权的图。
图的存储结构:
邻接矩阵表示法:
用一个n阶方阵来表示图的结构是唯一的,适合稠密图。
无向图:
邻接矩阵是对称的。
有向图:
行是出度,列是入度。
建立邻接矩阵算法的时间是O(n+n^2+e),其时间复杂度为O(n^2)
邻接表表示法:
用顶点表和邻接表构成不是唯一的,适合稀疏图。
顶点表结构vertex|firstedge,指针域存放邻接表头指针。
邻接表:
用头指针确定。
无向图称边表;
有向图又分出边表和逆邻接表;
邻接表结点结构为adjvex|next,
时间复杂度为O(n+e)。
,空间复杂度为O(n+e)。
图的遍历:
深度优先遍历:
借助于邻接矩阵的列。
使用栈保存已访问结点。
广度优先遍历:
借助于邻接矩阵的行。
使用队列保存已访问结点。
生成树的定义:
若从图的某个顶点出发,可以系统地访问到图中所有顶点,则遍历时经过的边和图的所有顶点所构成的子图称作该图的生成树。
最小生成树:
图的生成树不唯一,从不同的顶点出发可得到不同的生成树,把权值最小的生成树称为最小生成树(MST)。
构造最小生成树的算法:
Prim算法的时间复杂度为O(n^2)与边数无关适于稠密图。
Kruskal算法的时间复杂度为O(lge),主要取决于边数,较适合于稀疏图。
最短路径的算法:
Dijkstra算法,时间复杂度为O(n^2)。
类似于prim算法。
拓扑排序:
是将有向无环图G中所有顶点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 导论 复习题