第四章 串.docx
- 文档编号:30060253
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:16
- 大小:38.35KB
第四章 串.docx
《第四章 串.docx》由会员分享,可在线阅读,更多相关《第四章 串.docx(16页珍藏版)》请在冰豆网上搜索。
第四章串
第四章 串
一、内容提要
1、 是数据元素为字符的线性表,串的定义及操作。
2、 串的基本操作,编制算法求串的其它操作。
3、 串的存储结构,因串是数据元素为字符的线性表,所以存在“结点大小“的问题。
静态和动态(块链结构,堆结构)存储的优缺点。
4、 朴素模式匹配算法及改进(KMP)算法。
二、学习重点
1、 串的基本操作,编写串的其他操作(如index,replace等)。
2、在串的模式匹配中,求匹配串的nextval函数值。
3、尽管朴素的模式匹配的时间复杂度是O(m*n),KMP算法是O(m+n),但在一般情况下,前者实际执行时间近似O(m+n),因此至今仍被采用。
KMP算法仅在主串与模式串存在许多“部分匹配”时才显得比前者块的多,其主要优点是主串不回嗍。
5、 串操作在存储结构下的实现。
三、例题解析
1、利用串的如下基本运算create(s),assign(s,t),length(s),substr(s,start,len),concat(s1,s2),编写操作replace的算法
replace(string&s,stringt,stringv)
//本算法实现串的置换操作,用串v置换串s中所有非重叠的t串。
{i=INDEX(s,t);{判s中有无t}
IF(i!
=0)
{CREATE(temp,‘’);{t为临时串变量,存放部分结果}
m=LENGTH(t);n=LENGTH(s);
WHILE(i!
=0)
{ASSIGN(temp,CONCAT(temp,SUBSTR(s,1,i-1),v));
//用v替换t形成部分结果
ASSIGN(s,SUBSTR(s,i+m,n-i-m+1));//t串以后形成新s串
n=n-(i-1)-m;
i=INDEX(s,t);
}
ASSIGN(s,CONCAT(temp,s));//将剩余s连接临时串t再赋给s
}
}
intindex(strings,stringt)
//本算法求串t在串s中的第一次出现。
结果是:
若t在s中,则给出串t的第一个字符在串s中的位置,若不存在,则返回0
{j=1;m=length(s);n=length(t);eq=true;
WHILE((j<=m-n+1)&&eq)
IFequal(substr(s,j,n),t)
eq=false;
ELSEj=j+1;
IF(j<=m+n-1)return(j);
Return(0);
}
【讨论】本题是用给定的基本操作,编写其它操作的算法。
这种类型题较多,必须严格按题的要求来做,不准选择具体存储结构。
否则,即使全对,也很难得分。
2 设目标为t=’abcaabbabcabaacbacba’,模式串p=’abcabaa’;
(1)计算P的NEXTVAL函数值;
(2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程;
【解答】
【讨论】为写NEXTVAL方便,可先写出NEXT函数值,在由此求NEXTVAL.
3、字符串s满足下式,其中HEAD和TAIL的定义同广义表类似,如HEAD(‘XYZ’)=’X’,TAIL(‘XYZ’)=’YZ’,则
S=concat(head(tail(s)),head(tail(tail(s))))=’dc’
求字符串s。
可供选择的答案是(A)abcd(B)acbd(C)acdb(D)adcb
正确答案是(D)。
四、基本题
(一)选择题
1.下面关于串的的叙述中,哪一个是不正确的?
()【北方交通大学2001一、5(2分)】
A.串是字符的有限序列B.空串是由空格构成的串
C.模式匹配是串的一种重要运算D.串既可以采用顺序存储,也可以采用链式存储
2若串S1=‘ABCDEFG’,S2=‘9898’,S3=‘###’,S4=‘012345’,执行
concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4,index(S2,‘8’),length(S2)))
其结果为()【北方交通大学1999一、5(25/7分)】
A.ABC###G0123B.ABCD###2345C.ABC###G2345D.ABC###2345
E.ABC###G1234F.ABCD###1234G.ABC###01234
3.设有两个串p和q,其中q是p的子串,求q在p中首次出现的位置的算法称为()
A.求子串B.联接C.匹配D.求串长
【北京邮电大学2000二、4(20/8分)】【西安电子科技大学1996一、1(2分)】
4.已知串S=‘aaab’,其Next数组值为()。
【西安电子科技大学1996一、7(2分)】
A.0123B.1123C.1231D.1211
5.串‘ababaaababaa’的next数组为()。
【中山大学1999一、7】
A.012345678999B.012121111212C.011234223456D.0123012322345
6.字符串‘ababaabab’的nextval为()
A.(0,1,0,1,04,1,0,1)B.(0,1,0,1,0,2,1,0,1)
C.(0,1,0,1,0,0,0,1,1)D.(0,1,0,1,0,1,0,1,1)
【北京邮电大学1999一、1(2分)】
7.模式串t=‘abcaabbcabcaabdab’,该模式串的next数组的值为(),nextval数组的值为()。
A.01112211123456712B.01112121123456112
C.01110013101100701D.01112231123456712
E.01100111011001701F.01102131011021701
【北京邮电大学1998二、3(2分)】
8.若串S=’software’,其子串的数目是()。
【西安电子科技大学2001应用一、2(2分)】
A.8B.37C.36D.9
9.设S为一个长度为n的字符串,其中的字符各不相同,则S中的互异的非平凡子串(非空且不同于S本身)的个数为()。
【中科院计算所1997】
A.2n-1B.n2C.(n2/2)+(n/2)D.(n2/2)+(n/2)-1E.(n2/2)-(n/2)-1F.其他情况
10.串的长度是指()【北京工商大学2001一、6(3分)】
A.串中所含不同字母的个数B.串中所含字符的个数
C.串中所含不同字符的个数D.串中所含非空格字符的个数
(二)判断题
1.KMP算法的特点是在模式匹配时指示主串的指针不会变小。
()【北京邮电大学2002一、4(1分)】
2.设模式串的长度为m,目标串的长度为n,当n≈m且处理只匹配一次的模式时,朴素的匹配(即子串定位函数)算法所花的时间代价可能会更为节省。
()【长沙铁道学院1998一、1(1分)】
3.串是一种数据对象和操作都特殊的线性表。
()【大连海事大学20011、L(1分)】
(三)填空题
1.空格串是指__
(1)__,其长度等于___
(2)__。
【西安电子科技大学2001软件一、4(2分)】
2.组成串的数据元素只能是________。
【中山大学1998一、5(1分)】
3.一个字符串中________称为该串的子串。
【华中理工大学2000一、3(1分)】
4.INDEX(‘DATASTRUCTURE’,‘STR’)=________。
【福州大学1998二、4(2分)】
5.设正文串长度为n,模式串长度为m,则串匹配的KMP算法的时间复杂度为________。
【重庆大学2000一、4】
6.模式串P=‘abaabcac’的next函数值序列为________。
【西安电子科技大学2001软件一、6(2分)】
7.字符串’ababaaab’的nextval函数值为________。
【北京邮电大学2001二、4(2分)】
8.设T和P是两个给定的串,在T中寻找等于P的子串的过程称为__
(1)__,又称P为__
(2)__。
【西安电子科技大学1998二、5(16/6分)】
9.串是一种特殊的线性表,其特殊性表现在__
(1)__;串的两种最基本的存储方式是__
(2)__、__(3)__;两个串相等的充分必要条件是__(4)__。
【中国矿业大学2000一、3(4分)】
10.两个字符串相等的充分必要条件是_______。
【西安电子科技大学1999软件一、1(2分)】
11.知U=‘xyxyxyxxyxy’;t=‘xxy’;
ASSIGN(S,U);
ASSIGN(V,SUBSTR(S,INDEX(s,t),LEN(t)+1));
ASSIGN(m,‘ww’)
求REPLACE(S,V,m)=________。
【东北大学1997一、1(5分)】
12.实现字符串拷贝的函数strcpy为:
voidstrcpy(char*s,char*t)/*copyttos*/
{while(________)
}【浙江大学1999一、5(3分)】
13.下列程序判断字符串s是否对称,对称则返回1,否则返回0;如f("abba")返回1,f("abab")返回0;
intf(
(1)________)
{inti=0,j=0;
while(s[j])
(2)________;
for(j--;i return((3)_______) }【浙江大学1999一、6(3分)】 14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。 voidmaxcomstr(orderstring*s,*t;intindex,length) {inti,j,k,length1,con; index=0;length=0;i=1; while(i<=s.len) {j=1; while(j<=t.len) {if(s[i]==t[j]) {k=1;length1=1;con=1; while(con) if (1)_{length1=length1+1;k=k+1;}else (2)__; if(length1>length){index=i;length=length1;} (3)____; } else(4)___; } (5)__ }}【上海大学2000一、2(10分)】 15.完善算法: 求KMP算法中next数组。 get_next(stringt,intnext[]) {j=0;k= (1)__;next[1]=0; WHILE(j IF(k==0||t[j]==t[k]){j=j+1;k=k+1;next[j]=k;} ELSEk= (2)___; } 【中山大学1998四、1(4分)】 16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(从1开始计),否则返回0。 例如: s=‘abcdefcdek’,t=‘cde’,则indse(s,t)=3,index(s,’aaa’)=0。 已知t,s的串长分别是mt,ms intindex(s,t,ms,mt); {i=1;j=1; WHILE(i IF(s[i]==t[j])[ (1)__; (2)__] ELSE[(3)___;(4)_] IF(j>mt)return(5)____;ELSEreturn(6)__ } 【南京理工大学1999三、2(6分)】 18.试利用下列栈和串的基本操作完成下述填空题。 initstack(s)置s为空栈; push(s,x)元素x入栈; pop(s)出栈操作; gettop(s)返回栈顶元素; sempty(s)判栈空函数; setnull(st)置串st为空串; length(st)返回串st的长度; equal(s1,s2)判串s1和s2是否相等的函数; concat(s1,s2)返回联接s1和s2之后的串; sub(s,i,1)返回s中第i个字符; empty(st)判串空函数 intinvert(stringpre,string&exp) //若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。 已知原表达式中不包含括弧,opset为运算符的集合。 {stacks;inti,n,succ;charch; i=1;n=length(pre);succ=true; (1)__; (2)__; WHILE(i {ch=sub(pre,i,l); IF(3)_ (4)__ ELSEIF(5)__ (6)_ ELSE {exp=concat((7)___,(8)____); exp=concat((9)___,(10)___); (11)__;} i=i+1; } IF(12)___ {exp=concat(exp,sub(pre,n,1));invert=true;} ELSE{setnull(exp);invert=false;} } 注意: 每个空格只填一个语句。 【清华大学1996八】 (四)应用题 1.名词解释: 串【大连海事1996一、10(1分)】【河海大学1998二、5(3分)】 2.描述以下概念的区别: 空格串与空串。 【大连海事大学1996三、2、 (1)(2分)】 3.两个字符串S1和S2的长度分别为m和n。 求这两个字符串最大共同子串算法的时间复杂度为T(m,n)。 估算最优的T(m,n),并简要说明理由。 【北京工业大学1996一、5(6分)】 4.设主串S=‘xxyxxxyxxxxyxyx’,模式串T=‘xxyxy’。 请问: 如何用最少的比较次数找到T在S中出现的位置? 相应的比较次数是多少? 【大连海事大学2001四(8分)】 5.KMP算法(字符串匹配算法)较Brute(朴素的字符串匹配)算法有哪些改进? 【大连海事大学1996三、1((2分)】 6.已知模式串t=‘abcaabbabcab’写出用KMP法求得的每个字符对应的next和nextval函数值。 【北京邮电大学1997三(10分)】 7.给出字符串‘abacabaaad’在KMP算法中的next和nextval数组。 【北京邮电大学2000三、1(5分)】 8.令t=‘abcabaa’,求其next函数值和nextval函数值。 【北方交通大学1994一(6分)】 9.已知字符串‘cddcdececdea’,计算每个字符的next和nextval函数的值。 【南京邮电大学2000一2】 10.试利用KMP算法和改进算法分别求p1=‘abaabaa’和p2=‘aabbaab’的next函数和nextval函数。 【东南大学1999一、6(8分)】 11.已知KMP串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。 【西南交通大学2000二、2】 12.求模式串T=‘abcaabbac'的失败函数Next(j)值。 【西安交通大学1996四、4(5分)】 13.字符串的模式匹配KMP算法中,失败函数(NEXT)是如何定义的? 计算模式串p=‘aabaabaaabc’中各字符的失败函数值.【石油大学1998一、2(10分)】 14.设字符串S=‘aabaabaabaac',P=‘aabaac' (1)给出S和P的next值和nextval值; (2)若S作主串,P作模式串,试给出利用BF算法和KMP算法的匹配过程。 【北方交通大学1998二(15分)】 15.设目标为t=‘abcaabbabcabaacbacba’,模式为p=‘abcabaa’ (1)计算模式p的naxtval函数值;(5分) (2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程。 (5分) 【清华大学1998八(10分)】 16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的KMP算法的时间复杂性是多少? 如果,某一模式P=’abcaacabaca’,请给出它的NEXT函数值及NEXT函数的修正值NEXTVAL之值。 【上海交通大学2000一(5分)】 17.设目标为S=‘abcaabbcaaabababaabca’,模式为P=‘babab’, (1)手工计算模式P的nextval数组的值;(5分) (2)写出利用求得的nextval数组,按KMP算法对目标S进行模式匹配的过程。 (5分) 【清华大学1997四(10分)】 18.用无回溯的模式匹配法(KMP法)及快速的无回溯的模式匹配法求模式串T的next[j]值,添入下面表中: j 1234567 t aabbaab kmp法求得的next[j]值 快速无回溯法求得的next[j]值 【北京邮电大学1992三、1(25/4分)】 19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。 下面是求nextval值的算法。 TypedefintSAR[m+1]; TypedefcharPTY[m+1]; next2(PTYP,SARNEXTVAL) {在模式P中求nextval数组的值} 1 { 2 J=1;NEXTVAL[1]=0;K=0; 3 do 4 {IF(K==0||P[J]==P[K]) 5 {J=J+1;K=K+1; 6 IF(P[J]==P[K]) 7 NEXTVAL[J]=NEXTVAL[K]; 8 ELSENEXTVAL[J]=K; 9 ELSEK=NEXTVAL[K] 10 while(j! =m) 11 } 算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。 两处比较语句相同。 请分析说明此两处比较语句的含义是什么? 分析此算法在最坏情况下的时间复杂度是多少? 【北京邮电大学1993二、2(6分)】 20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下: 请问: (1)当j=1时,为什么要取next[1]=0? (2)为什么要取max{K},K最大是多少? (3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学1994二(8分)】 21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么? 【东南大学1993一、3(9分)1997一、2(8分)2001一、6(6分)】 22.在模试匹配KMP算法中所用失败函数f的定义中,为何要求p1p2……pf(j)为p1p2……pj两头匹配的真子串? 且为最大真子串? 【东南大学1996一、3(7分)】 23.如果两个串含有相等的字符,能否说它们相等? 【西安电子科技大学2000软件一、3(5分)】 24.设S1,S2为串,请给出使S1//S2=S2//S1成立的所有可能的条件(//为连接符)。 【长沙铁道学院1997三、5(3分)】【国防科技大学1999一】 25.已知: s='(xyz)+*',t='(x+z)*y'。 试利用联结、求子串和置换等基本运算,将s转化为t。 【北方交通大学1996一、3(5分)】【山东科技大学2002一、6(5分)】 (五)算法设计 1.设s、t为两个字符串,分别放在两个一维数组中,m、n分别为其长度,判断t是否为s的子串。 如果是,输出子串所在位置(第一个字符),否则输出0。 (注: 用程序实现)【南京航空航天大学1997九(10分)】 2.输入一个字符串,内有数字和非数字字符,如: ak123x45617960? 302gef4563,将其中连续的数字作为一个整体,依次存放到一数组a中,例如123放入a[0],456放入a[1],… … 。 编程统计其共有多少个整数,并输出这些数。 【上海大学1998一(13分)】 3.以顺序存储结构表示串,设计算法。 求串S中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。 【东南大学2000五(15分)】 类似本题的另外叙述有: (1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。 试设计一算法,输入字符串S,以“! ”作为结束标志。 如果串S中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。 例如: 若S=“abc123abc123! ”,则输出“无等值子串”;若S=“abceebccadddddaaadd! ”,则输出“ddddd”。 【华中科技大学2001】 4.假设串的存储结构如下所示,编写算法实现串的置换操作。 【清华大学1995五(15分)】 Typedefstruct {charch[maxlen]; intcurlen; }strtp; 5.函数voidinsert(char*s,char*t,intpos)将字符串t插入到字符串s中,插入位置为pos。 请用c语言实现该函数。 假设分配给字符串s的空间足够让字符串t插入。 (说明: 不得使用任何库函数) 【北京航空航天大学2001六(10分)】 6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4。 (1)简述算法的主要思想;(3分) (2)用c语言分别对算法中用到的类型和变量作出说明;(3分) (3)用类c语言或自然语言写算法的非递归过程;(8分) (4)分析该算法的最大检索长度;(3分) (5)必要处加上中文注释。 (3分) 【山东工业大学1995八(20分)】 7.设计一C语言的函数atoi(x).其中X为字符串,由0--9十个数字符和表示正负数的‘-’组成,返回值为整型数值。 【浙江大学1994二(7分)】 8.已知字符串S1中存放一段英文,写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2,其多余的字符送S3。 【首都经贸大学1998三、8(15分)】 9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法. #definemaxlen串被确认的最大长度 typedefstruct {charch[maxlen]; intcurlen; }strtp; (以一维数组存放串值,并设指示器curlen指示当前串长)【北京轻工业大学1998一(12分)】 10.编写程序,统计在输入字符串中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 第四