书签分享收藏举报版权申诉 / 11

立即下载加入VIP,免费下载

当前位置：首页 > 解决方案 > 学习计划 > 四川大学编译原理复习要点文档格式.docx

四川大学编译原理复习要点文档格式.docx

文档编号：13482193
上传时间：2022-10-11
格式：DOCX
页数：11
大小：107.26KB

《四川大学编译原理复习要点文档格式.docx》由会员分享，可在线阅读，更多相关《四川大学编译原理复习要点文档格式.docx（11页珍藏版）》请在冰豆网上搜索。

四川大学编译原理复习要点文档格式.docx

得到中间代码，生成目标机器的代码

代码生成器输入：

中间代码输出：

目标代码

6）目标代码优化程序：

编译器改进由代码生成器生成的目标代码。

输入：

目标代码输出：

扫描程序、分析程序和语义分析程序是前端，代码生成器是后端，

前后端分开的好处：

可以给编译器带来更方便的可移植性，此时的编译器既能改变源代码，又能改变目标代码。

【遍】编译器发现，在生成代码之前多次处理整个源程序很方便，这些重复就是遍。

首遍是从源中构造一个语法树或中间代码，在它之后的遍是由处理中间表示、向它增加信息、更换结构或生成不同的表示组成

二、

解释器和编译器的区别与联系？

读入源语言后，解释器和编译器都要进行词法分析、语法分析和语义分析，之后，二者开始有所分别。

解释器在语义分析后选择了直接执行语句；

编译器在语义分析后选择将将语义存储成某一种中间语言，之后通过不同的后端翻译成不同的机器语言（可执行程序）

编译器是把源语言（如C,Pascal，java等高级语言）转换为目标语言（汇编语言、机器语言等低级语言），要产生目标代码。

解释器是以一个源语言（C，Pascal，java等高级语言）为输入，一边解释一边执行源程序，但不产生目标代码。

3、算法描述（伪代码）p41

构造一个扫描程序的自动过程：

正则表达式→NFA→DFA→程序

1、正则表达式→NFA

（1）

建立字母表。

输入的正则表达式由于一般不输入“与”操作符，因此

首先给表达式加入

.作为与操作。

再利用逆波兰式的堆栈操作，把操作符与字母分开，便得到了字母表。

（2）

Thompson构造法。

首先将构成正则表达式的各个元素分解，对于每

一个元素，按照下述规则1和规则2生成NFA。

注意：

如果r中记号a出现了多次，那么对于a的每次出现都需要生成一个单独的NFA。

2、NFA→DFA

从单个输入字符的某个状态中去除ε-转换和多重转换。

（1）利用ε-closure规则即闭包规则，把NFA状态划分成集合，而后把每个集合作为DFA的状态。

详细描述：

从NFA的状态S开始经过ε到达的状态存储下，然后再把存储结果中的状态有经过ε到达的新状态也存储在一起，这样通过闭包规则就可以这些集合，再把集合作为DFA的状态。

（2）子集构造

3、DFA→程序DFA状态最小化

取出DFA状态中的不可达的状态。

构造最小状态的等价DFA的算法是通过创建统一到单个状态的状态集来进行。

构造NFA（使用Thompson结构）:

1）基本正则表达式基本正则表达式格式a或ε，其中a表示字母表中单个字符的匹配，

ε表示空串的匹配。

与正则表达式a等同的NFA（即在其语言中准确接受）的是：

与ε等同的NFA是：

2）并置我们希望构造一个与正则表达式rs等同的NFA，其中r和s都是正则表达式。

可将与rs对应的NFA构造如下：

3）在各选项中选择我们希望在与前面相同的假设下构造一个与r|s相对应的NFA。

如下进行：

4）重复我们需要构造与r*相对应的机器，现假设已有一台与r相对应的机器。

那么就如下进行：

构造NFA的一个例子：

例：

根据Thompson结构将正则表达式ab|a翻译为NFA。

首先为正则表达式a和b分别构造机器：

接着再为并置ab构造机器：

现在再为a构造另一个机器复件，并利用它们组成ab|a完整的NFA，如下图：

将NFA转换成DFA（最小子集法）：

ε-闭包（ε-closure）是可由ε转换从某状态或某些状态达到的所有状态集合，它总是包含状态本身

子集构造　　　　相关题目：

2.1，2.12，2.16

四、提左因子和消除左递归

1、在建立LL

（1）语法分析器的时候，提左因子和消除左递归的目的、原因

目的：

提取左因子---避免程序回溯；

消除左递归---消除无限循环

原因：

当有公因子存在时，不能立即区分出文法规则右边的选择；

当有左递归时，将导致一个无限循环。

2、提左因子和消除左递归的算法描述

消除左递归伪代码P119

fori:

=1tomdo

forj:

=1toi-1do

replaceeachgrammerrulechoiceoftheformAi→Ajβbytherule

Ai→α1β|α2β|....|αkβ,whereAj→α1|α2|.....|αkis

thecurrentruleforAj

remove,ifnecessary,immediateleftrecursioninvolvingAi

a）把直接左递归改写为右递归【简单直接左递归】

设有文法产生式：

A→Aβ|γ。

其中β非空，γ不以A打头。

可写为：

A→γA'

A'

→βA'

|ε

一般情况下，假定关于A的产生式是【普遍的直接左递归】

A→Aα1|Aα2|…|Aαm|β1|β2|…|βn

其中，αi（1≤i≤m）均不为空，βj（1≤j≤n）均不以A打头。

则消除直接左递归后改写为：

A→β1A'

|β2A'

|…|βnA'

→α1A'

|α2A'

|…|αmA'

|ε

例4.12：

有文法G（E）：

E→E+T|T

T→T*F|F

F→i|（E）

消除该文法的直接左递归。

解：

按转换规则,可得:

E→TE'

E'

→+TE'

T→FT'

T'

→*FT'

b）消除间接左递归【一般的左递归，不带有ε产生式且不带有循环的文法】

对于间接左递归的消除需要先将间接左递归变为直接左递归，然后再按a）清除左递归。

例4.13：

以文法G6为例消除左递归：

（1）A→aB

（2）A→Bb

（3）B→Ac

（4）B→d

用产生式

（1），

（2）的右部代替产生式（3）中的非终结A得到左部为B的产生式：

（1）B→aBc

（2）B→Bbc

（3）B→d

消除左递归后得到：

B→aBcB'

|dB'

B'

→bcB'

再把原来其余的产生式A→aB,A→Bb加入，最终得到等价文法为:

（1）A→aB

（2）A→Bb

（3）B→（aBc|d）B'

（4）B'

c）消除文法中一切左递归的算法

设非终结符按某种规则排序为A1，A2，…，An。

Fori﹕=1tondo

begin

Forj﹕=1toi-1do

若Aj的所有产生式为：

Aj→δ1|δ2|…|δn

替换形如Ai→Ajγ的产生式为：

Ai→δ1γ|δ2γ|…|δnγ

end

消除Ai中的一切直接左递归

提取左因子伪代码P122

当两个或更多文法规则选择共享一个通用前缀时，需要提取左因子：

A→αβ|αγ

按如下规则提取左因子：

A→αA’

A’→β|γ

5、first集合follow集合算法伪代码P126P131

具体看书上的例子

First集合求法：

1.直接收取：

对形如U－a…的产生式（其中a是终结符），把a收入到First（U）中

2.反复传送：

对形入U－P…的产生式（其中P是非终结符），应把First（P）中的全部内容传送到First（U）中。

Follow集合求法：

1.直接收取：

注意产生式右部的每一个形如“…Ua…”的组合，把a直接收入到Follow（U）中。

2．直接收取：

对形如“…UP…”（P是非终结符）的组合，把First（P）除ε直接收入到Follow（U）中。

3．反复传送：

对形如P－…U的产生式（其中U是非终结符），应把Follow（P）中的全部内容传送到Follow（U）中。

（或P－…UB且First（B）包含ε，则把First（B）除ε直接收入到Follow（U）中，并把Follow（P）中的全部内容传送到Follow（U）中）

6、写递归下降子程序伪代码　　　Ｐ１０６

递归下降：

将一个非终结符Ａ的文法规则看作将识别Ａ的一个过程的定义

一个if语句（简化了的）文法规则是：

if-stmt→if（exp）statement

|　if（exp）statementelsestatement

伪代码：

procedureifstmt；

match（if）；

match（（）；

exp；

match（））；

statement；

iftoken　=　elsethen

match（else）；

endif；

endifstmt；

给出基于DFA进行词法分析的表驱动的实现算法p44

state:

=1;

ch:

=nextinputcharacter;

whilenotaccept[state]andnoterror（state）do

newstate:

=T[state,ch]；

ifadvance[state,ch]thench:

=nextinputchracter;

State：

=newstate；

endwhile;

ifaccept[state]thenaccpet;

7、上下文无关文法BNFEBNF　最左最右推导

1、定义

：

上下文无关文法G是一个四元组G

=

（N，T，P，S），其中

N是非终结符的有限集合；

T是终结符或单词的有限集合，它与N不相交；

P是形如A

→α的产生式的有限集合，其中A∈N,α∈V﹡,V=T∪N

S是N中的区分符号，称为开始符号或句子符号。

V中的符号称为文法符号，包括终结符和非终结符。

2、Backus-Naur符号（就是众所周知的BNF或Backus-Naur

Form）是描述语言的形式化的数学方法，由John

Backus

（也许是Peter

Naur）开发，用于描述Algol

60编程语言的语法。

3、EBNF（扩展的BNF）使用花括号{…}表示重复，方括号[...]表示可选

EBNF中注意重复和可选的表示方法，语法图【可视的表示EBNF规则的图形表示法】

上下文无关文法说明程序设计语言的语法结构，利用了与正则表达式中极为类似的命名惯例和运算。

二者的主要区别在于上下文无关文法的规则是递归的（recursive）

最左推导（leftmostderivation）是指它的每一步中最左的非终结符都要被替换的推导

最右推导（rightmostderivation）则是指它的每一步中最右的非终结符都要被替换的推导。

最左推导和与其相关的分析树的内部节点的前序编号相对应；

最右推导则和后序编号相对应

最右推导的一个例子：

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 四川大学编译原理复习要点

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：四川大学编译原理复习要点文档格式.docx
链接地址：https://www.bdocx.com/doc/13482193.html

四川大学编译原理复习要点文档格式.docx

热门标签