书签分享收藏举报版权申诉 / 20

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 法律资料 > python项目实践.docx

python项目实践.docx

文档编号：11694676
上传时间：2023-03-30
格式：DOCX
页数：20
大小：485.06KB

python项目实践.docx

《python项目实践.docx》由会员分享，可在线阅读，更多相关《python项目实践.docx（20页珍藏版）》请在冰豆网上搜索。

python项目实践.docx

python项目实践

python项目练习一：

即时标识表记标帜60837°C之宇文皓月创作

这是《python基础教程》后面的实践，照着写写，一方面是来熟悉python的代码方式，另一方面是练习使用python中的基本的以及非基本的语法，做到熟能生巧。

这个项目一开始比较简单，不过重构之后就有些复杂了，但是更灵活了。

依照书上所说，重构之后的程序，分为四个模块：

处理程序模块，过滤器模块，规则（其实应该是处理规则），语法分析器。

先来说处理程序模块，这个模块的作用有两个，一个是提供那些固定的html标识表记标帜的输出（每一个标识表记标帜都有start和end），另一个是对这个标识表记标帜输出的开始和结束提供了一个友好的访问接口。

来看下程序handlers.py：

classHandler:

'''

defcallback（self,prefix,name,*args）:

method=getattr（self,prefix+name,None）

ifcallable（method）:

returnmethod（*args）

defstart（self,name）:

self.callback（'start_',name）

defend（self,name）:

self.callback（'end_',name）

defsub（self,name）:

defsubstitution（match）:

result=self.callback（'sub_',name,match）

ifresultisNone:

match.group（0）

returnresult

returnsubstitution

classHTMLRenderer（Handler）:

'''

defstart_document（self）:

print'...'

defend_document（self）:

print''

defstart_paragraph（self）:

print'

'

defend_paragraph（self）:

print'

'

defstart_heading（self）:

print'

'
defend_heading（self）:
print'

'

defstart_list（self）:

print'

defend_list（self）:

print'

'

defstart_listitem（self）:

print'

'

defend_listitem（self）:

print'

'

defstart_title（self）:

print'

'
defend_title（self）:
print'

'

defsub_emphasis（self,match）:

return'%s'%match.group

（1）

defsub_url（self,match）:

return'%s'%（match.group

（1）,match.group

（1））

defsub_mail（self,match）:

return'

%s">%s'%（match.group

（1）,match.group

（1））

deffeed（self,data）:

printdata

这个程序堪称是整个“项目”的基石所在：

提供了标签的输出，以及字符串的替换。

理解起来也比较简单。

再来看第二个模块“过滤器”，这个模块更为简单，其实就是一个正则表达式的字符串。

WelcometomyHomepage

Hi,there.MynameisMr.gumby,andthisismyhomepage,herearesomeofmyint:

Shouting

Sleeping

Eating

shoutingpage

....

sleepingpage

...

Eatingpage

....

有了这个文件，下面应该来看怎么通过这个文件生成网站。

首先我们要解析这个xml文件，python解析xml和在java中一样，有两种方式，SAX和DOM，两种处理方式分歧点在于速度和范围，前者讲究的是效率，每次只处理文档的一小部分，快速而能有效的利用内存，后者是相反的处理方式，先把所有的文档载入到内存，然后再进行处理，速度比较慢，也比较消耗内存，唯一的好处就是可以操纵整个文档。

在python中使用sax方式处理xml要先引入xml.sax中的parse函数，还有xml.sax.handler中的ContentHandler，后面的这个类是要和parse函数来配合使用的。

使用方式如下：

parse（'xxx.xml',xxxHandler）,这里面的xxxHandler要继承上面的ContentHandler，不过只要继承就行，不需要有所作为。

然后这个parse函数在处理xml文件的时候，会调用xxxHandler中的startElement函数和endElement函数来一个xml中的标签的开始和结束，中间的过程使用一个名为characters的函数来处理标签内部的所有字符串。

有了上面的这些认识，我们已经知道如何处理xml文件了，然后再来看那个罪恶的源头website.xml文件，分析其结构，只有两个节点：

page和directory，很明显page暗示一个页面，directory暗示一个目录。

所以处理这个xml文件的思路就变的清晰了。

读取xml文件的每一个节点，然后判断是page还是directory如果是page则创建html页面，然后把节点中的内容写到文件里。

如果遇到directory就创建一个文件夹，然后再处理其内部的page节点（如果存在的话）。

下面来看这部分代码，书中的实现比较复杂，比较灵活。

先来看，然后在分析。

fromxml.sax.handlerimportContentHandler

fromxml.saximportparse

importos

classDispatcher:

defdispatch（self,prefix,name,attrs=None）:

mname=prefix+name.capitalize（）

dname='default'+prefix.capitalize（）

method=getattr（self,mname,None）

ifcallable（method）:

args=（）

else:

method=getattr（self,dname,None）

args=name,

ifprefix=='start':

args+=attrs,

ifcallable（method）:

method（*args）

defstartElement（self,name,attrs）:

self.dispatch（'start',name,attrs）

defendElement（self,name）:

self.dispatch（'end',name）

classWebsiteConstructor（Dispatcher,ContentHandler）:

passthrough=False

def__init__（self,directory）:

self.directory=[directory]

self.ensureDirectory（）

defensureDirectory（self）:

path=os.path.join（*self.directory）

printpath

print''

ifnotos.path.isdir（path）:

os.makedirs（path）

defcharacters（self,chars）:

ifself.passthrough:

self.out.write（chars）

defdefaultStart（self,name,attrs）:

ifself.passthrough:

self.out.write（'<'+name）

forkey,valinattrs.items（）:

self.out.write（'%s="%s"'%（key,val））

self.out.write（'>'）

defdefaultEnd（self,name）:

ifself.passthrough:

self.out.write（''%name）

defstartDirectory（self,attrs）:

self.directory.append（attrs['name']）

self.ensureDirectory（）

defendDirectory（self）:

print'endDirectory'

self.directory.pop（）

defstartPage（self,attrs）:

print'startPage'

filename=os.path.join（*self.directory+[attrs['name']+'.html']）

self.out=open（filename,'w'）

self.writeHeader（attrs['title']）

self.passthrough=True

defendPage（self）:

print'endPage'

self.passthrough=False

self.writeFooter（）

self.out.close（）

defwriteHeader（self,title）:

self.out.

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: python 项目实践

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：python项目实践.docx
链接地址：https://www.bdocx.com/doc/11694676.html

python项目实践.docx

'defend_heading（self）:print'

'defend_title（self）:print'

WelcometomyHomepage

shoutingpage

sleepingpage

Eatingpage

热门标签

'
defend_heading（self）:
print'

'
defend_title（self）:
print'