15.5 小结
下面总结了本章介绍的主题。
屏幕抓取:指的是自动下载网页并从中提取信息。程序Tidy及其库版本是很有用的工具,可用来修复格式糟糕的HTML,然后使用HTTML解析器进行解析。另一种抓取方式是使用Beautiful Soup,即便面对混乱的输入,它也可以处理。
CGI:通用网关接口是一种创建动态网页的方式,这是通过让Web服务器运行、与客户端程序通信并显示结果而实现的。模块cgi和cgitb可用于编写CGI脚本。 CGI脚本通常是在HTML表单中调用的。
Flask:一个简单的Web框架,让你能够将代码作为Web应用发布,同时不用过多操心Web部分。
Web应用框架:要使用Python开发复杂的大型Web应用, Web应用框架必不可少。对简单的项目来说, Flask是不错的选择;但对于较大的项目,你可能应考虑使用Django或TurboGears。
Web服务:Web服务之于程序犹如网页之于用户。你可以认为, Web服务让你能够以更抽象的方式进行网络编程。常用的Web服务标准包括RSS(以及与之类似的RDF和Atom)、XML-RPC和SOAP。
15.5.1 本章介绍的新函数
函 数 描 述
cgitb.enable() 在CGI脚本中启用栈跟踪
15.5.2 预告
你肯定通过运行前面编写的程序对其进行了测试。在下一章,你将学习如何对程序进行真正的测试——详尽、系统乃至令人乐此不疲。
领取专属 10元无门槛券
私享最新 技术干货