|
|
|
|
移动端

1.5.2 主要的语法差异和常见陷阱

《Python高级编程(第2版)》第1章Python现状,本章将会向读者介绍一下Python 3的当前现状,同时介绍Python的现代开发方法。本节为大家介绍主要的语法差异和常见陷阱。

作者:张亮/阿信 译来源:人民邮电出版社|2018-01-29 17:46

技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战

1.5.2 主要的语法差异和常见陷阱

要比较不同版本之间的差异,最好的参考资料就是Python文档。不过为了方便读者,本节总结了其中最重要的内容。但不熟悉Python 3的读者还是要去阅读官方文档。

Python 3引入的重要差异一般可分为以下几个方面。


语法变化,删除/修改了一些语法元素,并添加了一些新的语法元素。

标准库中的变化。

数据类型与集合的变化。

1.语法变化

有些语法变化会导致当前代码无法运行,这些变化是最容易发现的,它们会导致代码根本无法运行。包含新语法元素的Python 3代码在Python 2中无法运行,反之亦然。由于删除了某些元素,导致Python 2代码显然无法与Python 3兼容。运行有这些问题的代码时,解释器很快就会抛出SyntaxError异常。下面是一个无法运行的脚本示例,只包含两个语句,都会引发语法错误而无法运行:

  1. print("hello world")  
  2. print "goodbye python2" 

上述代码在Python 3中的实际运行结果如下:

  1. $ python3 script.py  
  2.   File "script.py", line 2  
  3.     print "goodbye python2"  
  4.                          ^  
  5. SyntaxError: Missing parentheses in call to 'print' 

列出所有的语法差异会比较长,而且Python 3.x的新版本也会不时添加新的语法元素,在较早版本的Python中就会引发错误(即使在相同的3.x版本上也会报错)。其中最重要的语法差异将会在第2章和第3章中讲到,所以这里无需全部列出。

与Python 2.7相比,删除或改动的内容要相对少一些,下面给出最重要的变化内容。

print不再是一条语句而是一个函数,所以必须加上括号。

捕获异常的语法由except exc, var改为except exc as var。

弃用比较运算符<>,改用!=。

from module import *(https://docs.python.org/3.0/reference/simple_stmts.html#import)现在只能用于模块,不能用在函数中。

现在from .[module] import name是相对导入的唯一正确的语法。所有不以点字符开头的导入都被当作绝对导入。

sorted函数与列表的sort方法不再接受cmp参数,应该用key参数来代替。

整数除法表达式(如1/2)返回的是浮点数。取整运算可以用//运算符,如1//2。这样做的好处是浮点数也可以用这个运算符,所以5.0//2.0 == 2.0。

2.标准库中的变化

语法变化很容易发现,标准库中的重大变化也是非常容易发现的。Python的每个后续版本都会向标准库模块中添加、弃用、改进或完全删除某些内容。在旧版Python(1.x和2.x)中也会定期有这样的变化,所以出现在Python 3中并不让人吃惊。大多数情况下,对于删除或重组的模块(例如urlparse移到了urllib.parse),在运行解释器时会对导入语句抛出异常。这样的问题很容易发现。无论如何,为了确保能够发现所有类似的问题,完整的代码测试覆盖率是必不可少的。在某些情况下(例如使用延迟加载模块时),这个通常在全局导入时出现的问题并不会出现,直到在代码中将某些模块作为函数调用时才会出现。因此,在测试期间确保每行代码都要实际运行是很重要的。

延迟加载模块

延迟加载模块是指在全局导入时并不加载的模块。在Python中,import语句可以包含在函数内部,这样导入是在函数调用时才会发生,而不是在全局导入时发生。在某些情况下,模块的这种加载方式可能比较合理,但大多数情况下,这只是对设计不佳的模块结构的变通方法(例如避免循环导入),通常应避免这种加载方式。当然,对于标准库模块来说,没有理由使用延迟加载。

3.数据类型与集合的变化

开发人员在努力保持兼容性或只是将现有代码迁移到Python 3上时,需要特别注意Python中数据类型与集合的表示方式的变化。虽然不兼容的语法变化或标准库变化很容易发现,也很容易修复,但集合与数据类型的变化要么难以察觉,要么需要大量的重复工作。这样的变化列表会很长,再次重申,官方文档是最好的参考资料。

不过,这一节必须讲一下Python 3中字符串处理方式的变化,因为这是Python 3中最具争议也是讨论最多的变化,尽管这是一件好事,使很多问题变得更加明确。

现在所有字符串都是Unicode,字节(bytes)需要加一个b或B的前缀。Python 3.0和3.1不支持使用u前缀(例如u"foo"),使用的话会引发语法错误。不支持这个前缀是引发所有争议的主要原因。这导致难以编写能够兼容Python不同分支的代码,2.x版需要用这个前缀来创建Unicode。Python 3.3又恢复了这个前缀,虽然没有任何语法上的意义,只是为了简化兼容过程。

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

数据库加密——最后的防线

本书是关于如何使用已有的密码技术和算法对数据库中存储的信息进行保护的书,书中所关注的内容主要是如何设计、建立(或者挑选、集成)一套...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊