时间:2022-10-09 17:56:33 | 浏览:353
本文摘自人民邮电出版社异步社区《Python物理学高效计算》一书
许多人都认为Python是一门伟大编程语言。没错,但什么是Python,其优点又是什么?Python是一款易学的通用、动态且高阶的语言。Python能够很好地与其他语言交互(如C、C++、Fortran),因此也被称为胶水语言。由于这些优点,Python已经成为一门强大的数据分析语言。在科学和工程方面,特别是物理相关领域大放光彩。
Python主要的缺点是其性能不高。Python是一款解释型语言,与R、Ruby、Matlab相似,而与C、C++、Fortran这些编译型语言差别较大。Python用户信奉“过早优化是万恶之源”,通常用以下观点反驳针对Python性能的批评。
开发时间(开发者编写程序的时间)比程序运行时间更宝贵。
大部分性能相关的问题都能通过使用合适的数据结构和算法来解决。
如果确实需要关注性能,可以用编译型语言编写性能瓶颈,然后在Python中调用相关函数。
Python最重要的一点在于使用起来非常有趣。越学越想学,继而能掌握更多的内容。Python生态系统非常丰富,同时还有庞大、友善的社区。但本书无法一一介绍Python所有的优点。本章将初步介绍Python的基础语法。而关于Python安装说明,请参考前言。
1.1 运行Python
Python本身是一种被称为解释器的特殊程序,这个程序将Python源代码转换成计算机处理器可以理解的指令。Python解释器有多种启动方式。最基本的方式是在终端的提示符中输入python,通常会显示一些关于Python自身的信息。接下来是以“>>>”起始的行,这是Python提示符,在此可以输入Python代码:
输入相关代码,按回车键执行,最后回到“>>>”提示符中:
若想获得帮助,可以随时使用help()函数。而用exit()函数可以回到命令行。这种方式与bash很像,因为Python的交互方式与bash完全相同,都是“读取—运算—输出”循环(read-eval print loop),简称REPL。
但Python中并不是只有死板的REPL。IPython(即Interactive Python)提供了更强大的REPL。读者可以通过下面的方式获取IPython。
1.访问ipython.org,下载最新的稳定发布版。
2.如果使用的是Conda包管理器(前言中介绍过),并且运行了前言中“安装和设置”一节中列出的命令,那么应该可以使用IPython了。读者可以运行conda update ipython来确保机器上使用的是最新版本。
3.如果安装了Python,可以使用pip install ipython安装。
4.如果使用的是Ubuntu,运行命令sudo apt-get install ipython。
启动IPython并在其中执行代码,如下所示:
除了基于文本的REPL,IPython还提供了基于Web浏览器的notebook,其使用方式和外观与Mathematica或MATLAB的notebook非常相似。这些notebook都是非常好的数据分析平台,且正在快速成为创建和分享信息的标准方式。强烈建议读者去了解一下。
虽然REPL很有用,但也有诸多缺点。首先是REPL在使用多行代码时比较难、繁琐且容易出错。其次是很难将代码保存到普通文件中。因此很难将在REPL环境中完成的工作分享给他人。
大部分人一般在文本文件中编写Python代码。如果对以.py结尾的文件运行解释器,Python会执行其中所有的代码,就如同在REPL中逐行执行一样。
例如有一个名为greetings.py的文件,含有下面的内容:
在bash中执行会得到下面的结果:
在学会如何运行Python代码后,下面来学习语言本身。
1.2 注释
所有现代编程语言都有注释字符。注释字符会让解释器忽略一部分字符,让开发者能够在相关代码附近撰写一些说明或解释。Python使用“#”字符表示注释内容。解释器会忽略掉#之后位于同一行的所有内容,Python没有多行注释:
1.3 变量
变量由两部分组成:名称和值。若想为一个名称给定一个值,需要用到单个等号(=)。将变量的名称放在等号的左边,值放在右边。变量的名字可由大小写字母、数字(0~9)、下划线()组成。下面是hbar变量,表示约化普朗克常数(reduced Planck constant,即狄拉克常数):
变量名称不能以数字开头,此举是为了防止用户重新定义数值字面值。变量必须以字母或下划线开头。
记住,变量名称不能以数字开头!
2plus_forty = 42 # bad
two_plus40 = 42 # good
定义完变量后,就可以随意使用或操作这个变量了。假设需要打印普郎克常数。首先定义π,接着用h_bar乘以2π:
在Python中,所有变量都有确定的类型,这意味着这些值具有明确定义的属性,用于指定其使用方式。各种类型有针对特定用途的专门属性。整数(int)和浮点数(float)用于数学计算;字符串(str)用于文本处理。这些都是字面类型,因为Python提供了专门的语法用于直接创建这些类型:
整数和字符串有时称为精确类型,因为所有精确类型的变量都能在底层精确表示。整数1就是1,不会是其他内容。但浮点数是不精确类型。
一般来说,浮点数是实数的64位近似值φ。有些浮点数(如1.0),可以用有限的数据表示,但其他浮点数可能不是精确值。这会让科学计算出现许多问题。更多信息请阅读David Goldberg的《What Every ComputerScientist Should Know About Floating- Point Arithmetic》。
如果不清楚变量,可以使用内置的type()函数查看。使用这个函数时,将需要检查的变量放在括号中。
Pothm中还可以使用类型名称来转换变量类型。首先输入类型名称,在其后跟上括号,括号里面是需要转换的变量。
在表达式int("28")中,字符串"28"转换成了整数,这是因为该字符串中的内容正好都是数字。如果字符串中的内容不能表示一个整数,则会转换失败,如下所示:
(1)这里产生一个错误(ValueError)。
(2)错误的位置(指出是在文件中还是在交互式解释器中)。
(3)发生错误位置的行号,以及偏移量。
(4)最后是最重要的错误消息。请仔细阅读这条信息。如果错误信息不清晰或读不懂,可以在网上以错误信息作为关键字进行搜索。
这是Python标准的处理模式,能激发开发者的探索和创造能力。如果某个操作无法进行下去,那么代码应尽早报错并返回有用的错误消息。这种“早撞墙早回头”的信条是交互式开发过程的核心,能鼓励程序员不停地试验,针对错误调整代码再次尝试,重复这个过程直到代码收敛为工作版本。在前面的示例中,“quark”是个字符串,不是基数为10的数值。为了修改这个错误,最好将值更改为仅由数字组成的字符串。
Python是动态类型的,这意味着以下几点。