时间:2022-10-09 18:02:37 | 浏览:296
作者:StarryLand
来源:
https://www.starky.ltd/2021/11/23/the-fastest-way-to-loop-in-python
众所周知,Python 不是一种执行效率较高的语言。此外在任何语言中,循环都是一种非常消耗时间的操作。假如任意一种简单的单步操作耗费的时间为 1 个单位,将此操作重复执行上万次,最终耗费的时间也将增长上万倍。
while
和for
是 Python 中常用的两种实现循环的关键字,它们的运行效率实际上是有差距的。比如下面的测试代码:
import timeit
def while_loop(n=100_000_000):
i = 0
s = 0
while i < n:
s += i
i += 1
return s
def for_loop(n=100_000_000):
s = 0
for i in range(n):
s += i
return s
def main:
print("while loop ", timeit.timeit(while_loop, number=1))
print("for loop ", timeit.timeit(for_loop, number=1))
if __name__ == "__main__":
main
# => while loop 4.718853999860585
# => for loop 3.211570399813354
这是一个简单的求和操作,计算从 1 到 n 之间所有自然数的总和。可以看到 for
循环相比while
要快 1.5 秒。
其中的差距主要在于两者的机制不同。
在每次循环中,while
实际上比for
多执行了两步操作:边界检查和变量i
的自增。即每进行一次循环,while 都会做一次边界检查 (while i < n
)和自增计算(i +=1
)。这两步操作都是显式的纯 Python 代码。
for
循环不需要执行边界检查和自增操作,没有增加显式的 Python 代码(纯 Python 代码效率低于底层的 C 代码)。当循环的次数足够多,就出现了明显的效率差距。
可以再增加两个函数,在 for
循环中加上不必要的边界检查和自增计算:
import timeit
def while_loop(n=100_000_000):
i = 0
s = 0
while i < n:
s += i
i += 1
return s
def for_loop(n=100_000_000):
s = 0
for i in range(n):
s += i
return s
def for_loop_with_inc(n=100_000_000):
s = 0
for i in range(n):
s += i
i += 1
return s
def for_loop_with_test(n=100_000_000):
s = 0
for i in range(n):
if i < n:
pass
s += i
return s
def main:
print("while loop ", timeit.timeit(while_loop, number=1))
print("for loop ", timeit.timeit(for_loop, number=1))
print("for loop with increment ",
timeit.timeit(for_loop_with_inc, number=1))
print("for loop with test ", timeit.timeit(for_loop_with_test, number=1))
if __name__ == "__main__":
main
# => while loop 4.718853999860585
# => for loop 3.211570399813354
# => for loop with increment 4.602369500091299
# => for loop with test 4.18337869993411
可以看出,增加的边界检查和自增操作确实大大影响了 for
循环的执行效率。
前面提到过,Python 底层的解释器和内置函数是用 C 语言实现的。而 C 语言的执行效率远大于 Python。
对于上面的求等差数列之和的操作,借助于 Python 内置的 sum
函数,可以获得远大于for
或while
循环的执行效率。
import timeit
def while_loop(n=100_000_000):
i = 0
s = 0
while i < n:
s += i
i += 1
return s
def for_loop(n=100_000_000):
s = 0
for i in range(n):
s += i
return s
def sum_range(n=100_000_000):
return sum(range(n))
def main:
print("while loop ", timeit.timeit(while_loop, number=1))
print("for loop ", timeit.timeit(for_loop, number=1))
print("sum range ", timeit.timeit(sum_range, number=1))
if __name__ == "__main__":
main
# => while loop 4.718853999860585
# => for loop 3.211570399813354
# => sum range 0.8658821999561042
可以看到,使用内置函数 sum
替代循环之后,代码的执行效率实现了成倍的增长。
内置函数 sum
的累加操作实际上也是一种循环,但它由 C 语言实现,而for
循环中的求和操作是由纯 Python 代码s += i
实现的。C > Python。
再拓展一下思维。小时候都听说过童年高斯巧妙地计算 1 到 100 之和的故事。1…100 之和等于 (1 + 100) * 50。这个计算方法同样可以应用到上面的求和操作中。
import timeit
def while_loop(n=100_000_000):
i = 0
s = 0
while i < n:
s += i
i += 1
return s
def for_loop(n=100_000_000):
s = 0
for i in range(n):
s += i
return s
def sum_range(n=100_000_000):
return sum(range(n))
def math_sum(n=100_000_000):
return (n * (n - 1)) // 2
def main:
print("while loop ", timeit.timeit(while_loop, number=1))
print("for loop ", timeit.timeit(for_loop, number=1))
print("sum range ", timeit.timeit(sum_range, number=1))
print("math sum ", timeit.timeit(math_sum, number=1))
if __name__ == "__main__":
main
# => while loop 4.718853999860585
# => for loop 3.211570399813354
# => sum range 0.8658821999561042
# => math sum 2.400018274784088e-06
最终 math sum 的执行时间约为 2.4e-6
,缩短了上百万倍。这里的思路就是,既然循环的效率低,一段代码要重复执行上亿次。
索性直接不要循环,通过数学公式,把上亿次的循环操作变成只有一步操作。效率自然得到了空前的加强。
最后的结论(有点谜语人):
实现循环的最快方式—— —— ——就是不用循环
对于 Python 而言,则尽可能地使用内置函数,将循环中的纯 Python 代码降到最低。
The Fastest Way to Loop in Python - mCoding (https://youtu.be/Qgevy75co8c)
Python是一门很出色的胶水语言,也就是当我们有现成的组件后,Python非常适合将他们组装起来。机器学习的例子就比较典型。我们用C++写好Tensorflow,用C写好Numpy,用Scala写好Spark,现在想用这些组件训练一个机器
写在最前面其实想学习编程很久了,以前也陆陆续续学习过一段时间的编程,但总是半途而废,经过我长达三秒钟的思考,总结出以下两个方面的原因:1、没有学习的压力。因为我不是程序员,编程不是我吃饭的家伙,会不会编程并不会影响什么,但我又觉得编程是一件
苹果与安卓最大的不同在于对于媒体评测机有严格的要求,必须在官方统一安排的时间之内发出,如果提前发出那不仅仅是面临罚款的问题,甚至是以后合作的机会都没有了。这不iPhone 14系列的评测解禁就安排在了9月14日晚,现在给大家汇总下评测体验部
一、强类型和弱类型语言:C、 C++、 Java 、Python都是强类型的语言。PHP是弱类型的语言。强类型语言是一种强制类型定义的语言,即一旦某一个变量被定义类型,如果不经强制转换,那么它永远就是该数据类型。而弱类型语言是一种弱类型定义
乾明 发自 凹非寺 量子位 报道 | 公众号 QbitAIPython势头不减,依旧第一,而且进一步拉开了与其他语言的差距。这一结果,来自IEEE Spectrum2019年度编程语言排行榜。这已经是Python连续3年保持第一。在Pyth
首先,我们先普及一下编程语言的基础知识。用任何编程语言来开发程序,都是为了让计算机干活,比如编写一篇文章,下载一首MP3等,而计算机干活的CPU只认识机器的指令,所以,尽管不同的编程语言差异极大,最后都得“翻译”成CPU可以执行的机器指令。
全球知名TIOBE 编程语言社区发布了11 月编程语言排行榜。下面让我们一起来看看,本月榜单中有哪些值得注意的新变化吧!01PHP即将跌出前十自 20 多年前 TIOBE 指数开始发布以来,PHP 一直常驻在榜单前十,然而最近,该语言已经开
【51CTO.com快译】在本文中,我们将逐一介绍目前人气较高的三种编程语言:PHP、Ruby和Python。我们将分析它们是如何工作的,它们彼此有何不同,谁在使用它们,以及每种语言受欢迎的程度。一、 PHP:互联网上最受欢迎的脚本语言PH
TIOBE 编程社区指数是编程语言流行程度的指标。该指数每月更新一次。评级基于全球熟练工程师、课程和第三方供应商的数量。谷歌、必应、雅虎、维基百科、亚马逊、YouTube 和百度等流行搜索引擎用于计算评分。需要注意的是,TIOBE 指数与最
IT行业现在依然是求职转行人群的首选,那么当下的IT培训机构中IT技术课程类目繁多,尤其是Java培训,PHP培训,Python培训以及前端培训最火,零基础人员如何选择一种适合自己的编程开发语言课程去学习入行呢?前三者属于后端的开发语言,我