大家好,欢迎来到 Crossin的编程教室~
一组1000万个0~100的整数序列,用它来生成一个新的序列,要求如果原本序列中是奇数就不变,如果是偶数就变成原来的一半。
你会怎么写?
来看几份参考答案:
青铜:
def for_method(data):
result = []
for x in data:
if x % 2 == 0:
result.append(x // 2)
else:
result.append(x)
return result
(自测耗时:0.95秒)
新建一个空列表,for循环遍历原列表,依次判断每个元素,如果能被2整除就除以2添加进新列表,否则直接添加进新列表。
白银:
def lc_method(data):
return [x if x % 2 else x // 2 for x in data]
(自测耗时:0.75秒)
通过列表解析式生成新列表,不仅代码更简洁明了,耗时还变少了。
黄金:
def numpy_method(data):
arr = np.array(data)
return np.where(arr % 2 == 0, arr // 2, arr).tolist()
(自测耗时:0.90秒)
用numpy的where方法生成新的数组。看起来效率好像还不如列表解析式嘛?这是因为大部分时间都花在了列表和ndarray的转换上。如果这组序列本身就用numpy的数组来存储的话:
def numpy_array_method(data):
return np.where(data % 2 == 0, data // 2, data)
(自测耗时:0.32秒)
速度直接碾压列表解析式。
王者:
@numba.jit(nopython=True)
def numba_method(data):
result = np.copy(data)
for i in range(len(data)):
if result[i] % 2 == 0:
result[i] //= 2
return result
(自测耗时:0.65秒)
还是用for循环,不过给函数加上一个装饰器,表示用Numba JIT编译,这个看起来平平无奇的写法会有什么效果呢?好像也没有比直接用numpy快多少嘛?
别急,让我们加大剂量,把序列长度调整到1亿,优势就体现出来了。(numba:1.21秒 vs numpy:3.04秒)
你还有其他写法吗?
作者:Crossin的编程教室
本文分享自 Crossin的编程教室 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!