Python多线程 vs 多进程最佳实践：性能优化全攻略

原创

Echo_Wish

发布于 2025-07-18 09:56:12

4830

文章被收录于专栏：云社区活动云社区活动

Python多线程 vs 多进程最佳实践：性能优化全攻略

🧭 前言：你真的知道该选多线程还是多进程吗？

作为一个经常在代码世界里摸爬滚打的程序员，我发现“多线程”和“多进程”这两个词，就像武林中的“葵花宝典”和“九阳神功”，都很牛，但用不好就伤自己。

你可能已经听说过这样的说法：

“Python的多线程根本没用，GIL限制住了！”
“多进程开销太大，别乱用！”

这些说法有点道理，但并不全面。本文我将用通俗的方式+实战代码+实测对比，为你揭开“多线程 vs 多进程”的面纱，教你如何在不同场景下做出最优选择。

🧠 一、基础扫盲：多线程 vs 多进程到底区别在哪？

先说结论，多线程适合 I/O密集型任务，多进程适合 CPU密集型任务。为啥？

GIL 是什么鬼？

Python的“全局解释器锁（GIL）”限制了同一时刻只能有一个线程在执行 Python 字节码。所以在 CPU 密集型任务中，即使你开多个线程，实际也只有一个线程在工作，性能提升微乎其微。

但对于 I/O 密集型任务（比如网络请求、磁盘读写），线程在等待数据时会释放 GIL，其他线程可以趁机运行，从而实现“并发加速”。

🚀 二、实战演练：来，跑个多线程和多进程试试看！

我们分别用线程和进程来执行两个任务场景：

任务1：模拟I/O密集型操作（爬虫请求）

import threading
import multiprocessing
import time
import requests

def fetch_url():
    requests.get("https://httpbin.org/delay/1")  # 模拟网络延迟1秒

def run_threads():
    threads = []
    start = time.time()
    for _ in range(10):
        t = threading.Thread(target=fetch_url)
        t.start()
        threads.append(t)
    for t in threads:
        t.join()
    print("线程耗时：", time.time() - start)

def run_processes():
    processes = []
    start = time.time()
    for _ in range(10):
        p = multiprocessing.Process(target=fetch_url)
        p.start()
        processes.append(p)
    for p in processes:
        p.join()
    print("进程耗时：", time.time() - start)

if __name__ == '__main__':
    print("=== I/O 密集型测试 ===")
    run_threads()
    run_processes()

输出示例（大概时间）：

线程耗时：约1.1秒
进程耗时：约2.8秒

结论：线程完胜！ 多线程由于开销小，能更快处理I/O等待任务。

任务2：模拟CPU密集型任务（计算斐波那契）

def fib(n):
    if n <= 2:
        return 1
    return fib(n - 1) + fib(n - 2)

def run_threads_cpu():
    threads = []
    start = time.time()
    for _ in range(4):
        t = threading.Thread(target=fib, args=(35,))
        t.start()
        threads.append(t)
    for t in threads:
        t.join()
    print("线程耗时：", time.time() - start)

def run_processes_cpu():
    processes = []
    start = time.time()
    for _ in range(4):
        p = multiprocessing.Process(target=fib, args=(35,))
        p.start()
        processes.append(p)
    for p in processes:
        p.join()
    print("进程耗时：", time.time() - start)

if __name__ == '__main__':
    print("=== CPU 密集型测试 ===")
    run_threads_cpu()
    run_processes_cpu()

输出示例：

线程耗时：约9秒
进程耗时：约2.8秒

结论：进程大胜！ CPU密集任务受GIL影响，线程间抢资源，反而更慢。

🛠️ 三、开发实战中如何选择？一张表告诉你：

场景	优先选择	说明
网络请求、文件读写	多线程	等待时会释放GIL
图像处理、数据分析、模型训练	多进程	多核优势明显
任务较多、启动频繁	多线程	线程开销小
任务耗时长、需要隔离性强	多进程	更稳定，不怕崩一个拖全家
想避免GIL影响	多进程	天生多核并发

🧩 四、进阶技巧与补充建议

1. 推荐库：`concurrent.futures`

Python 提供的标准库 ThreadPoolExecutor 和 ProcessPoolExecutor 简直就是并发神器，使用起来很优雅。

from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor

with ThreadPoolExecutor(max_workers=5) as executor:
    results = list(executor.map(fetch_url, range(10)))

with ProcessPoolExecutor(max_workers=4) as executor:
    results = list(executor.map(fib, [35]*4))

2. CPU 核心数怎么获取？

import os
print(os.cpu_count())  # 用于设置多进程数

3. 避免陷阱：不要在线程/进程里频繁创建资源（数据库连接、文件句柄），资源泄露难调试。

🧯 五、常见坑 & 解决方法

问题	解决方案
子进程不能在 Jupyter Notebook 中用	使用 `if __name__ == '__main__':` 包裹
多线程无法加速 CPU 任务	换成多进程或使用 C 扩展，如 NumPy、Cython
子线程未结束主线程就退出	使用 `.join()` 等待线程/进程全部结束

🎯 结语：会用工具的人，才是真正的高手！

多线程和多进程不是对立的选择，而是各有优势的利器。关键在于你是否了解自己的任务类型——是大量的I/O？还是拼命卷CPU？

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S14#补给站

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S14#补给站

登录后参与评论

0 条评论

热度

Python多线程 vs 多进程最佳实践：性能优化全攻略

Python多线程 vs 多进程最佳实践：性能优化全攻略

Python多线程 vs 多进程最佳实践：性能优化全攻略

🧭 前言：你真的知道该选多线程还是多进程吗？

🧠 一、基础扫盲：多线程 vs 多进程到底区别在哪？

GIL 是什么鬼？

🚀 二、实战演练：来，跑个多线程和多进程试试看！

任务1：模拟I/O密集型操作（爬虫请求）

任务2：模拟CPU密集型任务（计算斐波那契）

🛠️ 三、开发实战中如何选择？一张表告诉你：

🧩 四、进阶技巧与补充建议

1. 推荐库：`concurrent.futures`

2. CPU 核心数怎么获取？

3. 避免陷阱：不要在线程/进程里频繁创建资源（数据库连接、文件句柄），资源泄露难调试。

🧯 五、常见坑 & 解决方法

🎯 结语：会用工具的人，才是真正的高手！

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Python多线程 vs 多进程最佳实践：性能优化全攻略

Python多线程 vs 多进程最佳实践：性能优化全攻略

Python多线程 vs 多进程最佳实践：性能优化全攻略

🧭 前言：你真的知道该选多线程还是多进程吗？

🧠 一、基础扫盲：多线程 vs 多进程到底区别在哪？

GIL 是什么鬼？

🚀 二、实战演练：来，跑个多线程和多进程试试看！

任务1：模拟I/O密集型操作（爬虫请求）

任务2：模拟CPU密集型任务（计算斐波那契）

🛠️ 三、开发实战中如何选择？一张表告诉你：

🧩 四、进阶技巧与补充建议

1. 推荐库：concurrent.futures

2. CPU 核心数怎么获取？

3. 避免陷阱：不要在线程/进程里频繁创建资源（数据库连接、文件句柄），资源泄露难调试。

🧯 五、常见坑 & 解决方法

🎯 结语：会用工具的人，才是真正的高手！

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

1. 推荐库：`concurrent.futures`