协程与线程的区别

协程(Coroutine)和线程(Thread)都是实现并发编程的方式，但它们在设计理念、实现机制和使用场景上有显著区别。

基本概念

线程(Thread):

线程是操作系统层面的概念，是CPU调度的基本单位
一个进程可以包含多个线程，这些线程共享进程的资源
线程的创建、调度和销毁都由操作系统内核负责
线程间的切换需要内核参与，涉及用户态到内核态的转换

协程(Coroutine):

协程是程序语言层面的概念，也称为"微线程"、"纤程"
协程由程序员在代码中显式创建和调度
协程的切换完全在用户态完成，不需要内核参与
协程的调度策略由程序逻辑控制，而非操作系统调度器

调度方式对比

特性	线程	协程
调度主体	操作系统内核	用户程序/运行时
调度方式	抢占式调度	协作式调度
调度时机	时间片用完、I/O阻塞、高优先级线程就绪等	显式让出(yield)、等待I/O、等待其他协程等
调度策略	基于优先级、时间片轮转等	由程序逻辑控制，如FIFO、优先级等
并行性	多核CPU上真正并行执行	单线程内无法并行，多线程协程可并行

线程调度:

操作系统内核负责线程的调度，采用抢占式调度方式
内核决定何时切换线程，线程无法控制自己的执行时间
调度时机不受线程控制，可能在任何指令处被中断

协程调度:

协程采用协作式调度，协程主动让出控制权
协程只在特定的点(如await、yield等)进行切换
调度时机由程序逻辑控制，更加可预测

资源消耗对比

资源类型	线程	协程
内存消耗	每个线程需要独立的栈空间(通常1-8MB)	协程栈空间小(通常几KB到几十KB)，可动态增长
创建成本	需要系统调用，创建成本高	在用户空间创建，成本极低
上下文大小	包含寄存器、栈指针、程序计数器等内核资源	仅包含少量寄存器和程序状态
数量限制	受系统资源限制，通常一台机器只能创建几千到几万个线程	理论上可创建数百万个协程
CPU缓存	线程切换可能导致CPU缓存失效	协程切换在同一个线程内，CPU缓存利用率高

线程资源消耗:

每个线程都有独立的栈空间，通常为1-8MB
线程的创建和销毁需要系统调用，涉及内核资源分配
线程间的切换需要保存和恢复大量寄存器状态、栈指针、程序计数器等信息
线程数量受限于系统资源，一台机器通常只能创建几千到几万个线程

协程资源消耗:

协程的栈空间可以很小(通常几KB到几十KB)，并且可以动态增长
协程的创建和销毁完全在用户空间完成，不涉及系统调用
协程切换只需要保存和恢复少量寄存器状态和程序计数器
协程数量几乎不受限制，理论上可以创建数百万个协程

切换成本对比

切换方面	线程	协程
切换位置	内核态	用户态
切换成本	高(需要保存/恢复大量上下文，涉及系统调用)	低(仅需保存/恢复少量寄存器，无需系统调用)
切换时间	通常为微秒(μs)级别	通常为纳秒(ns)级别
缓存影响	切换可能导致CPU缓存失效，影响性能	同一线程内切换，CPU缓存利用率高
预测性	抢占式调度，切换时机不可预测	协作式调度，切换时机可预测

线程切换成本:

线程切换需要从用户态切换到内核态，这是一个昂贵的操作
需要保存和恢复线程的完整上下文，包括所有寄存器、栈指针、程序计数器等
线程切换可能导致CPU缓存失效，影响后续执行的性能
线程切换通常需要几微秒到几十微秒的时间

协程切换成本:

协程切换完全在用户态进行，不需要系统调用
只需要保存和恢复少量寄存器状态和程序计数器
协程切换在同一个线程内进行，CPU缓存利用率高
协程切换通常只需要几十到几百纳秒的时间

编程模型对比

特性	线程	协程
编程范式	命令式，共享内存+锁	事件驱动，异步/await
同步机制	锁、信号量、条件变量等	通道、Future/Promise、async/await等
错误处理	异常在线程内传播，跨线程需特殊处理	异常可在协程间传播，处理更自然
代码结构	线性执行，回调地狱问题	可用同步风格写异步代码，避免回调地狱
调试难度	较高，并发问题难以复现	相对较低，执行顺序更可控

线程编程模型:

线程编程通常采用命令式范式，通过共享内存和锁来实现同步
需要处理复杂的同步问题，如死锁、竞态条件等
异常处理在线程内传播，跨线程通信需要特殊机制
调试多线程程序比较困难，因为并发问题难以复现和定位

协程编程模型:

协程编程通常采用事件驱动范式，通过async/await语法简化异步编程
使用通道、Future/Promise等机制进行协程间通信，避免共享状态
异常处理更加自然，可以在协程间传播
代码结构更清晰，可以用同步风格写异步代码，避免回调地狱

# 线程示例代码
import threading
import time

def worker():
    print("Thread started")
    time.sleep(1)
    print("Thread finished")

threads = []
for i in range(5):
    t = threading.Thread(target=worker)
    threads.append(t)
    t.start()

for t in threads:
    t.join()

print("All threads finished")

# 协程示例代码 (Python 3.5+)
import asyncio

async def worker():
    print("Coroutine started")
    await asyncio.sleep(1)
    print("Coroutine finished")

async def main():
    tasks = [asyncio.create_task(worker()) for _ in range(5)]
    await asyncio.gather(*tasks)
    print("All coroutines finished")

asyncio.run(main())

适用场景对比

场景	线程	协程
CPU密集型任务	适合，可以利用多核并行计算	不适合，单线程内无法并行
I/O密集型任务	可以使用，但资源消耗大	非常适合，资源消耗小，切换成本低
高并发场景	受限于线程数量，扩展性差	非常适合，可支持大量并发连接
实时性要求	抢占式调度，响应时间不确定	协作式调度，响应时间更可预测
编程复杂度	较高，需要处理同步问题	较低，异步编程更直观

线程适用场景:

CPU密集型任务：可以利用多核CPU的并行计算能力
需要充分利用多核资源的场景
对实时性要求不高，可以接受抢占式调度的不确定性
已有大量基于线程的代码库和经验

协程适用场景:

I/O密集型任务：如网络请求、文件操作等，协程可以高效处理大量I/O等待
高并发场景：如Web服务器、聊天应用等，需要处理大量并发连接
对资源消耗敏感的场景：如嵌入式系统、移动设备等
需要可预测响应时间的场景：如实时游戏、交互式应用等

优缺点总结

线程的优点:

可以利用多核CPU的并行计算能力
操作系统原生支持，成熟稳定
适合CPU密集型任务
编程模型相对直观，易于理解

线程的缺点:

创建和切换成本高
资源消耗大，限制了并发数量
需要处理复杂的同步问题，如死锁、竞态条件等
调试困难，并发问题难以复现

协程的优点:

创建和切换成本低
资源消耗小，支持大量并发
编程模型简单，可以用同步风格写异步代码
避免了回调地狱，代码更清晰易读
调试相对容易，执行顺序更可控

协程的缺点:

单线程内无法利用多核并行计算能力
需要特定的语言或库支持
CPU密集型任务会阻塞整个协程调度器
错误处理和异常传播机制可能更复杂

实际应用中的选择

在实际应用中，线程和协程往往不是互斥的，而是可以结合使用：

多线程+协程模型:
- 使用多个线程充分利用多核CPU
- 每个线程内运行多个协程处理I/O密集型任务
- 这种模型结合了线程的并行能力和协程的高并发能力
线程池+协程:
- 使用线程池处理CPU密集型任务
- 使用协程处理I/O密集型任务
- 通过任务队列协调线程和协程的工作
Actor模型+协程:
- 每个Actor运行在自己的线程或协程中
- 通过消息传递进行通信，避免共享状态
- 结合了Actor模型的并发安全和协程的高效性

参考资料与外部链接

account_tree

思维导图

Interview AiBoxInterview AiBox — 面试搭档

不只是准备，更是实时陪练

Interview AiBox 在面试过程中提供实时屏幕提示、AI 模拟面试和智能复盘，让你每一次回答都更有信心。

免费下载 Interview AiBoxdownload 查看价格方案sell

AI 助读

一键发送到常用 AI

协程和线程是两种不同的并发编程模型。线程是操作系统层面的概念，由内核调度，采用抢占式调度，资源消耗大，切换成本高，适合CPU密集型任务；协程是程序语言层面的概念，由用户程序调度，采用协作式调度，资源消耗小，切换成本低，适合I/O密集型任务和高并发场景。在实际应用中，两者可以结合使用，以发挥各自的优势。

智能总结

深度解读

考点定位

思路启发