Python itertools 的高效迭代模式

当你掌握了迭代器和生成器后，你将能够控制数据在程序中的流动。但Python并没有止步于此。它为你提供了一个工具箱——itertools——里面装满了现成的、内存高效的数据流处理构件。

在本文中，我们将探讨如何使用itertools来处理现实世界中的任务，而无需加载超过所需的数据。每个示例都将使用清晰、易读的名称来命名函数和变量——如此清晰，以至于连格蕾丝·霍普都会点头赞同。

为什么选择`itertools`？

itertools模块提供了快速、内存高效的工具，使你能够：

安全地构建无限序列。
动态地切片、链接和分组数据。
在不生成巨大列表的情况下组合信息流。

可以把它看作是迭代的“乐高套件”——你可以将简单的组件拼接在一起，构建复杂的管道。

示例 1：无限计数

假设你需要一个永无止境的数字序列。如果使用列表，你会立刻耗尽内存。使用itertools.count，你可以一次生成一个数字：

from itertools import count

# 从1001开始的发票号码序列
invoice_numbers = count(start=1001, step=1)

for number in invoice_numbers:
    print(f"正在处理发票 {number}")
    if number == 1005:
        break  # 为了演示目的，处理几张后停止

可读的名称（invoice_numbers, number）使代码自解释。

示例 2：循环遍历模式

假设您的系统需要在服务器之间交替，以平衡负载。

from itertools import cycle
servers = cycle(["server_alpha", "server_beta", "server_gamma"])

for request_id in range(1, 7):
    assigned_server = next(servers)
    print(f"请求 {request_id} 被路由到 {assigned_server}") 没有计数器，没有模数运算——只有纯粹的清晰。

示例 3：切片无限数据

您还可以从无限或长流中仅提取所需的部分。

from itertools import islice

# 想象一个永无止境的日志流
event_stream = count(start=1)  # 事件 ID

# 仅获取前 5 个事件
first_five_events = list(islice(event_stream, 5))
print(first_five_events)  # [1, 2, 3, 4, 5]

示例 4：链式处理多个数据源

如果您的数据分布在多个文件、API 或数据块中，您可以将它们无缝地链在一起。

from itertools import chain

morning_shift = ["Alice", "Bob"]
evening_shift = ["Charlie", "Dana"]

all_workers = chain(morning_shift, evening_shift)

for worker in all_workers:
    print(f"正在签到 {worker}")

示例 5：分组相关记录

itertools.groupby 是一个用于按键分组连续项的宝贵工具。假设您正在分析按产品排序的销售数据：

from itertools import groupby

sales_records = [
    ("apple", 3),


("苹果", 5),
    ("香蕉", 2),
    ("香蕉", 4),
    ("胡萝卜", 7),
]

for 产品名称, 分组 in groupby(销售记录, key=lambda 记录: 记录[0]):

quantities = [quantity for _, quantity in group]
    total = sum(quantities)
    print(f"总计 {product_name} 销售数量: {total}")

输出：

售出苹果总数：8
售出香蕉总数：6
售出胡萝卜总数：7

为什么这很重要

内存安全： 处理流而不需要将所有内容加载到内存中。
简洁性： 用可读的声明式代码替代循环和计数器。
可组合性： 将小块连接成大的管道。

结合您已经学到的关于迭代器和生成器的知识，itertools 使您成为 Python 迭代的真正大师。

结束思考

生成器让您能够编写自己的惰性序列。itertools 采用了相同的理念，并为您提供了一套经过实战检验的工具，完全免费。

下次当您需要计数、循环、切片、链式操作或分组数据时，请在重新发明轮子之前查看工具箱。使用 itertools，您的迭代代码将变得更短、更快，并且可读性更强。

《512K行泄露的Claude代码让我对AI工具设计的启示》

在2026年3月31日，Anthropi

澳大利亚建筑许可证数据是一座金矿。我们用它构建了什么。

每当澳大利亚有人想要建造游泳池、拆除房屋

QPython+