collections模块如何在Python中使用-编程学习网

这期内容当中小编将会给大家带来有关collections模块如何在Python中使用，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

Python主要用来做什么

Python主要应用于：1、Web开发；2、数据科学研究；3、网络爬虫；4、嵌入式应用开发；5、游戏开发；6、桌面应用开发。

Counter

Counter()是字典对象的子类。Counter()可接收一个可迭代遍历的对象（例如字符串、列表或元组）作为参数，并返回计数器字典。字典的键将是可遍历对象中的唯一元素，每个键的值将是可迭代对象中的每个唯一元素对应的计数。

首先，让我们先从collections模块导入Counter这个数据类型：

from collections import Counter

要创建Counter对象，就像将其分配给其他任何对象类一样，将其分配给变量。您唯一要确保的是传递给它的参数是可迭代的对象。

lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1]counter = Counter(lst)

我们可以使用简单的打印功能比如print(counter)来查看我们获得的新的对象，它看起来像个字典，如下所示：

Conter ({1：7，2：2：5，3：3})

您可以使用键值key访问任何计数器条目，如下所示。这与从标准Python字典中提取元素的方式完全相同。

lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1]counter = Counter(lst)print(counter[1]) # 返回7。1的数量有7个

most_common()函数

到目前为止，Counter对象最有用的功能是most_common()函数。将其应用于Counter对象时，它将返回N个最常见元素及其计数的列表，按从最常见到最不常见的顺序排列。

lst = [1, 2, 3, 3, 2, 1, 1, 1, 2, 2, 3, 1, 2, 1, 1]counter = Counter(lst)print(counter.most_common(2)) # 返回最常见两个元素及其计数

上面的代码打印出以下元组列表：

[（1，7），（2，5）]

每个元组的第一个元素是列表中的唯一原始，每个元组的第二个元素是计数。这是一种快速简便的方法，实现比如“获取列表中最常见的3个元素及其计数”的功能。

要了解有关Counter功能的更多信息，请查阅官方文档。

defaultdict

defaultdict工作起来完全像一个普通的Python字典，但它有额外的奖励。当您试图访问一个不存在的键，它不会引发错误，而是使用不存在的键创建新的key，其对应的默认值是根据创建defaultdict对象时作为参数传递的数据类型自动设置的。请看下面的代码作为示例。

from collections import defaultdictnames_dict = defaultdict(int)names_dict["Bob"] = 1names_dict["Katie"] = 2sara_number = names_dict["Sara"]print(names_dict)

在上面的示例中，int作为默认初始化值传递给我们的defaultdict对象。接下来，为每个键"Bob"和"Katie"赋值。但是在最后一行，我们尝试访问一个尚未定义的键，即“ Sara”的键。

在普通字典中，这将引发错误。使用defaultdict后不再报错，而是自动以"Sara"创建一个新键key，其初始化值为0，是因为我们指定了int数据类型作为初始化值。

因此，最后一行打印出具有所有3个名称和相应值的字典。

defaultdict(<class 'int'>, {'Bob': 1, 'Katie': 2, 'Sara': 0})

如果要将设置列表类型数据做为一个key的初始化值，我们只需设置names_dict = defaultdict(list)，此时“Sara”将使用空列表初始化[]。此时打印结果如下所示：

defaultdict(<class 'int'>, {'Bob': 1, 'Katie': 2, 'Sara': []})

要了解有关defaultdict功能的更多信息，请查阅官方文档。

deque

deque队列是在计算机科学里最基本的数据结构，遵循先入先出（FIFO）的原理。简单来说，这意味着添加到队列中的第一个对象也必须是要删除的第一个对象。我们只能在队列的前面插入内容，而只能从队列的后面删除内容，而队列中间没有任何动作。

collections模块提供的deque对象是能实现队列数据结构的优化版本。该功能的主要特色是能够保持队列的大小，即如果将队列的最大长度设置为10，则将deque根据FIFO原理添加和删除元素以保持最大长度始终为10。这是到目前为止，Python中队列的最佳实现。

让我们从一个例子开始。我们将创建一个deque对象，然后使用从1到10的整数进行初始化。

from collections import dequemy_queue = deque(maxlen=10)for i in range(10):    my_queue.append(i+1)print(my_queue)

在上面的代码中，我们首先初始化deque，指定我们希望它始终保持最大长度为10。其次，当我们通过循环将值插入到队列中时。注意，填充队列的功能与使用常规Python列表的方式完全相同。最后，我们打印出结果。

deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 10], maxlen=10)

由于队列中有一个maxlen=10，并且循环中添加了10个元素，因此队列中包含了从1到10的所有数字。现在，让我们看看添加更多数字时会发生什么。

for i in range(10, 15):    my_queue.append(i+1)print(my_queue)

在上面的代码中，我们在队列中添加了另外5个元素，数字从11到15。但是我们的队列只有一个，且maxlen=10。因此必须删除一些元素，才能插入新的元素。由于队列必须遵循FIFO原则，因此它将删除最先插入队列中的前5个元素，即[1、2、3、4、5]。打印语句的结果如下：

deque([6, 7, 8, 9, 10, 11, 12, 13, 14, 15], maxlen=10)

要了解有关该功能的更多信息deque，请查阅官方文档。

namedtuple

在Python中创建常规元组时，其元素是通用的且未命名，这迫使您记住每个元组元素的确切索引。可以使用具名元组namedtuple来解决这个问题。

该namedtuple()返回与用于所述元组中的每个位置和一个通用名固定名称的元组namedtuple对象。要使用namedtuple，请先为其创建一个模板。下面的代码创建一个namedtuple名为Person的模板，其属性为name，age和job。

from collections import namedtuplePerson = namedtuple('Person', 'name age job')

创建模板后，您可以使用它来创建namedtuple对象。让我们使用Person模板为2个人创建2个namedtuple对象，并打印它们。

Person = namedtuple('Person', 'name age job')Mike = Person(name='Mike', age=30, job='Data Scientist')Kate = Person(name="Kate", age=28, job='Project Manager')print(Mike)print(Kate)

上面的代码非常简单。我们使用namedtuple 模板的所有属性来初始化“人员” ，以后可以直接使用Mike或Kate使用元组元素，而不用再使用索引了。上面的打印语句将给出以下结果：

Person(name='Mike', age=30, job='Data Scientist')Person(name='Kate', age=28, job='Project Manager')

因此，namedtuple能够更容易地使用，更合适元组对象的组织，可读性也更强。

要了解更多关于namedtuple的功能，请查阅官方文档。

OrderedDict

由于原文未介绍collections模块中的有序字典结构而OrderedDict又非常重要，这部分由大江狗手动新增。

在Python 3.5及以前之前版本，Python的字典dict是无序的。如果先键值A先插入字典，键值B后插入字典，但是当你打印字典的Keys列表时，你会发现B可能在A的前面。对于无序字典，每次打印字典时每次显示元素的顺序都不一样。如果你的Python版本较老，需要借助collections模块提供的OrderedDict实现有序字典。

OrderedDict类似于正常的字典，只是它记住了元素插入的顺序。当对有序的词字典上迭代时，返回元素的顺序是按第一次添加元素的顺序进行。当元素删除时，排好序的词典保持着排序的顺序；但是当新元素添加时，就会被添加到末尾。

OrderedDict实现方式如下：

dd = {'banana': 3, 'apple':4, 'pear': 1, 'orange': 2}#按key排序od_by_key = collections.OrderedDict(sorted(dd.items(), key=lambda t: t[0]))print(od_by_key)#按照value排序od_by_value = collections.OrderedDict(sorted(dd.items(),key=lambda t:t[1]))print(od_by_value)#输出OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])OrderedDict([('pear', 1), ('orange', 2), ('banana', 3), ('apple', 4)])

上述就是小编为大家分享的collections模块如何在Python中使用了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注编程网行业资讯频道。

文章详情

collections模块如何在Python中使用

Python主要用来做什么

Counter

most_common()函数

defaultdict

deque

namedtuple

OrderedDict

软考中级精品资料免费领

相关文章

猜你喜欢

collections模块如何在Python中使用

如何在Python项目中使用collections模块

Python中 Collections 模块如何使用

Python内置模块Collections如何使用

Python collections模块的使用技巧

Python的collections模块中namedtuple结构使用示例

Python中Collections模块的Counter容器类使用教程

如何在Python中使用pickle模块

random模块如何在python中使用

如何在python中使用pyglet模块

如何在python中使用scipy.interpolate模块

如何在Python中使用errno模块

如何在python中使用scrapy模块

如何在Python中使用copy模块

如何在python中使用sys模块

如何在python中使用glom模块

threading 模块如何在Python中使用

如何在Python中使用openpyxl模块

如何在python中中使用excel模块库

Python的一个内置模块Collections怎么使用