Python标准库--collections模块

您的位置：
门户
>> 文章精选
>> 软件开发专栏
>> Python
>> 查看资讯

发表于：2021-3-25 09:21

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：Python_Harry 来源：CSDN

Python

　　collections模块简介

　　collections是Python标准库里有关数据类型的模块，里面包含了一些实用的数据类型，在某些情况下作为Python标准内建容器 (dict , list , set , 和 tuple )的替代选择。

　　namedtuple() 命名元组的工厂函数

　　Python官方文档上是这样说的:"命名元组赋予每个位置一个含义，提供可读性和自文档性。它们可以用于任何普通元组，并添加了通过名字获取值的能力，通过索引值也是可以的。“我是这样理解的:它可以构建一个有名字的类，而且为元组中的元素添加了更易懂的"名字”(或者说是对元素的简单描述)，这样就可以用"名字"取值。

　　如果元组内的元素很多，比如记录一个人的身高，年龄，家庭住址，电话号码…等等，只靠索引访问这些信息是很麻烦的，这就凸显出了"名字"的重要性。

　　from collections import namedtuple

　　City = namedtuple('City', 'name country') #注1

　　beijing = City('Beijing', 'China')

　　print(beijing) #City(name='Beijing', country='China')

　　print(beijing.name) #通过"名字"获取对应的值

　　print(beijing.country)

　　print(beijing[0]) #同样支持用索引访问

　　注1.创建了一个类名是"City"的类，其中"name"和"country"是"名字"，"名字"可以是数个字符串组成的可迭代类型(比如list)，还可以是用空格分开的字符串。

　　下面介绍一些常用的功能：

　　from collections import namedtuple

　　Point = namedtuple('Point', ['x', 'y'])

　　print(Point._fields) #_fields方法会返回一个包含"Point"类里所有"名字"的元组 ('x', 'y')

　　p = [1,2]

　　print(Point._make(p)) #_make()接受一个可迭代对象创建新的命名元组

　　p = Point(1,2)

　　print(p._asdict()) #返回一个OrderedDict(这个数据类型以后再谈)，它能友好地呈现出元组里的信息

　　print(p._replace(x=2)) #返回一个新的命名元组实例，并将指定"名字"的值替换为新的值

　　print(p) #_replace()返回的是新的命名元组实例，所以p不会改变

　　p2 = {'x':2, 'y':3}

　　print(Point(**p2)) #将字典转化为命名元组

　　Counter(计数器)

　　Counter是dict的子类，可以给可散列对象(文末有解释)计数。

　　废话不多说，直接上例子:

　　from collections import Counter

　　a = Counter('aaabbcdddd') #统计'aaabbcdddd'(可迭代对象)里字母出现的次数并创建对应的计数器(按次数大小排列)

　　print(a)

　　b = Counter() #空的计数器

　　print(b)

　　c = Counter({'a': 3, 'b': 2, 'c': 3, 'd': 4}) #根据字典创建计数器

　　print(c)

　　d = Counter(a=3, b=2, c=1, d=4) #根据键值创建

　　print(d)

　　e = Counter(['a', 'a', 'b']) #也可以换成其他可迭代对象

　　print(e['a']) #统计列表中'a'出现的次数

　　print(e['c']) #如果没有相应的键就返回零

　　下面介绍一些常用的功能：

　　from collections import Counter

　　# elements()方法会返回一个迭代器

　　a = Counter(a=2, b=1, c=0, d=-1) # elements()函数会忽略计数值小于1的元素

　　print(sorted(f.elements())) # 迭代器不能直接打印，需要先用sorted()函数新建一个列表

　　# most_common([n])返回一个包含n个最常见的元素及出现次数的列表

　　b = Counter('aaabbcdddd')

　　print(g.most_common(2)) # 结果:[('d', 4), ('a', 3)]

　　print(g.most_common()) # 如果不传参或传"None",将返回计数器中的所有元素

　　print(g.most_common(None))

　　#subtract减去元素

　　e = Counter(a=4, b=1, c=0, d=-1)

　　f = Counter(a=2, b=1, c=2, d=0)

　　e.subtract(f) #这里既可以减去可迭代对象(如字符串，列表)也可以是映射对象(如字典)

　　print(e)

　　e.subtract('aaa')

　　print(e) #输入和输出都可以是0或者负数

　　关于可散列对象的介绍不多，《流畅的Python》里是这样说的(选自Python词汇表):

　　如果一个对象是可散列的，那么在这个对象的生命周期中，他的散列值是不会变的，而且这个对象需要实现__hash__()方法。另外还要有__eq__()方法，这样才能和其他键作比较。如果两个可散列对象是相等的，那么他们的散列值一定是一样的。

　　简单说可散列对象就是能被映射成数字的对象。

　　“可散列”，"映射"会牵扯到一种数据结构:散列表(《算法图解》第五章和《流畅的Python》第三章中对散列表都有一定介绍，读者可以用微信读书了解这种数据结构)

　　在理解了散列表之后，可散列对象就不难理解了。

　　下面看几个例子：

　　a = 1

　　print(hash(a))

　　s = 'a'

　　print(hash(s))

　　t1 = (1, 2, 3)

　　t2 = (1, [2, 3])

　　t3 = (1, frozenset([2, 3]))

　　print(hash(t1))

　　print(hash(t2))

　　print(hash(t3))

　　l = [1,2]

　　print(hash(l)) #list是不可散列的，所以会抛出异常:TypeError: unhashable type: 'list'

　　b = 1

　　print(hash(a)==hash(b))

　　在以上的例子中，变量a,s,t1和t3都是可散列对象(都实现了__hash__()方法)；

　　最后一个例子证明了"如果两个可散列对象是相等的，那么他们的散列值一定是一样的"这句话。

　　总结一下可散列对象:

　　1.str(s),bytes,和数值类型(a)；

　　2.frozenset，因为frozenset只能容纳可散列类型；

　　3.在元组里的所有元素都是可散列类型的情况下，它才是可散列的。

本文内容不用于商业目的，如涉及知识产权问题，请权利人联系51Testing小编(021-64471599-8017)，我们将立即处理

《2023软件测试行业现状调查报告》独家发布~

搜索风云榜

测试技术了解

2023测试行业调查报告

挣点稿费

AI与软件测试

文章资料精选