Python标准库--collections模块

发表于:2021-3-25 09:21

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:Python_Harry    来源:CSDN

#
Python
  collections模块简介
  collections是Python标准库里有关数据类型的模块,里面包含了一些实用的数据类型,在某些情况下作为Python标准内建容器 (dict , list , set , 和 tuple )的替代选择。
  namedtuple() 命名元组的工厂函数
  Python官方文档上是这样说的:"命名元组赋予每个位置一个含义,提供可读性和自文档性。它们可以用于任何普通元组,并添加了通过名字获取值的能力,通过索引值也是可以的。“我是这样理解的:它可以构建一个有名字的类,而且为元组中的元素添加了更易懂的"名字”(或者说是对元素的简单描述),这样就可以用"名字"取值。
  如果元组内的元素很多,比如记录一个人的身高,年龄,家庭住址,电话号码…等等,只靠索引访问这些信息是很麻烦的,这就凸显出了"名字"的重要性。
  from collections import namedtuple
  City = namedtuple('City', 'name country')  #注1
  beijing = City('Beijing', 'China')
  print(beijing)  #City(name='Beijing', country='China')
  print(beijing.name)  #通过"名字"获取对应的值
  print(beijing.country)
  print(beijing[0])  #同样支持用索引访问
  注1.创建了一个类名是"City"的类,其中"name"和"country"是"名字","名字"可以是数个字符串组成的可迭代类型(比如list),还可以是用空格分开的字符串。
  下面介绍一些常用的功能:
  from collections import namedtuple
  Point = namedtuple('Point', ['x', 'y'])
  print(Point._fields)  #_fields方法会返回一个包含"Point"类里所有"名字"的元组 ('x', 'y')
  p = [1,2]
  print(Point._make(p))  #_make()接受一个可迭代对象创建新的命名元组
  p = Point(1,2)
  print(p._asdict())  #返回一个OrderedDict(这个数据类型以后再谈),它能友好地呈现出元组里的信息
  print(p._replace(x=2))  #返回一个新的命名元组实例,并将指定"名字"的值替换为新的值
  print(p)  #_replace()返回的是新的命名元组实例,所以p不会改变
  p2 = {'x':2, 'y':3}
  print(Point(**p2))  #将字典转化为命名元组
  Counter(计数器)
  Counter是dict的子类,可以给可散列对象(文末有解释)计数。
  废话不多说,直接上例子:
  from collections import Counter
  a = Counter('aaabbcdddd')  #统计'aaabbcdddd'(可迭代对象)里字母出现的次数并创建对应的计数器(按次数大小排列)
  print(a)
  b = Counter()  #空的计数器
  print(b)
  c = Counter({'a': 3, 'b': 2, 'c': 3, 'd': 4})  #根据字典创建计数器
  print(c)
  d = Counter(a=3, b=2, c=1, d=4)  #根据键值创建
  print(d)
  e = Counter(['a', 'a', 'b'])  #也可以换成其他可迭代对象
  print(e['a'])  #统计列表中'a'出现的次数
  print(e['c'])  #如果没有相应的键就返回零
  下面介绍一些常用的功能:
  from collections import Counter
  # elements()方法会返回一个迭代器
  a = Counter(a=2, b=1, c=0, d=-1)  # elements()函数会忽略计数值小于1的元素
  print(sorted(f.elements()))  # 迭代器不能直接打印,需要先用sorted()函数新建一个列表
  # most_common([n])返回一个包含n个最常见的元素及出现次数的列表
  b = Counter('aaabbcdddd')
  print(g.most_common(2))  # 结果:[('d', 4), ('a', 3)]
  print(g.most_common())  # 如果不传参或传"None",将返回计数器中的所有元素
  print(g.most_common(None))
  #subtract减去元素
  e = Counter(a=4, b=1, c=0, d=-1)
  f = Counter(a=2, b=1, c=2, d=0)
  e.subtract(f)  #这里既可以减去可迭代对象(如字符串,列表)也可以是映射对象(如字典)
  print(e)
  e.subtract('aaa')
  print(e)  #输入和输出都可以是0或者负数
  关于可散列对象的介绍不多,《流畅的Python》里是这样说的(选自Python词汇表):
  如果一个对象是可散列的,那么在这个对象的生命周期中,他的散列值是不会变的,而且这个对象需要实现__hash__()方法。另外还要有__eq__()方法,这样才能和其他键作比较。如果两个可散列对象是相等的,那么他们的散列值一定是一样的。
  简单说可散列对象就是能被映射成数字的对象。
  “可散列”,"映射"会牵扯到一种数据结构:散列表(《算法图解》第五章和《流畅的Python》第三章中对散列表都有一定介绍,读者可以用微信读书了解这种数据结构)
  在理解了散列表之后,可散列对象就不难理解了。
  下面看几个例子:
  a = 1
  print(hash(a))
  s = 'a'
  print(hash(s))
  t1 = (1, 2, 3)
  t2 = (1, [2, 3])
  t3 = (1, frozenset([2, 3]))
  print(hash(t1))
  print(hash(t2))
  print(hash(t3))
  l = [1,2]
  print(hash(l))  #list是不可散列的,所以会抛出异常:TypeError: unhashable type: 'list'
  b = 1
  print(hash(a)==hash(b))
  在以上的例子中,变量a,s,t1和t3都是可散列对象(都实现了__hash__()方法);
  最后一个例子证明了"如果两个可散列对象是相等的,那么他们的散列值一定是一样的"这句话。
  总结一下可散列对象:
  1.str(s),bytes,和数值类型(a);
  2.frozenset,因为frozenset只能容纳可散列类型;
  3.在元组里的所有元素都是可散列类型的情况下,它才是可散列的。

      本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号