Python学习之名字、作用域、名字空间

发表于:2022-5-11 08:54

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:佚名    来源:稀土掘金

  楔子
  我们在PyFrameObject里面看到了3个独立的名字空间:f_locals、f_globals、f_builtins。名字空间对于Python来说是一个非常重要的概念,Python虚拟机的运行机制和名字空间有着非常紧密的联系。并且在Python中,与名字空间这个概念紧密联系在一起的还有名字、作用域这些概念,下面就来剖析这些概念是如何体现的。
  变量只是一个名字
  很早的时候我们就说过,从解释器的角度来看,变量只是一个泛型指针PyObject *,而从Python的角度来看,变量只是一个名字、或者说符号,用于和对象进行绑定的。
  变量的定义本质上就是建立名字和对象之间的约束关系,所以a = 1这个赋值语句本质上就是将a和1绑定起来,让我们通过a这个符号可以找到对应的PyLongObject。
  除了变量赋值,创建函数、类也相当于定义变量,或者说完成名字和对象之间的绑定。
  def foo(): pass
  class A(): pass

  创建一个函数也相当于定义一个变量,会先根据函数体创建一个函数对象,然后将名字foo和函数对象绑定起来。所以函数名和函数体之间是分离的,同理类也是如此。
  import os

  导入一个模块,也是在定义一个变量。import os相当于将名字os和模块对象绑定起来,通过os可以找到指定的模块对象。
  import numpy as np当中的as语句同样是在定义变量,将名字np和对应的模块对象绑定起来,以后就可以通过np这个名字去获取指定的模块了。
  另外,当我们导入一个模块的时候,解释器是这么做的。比如:import os等价于os=__import__("os"),可以看到本质上还是一个赋值语句。
  作用域和名字空间
  我们说赋值语句、函数定义、类定义、模块导入,本质上只是完成了名字和对象之间的绑定。而从概念上讲,我们实际上得到了一个name和obj之间的映射关系,通过name可以获取对应的obj,而它们的容身之所就是名字空间。
  所以名字空间是通过PyDictObject对象实现的,这对于映射来说简直再适合不过了。而在前面介绍字典的时候,我们说过字典是被高度优化的,原因就是虚拟机本身也重度依赖字典,从这里的名字空间即可得到体现。
  但是一个模块内部,名字还存在可见性的问题,比如:
  a = 1
  def foo():
      a = 2
      print(a)  # 2
  foo()
  print(a)  # 1

  我们看到同一个变量名,打印的确是不同的值,说明指向了不同的对象,换句话说这两个变量是在不同的名字空间中被创建的。
  然后我们知道名字空间本质上是一个字典,如果两者是在同一个名字空间,那么由于字典的key的不重复性,当执行a=2的时候,会把字典里面key为a的value给更新成2。但是在外面还是打印1,这说明两者所在的不是同一个名字空间,打印的也就自然不是同一个a。
  因此对于一个模块而言,内部是可能存在多个名字空间的,每一个名字空间都与一个作用域相对应。作用域就可以理解为一段程序的正文区域,在这个区域里面定义的变量是有意义的,然而一旦出了这个区域,就无效了。
  对于作用域这个概念,至关重要的是要记住:它仅仅是由源程序的文本所决定的。在Python中,一个变量在某个位置是否起作用,是由它的文本位置决定的。
  因此Python具有静态作用域(词法作用域),而名字空间则是作用域的动态体现,一个由程序文本定义的作用域在Python运行时会转化为一个名字空间、即一个PyDictObject对象。而进入一个函数,显然进入了一个新的作用域,因此函数在执行时,会创建一个名字空间。
  我们之前说,在对Python源代码进行编译的时候,对于代码中的每一个block,都会创建一个PyCodeObject与之对应。而当进入一个新的名字空间、或者说作用域时,我们就算是进入一个新的block了。
  而根据我们使用Python的经验,显然函数、类都是一个新的block,当Python运行的时候会为它们创建各自的名字空间。
  所以名字空间是名字、或者变量的上下文环境,名字的含义取决于名字空间。更具体的说,一个变量绑定的对象是不确定的,需要由名字空间来决定。
  位于同一个作用域的代码可以直接访问作用域中出现的名字,即所谓的直接访问;但不同作用域,则需要通过访问修饰符 . 进行属性访问。
  class A:
      a = 1
  class B:
      b = 2
      print(A.a)  # 1
      print(b)  # 2

  如果想在B里面访问A里面的内容,要通过A.属性的方式,表示通过A来获取A里面的属性。但是访问B的内容就不需要了,因为都是在同一个作用域,所以直接访问即可。
  访问名字这样的行为被称为名字引用,名字引用的规则决定了Python程序的行为。
  a = 1
  def foo():
      a = 2
      print(a)  # 2
  foo()
  print(a)  # 1

  还是上面的代码,如果我们把函数里面的a=2给删掉,意味着函数的作用域里面已经没有a这个变量了,那么再执行程序会有什么后果呢?从Python层面来看,显然是会寻找外部的a。因此我们可以得到如下结论:
  ·作用域是层层嵌套的;
  · 内层作用域可以访问外层作用域;
  · 外层作用域无法访问内层作用域,尽管我们没有试,但是想都不用想。如果是把外层的a=1给去掉,那么最后面的print(a)铁定报错;
  · 查找元素会依次从当前作用域向外查找,也就是查找元素时,对应的作用域是按照从小往大、从里往外的方向前进的;
  LGB规则
  我们说函数、类有自己的作用域,但是模块对应的源文件本身也有相应的作用域。比如:
  name = "51Testing软件测试网"
  age = 16
  def foo():
      return 123
  class A:
      pass

  由于这个文件本身也有自己的作用域,显然是global作用域,所以解释器在运行这个文件的时候,也会为其创建一个名字空间,而这个名字空间就是global名字空间。它里面的变量是全局的,或者说是模块级别的,在当前文件的任意位置都可以直接访问。
  而函数也有作用域,这个作用域称为local作用域,对应local名字空间;同时Python自身还定义了一个最顶层的作用域,也就是builtin作用域,像内置函数、内建对象都在builtin里面。
  这三个作用域在Python2.2之前就存在了,所以那时候Python的作用域规则被称之为LGB规则:名字引用动作沿着local作用域(local名字空间)、global作用域(global名字空间)、builtin作用域(builtin名字空间)来查找对应的变量。
  而获取名字空间,Python也提供了相应的内置函数:
  ·locals函数:获取当前作用域的local名字空间,local名字空间也称为局部名字空间;
  · globals函数:获取当前作用域的global名字空间,global名字空间也称为全局名字空间;
  · __builtins__函数:或者import builtins,获取当前作用域的builtin名字空间,builtint名字空间也称为内置名字空间;
  每个函数都有自己local名字空间,因为不同的函数对应不同的作用域,但是global名字空间则是全局唯一。
  name = "51Testing软件测试网"
  def foo():
      pass
  print(globals())  
  # {..., 'name': '51Testing软件测试网', 'foo': <function foo at 0x000002977EDF61F0>}

  里面的...表示省略了一部分输出,我们看到创建的全局变量就在里面。而且foo也是一个变量,它指向一个函数对象。
  但是注意,我们说foo也是一个独立的block,因此它会对应一个PyCodeObject。但是在解释到def foo的时候,会根据这个PyCodeObject对象创建一个PyFunctionObject对象,然后将foo和这个函数对象绑定起来。
  当我们调用foo的时候,再根据PyFunctionObject对象创建PyFrameObject对象、然后执行,这些留在介绍函数的时候再细说。总之,我们看到foo也是一个全局变量,全局变量都在global名字空间中。
  总之,global名字空间全局唯一,它是程序运行时的全局变量和与之绑定的对象的容身之所,你在任何一个地方都可以访问到global名字空间。正如,你在任何一个地方都可以访问相应的全局变量一样。
  此外,我们说名字空间是一个字典,变量和对象会以键值对的形式存在里面。那么换句话说,如果我手动地往这个global名字空间里面添加一个键值对,是不是也等价于定义一个全局变量呢?
  globals()["name"] = "51Testing软件测试网"
  print(name)  # 51Testing软件测试网
  def f1():
      def f2():
          def f3():
              globals()["age"] = 16
          return f3
      return f2
  f1()()()
  print(age)  # 16

  我们看到确实如此,通过往global名字空间里面插入一个键值对完全等价于定义一个全局变量。并且global名字空间是唯一的,你在任何地方调用globals()得到的都是global名字空间,正如你在任何地方都可以访问到全局变量一样。
  所以即使是在函数中向global名字空间中插入一个键值对,也等价于定义一个全局变量、并和对象绑定起来。
  ·name="xxx" 等价于 globals["name"]="xxx";
  · print(name) 等价于 print(globals["name"]);
  对于local名字空间来说,它也对应一个字典,显然这个字典就不是全局唯一的了,每一个局部作用域都会对应自身的local名字空间。
  def f():
      name = "夏色祭"
      age = 16
      return locals()
  def g():
      name = "神乐mea"
      age = 38
      return locals()
  print(locals() == globals())  # True
  print(f())  # {'name': '夏色祭', 'age': 16}
  print(g())  # {'name': '神乐mea', 'age': 38}

  显然对于模块来讲,它的local名字空间和global名字空间是一样的,也就是说,模块对应的PyFrameObject对象里面的f_locals和f_globals指向的是同一个PyDictObject对象。
  但是对于函数而言,局部名字空间和全局名字空间就不一样了。调用locals是获取自身的局部名字空间,而不同函数的local名字空间是不同的。但是globals函数的调用结果是一样的,获取的都是global名字空间,这也符合函数内找不到某个变量的时候会去找全局变量这一结论。
  所以我们说在函数里面查找一个变量,查找不到的话会找全局变量,全局变量再没有会查找内置变量。本质上就是按照自身的local空间、外层的global空间、内置的builtin空间的顺序进行查找。
  因此local空间会有很多个,因为每一个函数或者类都有自己的局部作用域,这个局部作用域就可以称之为该函数的local空间;但是global空间则全局唯一,因为该字典存储的是全局变量。无论你在什么地方,通过调用globals函数拿到的永远是全局名字空间,向该空间中添加键值对,等价于创建全局变量。
  对于builtin名字空间,它也是一个字典。当local空间、global空间都没有的时候,会去builtin空间查找。问题来了,builtin名字空间如何获取呢?答案是使用builtins模块,通过builtins.__dict__即可拿到builtin名字空间。
  # 等价于__builtins__
  import builtins
  #我们调用list显然是从内置作用域、也就是builtin名字空间中查找的
  #但我们只写list也是可以的
  #因为local空间、global空间没有的话,最终会从builtin空间中查找
  #但如果是builtins.list,那么就不兜圈子了
  #表示: "builtin空间,就从你这获取了"
  print(builtins.list is list)  # True
  builtins.dict = 123
  #将builtin空间的dict改成123
  #那么此时获取的dict就是123
  #因为是从内置作用域中获取的
  print(dict + 456)  # 579
  str = 123
  #如果是str = 123,等价于创建全局变量str = 123
  #显然影响的是global空间
  print(str)  # 123
  # 但是此时不影响builtin空间
  print(builtins.str)  # <class 'str'>

  这里提一下Python2当中,while 1比while True要快,为什么?
  因为True在Python2中不是关键字,所以它是可以作为变量名的。那么Python在执行的时候就要先看local空间和global空间里有没有True这个变量,有的话使用我们定义的,没有的话再使用内置的True。
  而1是一个常量,直接加载就可以,所以while True多了符号查找这一过程。但是在Python3中两者就等价了,因为True在Python3中是一个关键字,也会直接作为一个常量来加载。
  eval和exec
  记得之前介绍 eval 和 exec 的时候,我们说这两个函数里面还可以接收第二个参数和第三个参数,它们分别表示global名字空间、local名字空间。
  # 如果不指定,默认当前所在的名字空间
  # 显然此时是全局名字空间
  exec("name = '古明地觉'")
  print(name)  # 古明地觉
  # 但是我们也可以指定某个名字空间
  dct = {}
  # 将 dct 作为全局名字空间
  # 这里我们没有指定第三个参数,也就是局部名字空间
  # 如果指定了全局名字空间、但没有指定局部名字空间
  # 那么局部名字空间默认和全局名字空间保持一致
  exec("name = 'satori'", dct)
  print(dct["name"])  # satori

  至于 eval 也是同理:
  dct = {"seq": [1, 2, 3, 4, 5]}
  try:
      print(eval("sum(seq)"))
  except NameError as e:
      print(e)  # name 'seq' is not defined
  # 告诉我们 seq 没有被定义
  # 因为我们需要将 dct 作为名字空间
  print(eval("sum(seq)", dct))  # 15

  所以名字空间本质上就是一个字典,所谓的变量不过是字典里面的一个 key。为了进一步加深印象,再举个模块的例子:
  # 我们自定义一个模块吧
  # 首先模块也是一个对象,类型为 <class 'module'>
  # 但是底层没有将这个类暴露给我们,所以需要换一种方式获取
  import sys
  module = type(sys)
  # 以上就拿到了模块的类型对象,调用即可得到模块对象
  my_module = module("自己定义的")
  print(sys)  # <module 'sys' (built-in)>
  print(my_module)  # <module '自己定义的'>
  # 此时的 my_module 啥也没有,我们为其添砖加瓦
  my_module.__dict__["name"] = "古明地觉"
  print(my_module.name)  # 古明地觉
  # 给模块设置属性,本质上也是操作相应的属性字典
  # 当然获取属性也是如此。如果再和exec结合的话
  code = """
  age = 16
  def foo():
      return "我是函数foo"
      
  from functools import reduce     
  """
  # 此时属性就设置在了模块的属性字典里面
  exec(code, my_module.__dict__)
  print(my_module.age)  # 16
  print(my_module.foo())  # 我是函数foo
  print(my_module.reduce(int.__add__, [1, 2, 3, 4, 5]))  # 15

  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号