写 Python 脚本,一定要加上这个!

发表于:2022-5-31 09:48

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:派森酱    来源:Python技术

  使用 Python 的人,平时经常会写一些脚本,不管是为了提升工作效率,还是为了满足一些特定的需求,Python 脚本都是一个常见又有用的东西。
  但是,我最近发现了一个以前不曾察觉的问题,就是脚本里面是否添加 if __name__ == "__main__":
  这个语句,对脚本的使用其实是有很大影响的,并且这里面还有很大的学问。
  常见误区
  很多朋友在写脚本时比较随意,简单的脚本直接一溜写下来,没有函数,顺序执行。复杂点的脚本,可能会加函数。这种写法可读性比较差,经常让人一眼找不到程序运行的入口和顺序。
  而 Python 社区比较推荐的写法是在写脚本时,加上下面这个语句:
  def main():
      # do something
      print("do something.")
  if __name__ == "__main__":
      main()

  大多数人看到这里,会不会说,这有什么,加不加这个没那么重要吧!
  先不要忙着不屑,让我们一起来仔细掰扯掰扯!
  有什么用
  在具体说明 if __name__ == '__main__' 的作用前,先从一个简单的实例直观上感受一下。
  # const.py
   
  PI = 3.14
   
  def train():
      print("PI:", PI)
   
  train()

  # area.py
   
  from const import PI
   
  def calc_round_area(radius):
      return PI * (radius ** 2)
   
  def calculate():
      print("round area: ", calc_round_area(2))
   
  calculate()

  我们看下 area.py 的运行结果:
  PI: 3.14
  round area:  12.56

  的 PI 变量,在运行的时候,const.py 中函数 train()
  中的打印也带过来了,而我们只是引用变量,并没有引用函数,所以这是我们不愿意看到的。
  解决这个问题的方法也很简单,我们只需在 const.py 中加上一句:
  PI = 3.14
  def train():
     print("PI:", PI)
  if __name__ == "__main__":
     train()

  再次运行 area.py ,输出结果如下:
  round area:  12.56

  这是我们预期的结果。
  程序运行入口
  丛上述实例可以发现,如果没有 if __name__=="__main__": ,作为 area.py 导入文件时 const.py
  中的所有代码都被执行了,而加上之后就只运行导入的部分代码。
  这就是 if __name__=="__main__": 显而易见的作用,实际上 if __name__=="__main__": 就相当于是
  Python 模拟的程序入口。由于模块之间相互引用,不同模块可能都有这样的定义,而入口程序只能有一个,选中哪个入口程序取决于 __name__ 的值。
  我们再来看一个小程序:
  print("look here")
  print(__name__)
   
  if __name__ == '__main__':
      print("I'm test.py")

  程序的运行结果如下:
  look here
  __main__
  I'm test.py

  可以发现,此时变量 __name__ 的值为 __main__,所以打印 “I'm
  test.py”。如果运行其他文件,通过运行的文件调用本文件,则不会打印该语句,因为程序入口不对,该语句不执行。
  代码规范
  有了 if __name__=="__main__": 相当于 Python
  程序也有了一个入口函数,我们可以清晰的知道程序的逻辑开始于何处,当然还需要我们自觉的把程序的开始逻辑都放在这里。其实,这也是 PyCharm
  推荐的作法。
  为什么很多优秀的编程语言,比如 C、Java、Golang、C++ 都有一个 main
  入口函数呢?我想很重要的一个原因就是就是程序入口统一,容易阅读。
  多进程场景大作用
  如果你用多进程来做并行计算,类似这样的代码:
  import multiprocessing as mp
  def useful_function(x):
      return x * x
  print("processing in parallel")
  with mp.Pool() as p:
      results = p.map(useful_function, [1, 2, 3, 4])
      print(results)

  运行这段代码,控制台会一直打印:
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel
  processing in parallel

  并且程序会不停的报错 RuntimeError。
  如果你加上了 if __name__=="__main__": ,程序就会按照预期的进行:
  import multiprocessing as mp
  def useful_function(x):
      return x * x
  if __name__ == '__main__':
      print("processing in parallel")
      with mp.Pool() as p:
          results = p.map(useful_function, [1, 2, 3, 4])
          print(results)

  Python 的多程序就是启动了多个 Python 解器器,每个 Python 解释器都会导入你这个脚本,复制一份全局变量和函数给子进程用,如果有了 if
  __name__=="__main__":,那它后面的代码就不会被 import,也就不会被重复执行。否则,这个创建多进程的代码就会被
  import,就会被执行,从而无限递归的去创建子进程
  总结
  if __name__=="__main__": 虽然不是强制的,但是我强列推荐你写脚本时按照这个规范来做。

  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号