Python如何像awk一样分割字符串?

发表于:2020-8-28 09:57

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:写代码的明哥    来源:Python编程时光

  若你使用过 Shell中的awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。
  [root@localhost ~]# cat demo.txt 
  hello      world 
  [root@localhost ~]# 
  [root@localhost ~]# awk '{print$1,$2}' demo.txt 
  hello world 
  可是转换到 Python 上面来呢?结果可能是这样的。
  >>> msg='hello    world' 
  >>> msg.split(' ') 
  ['hello', '', '', '', 'world'] 
  与我预想的结果不符,多个空格会被分割多次。
  那有什么办法可以达到 awk 一样的效果呢?
  有两种方法。
  第一种方法
  不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。
  >>> msg='hello    world' 
  >>> msg.split() 
  ['hello', 'world'] 
  第二种方法
  使用 filter 来辅助,这种适用于所有的分隔符,下面以 - 为分隔符来举例。
  >>> msg='hello----world' 
  >>> msg.split('-') 
  ['hello', '', '', '', 'world'] 
  >>> 
  >>> filter(None, msg.split('-')) 
  ['hello', 'world'] 
  是不是很神奇,filter 印象中第一个参数接收的是 函数,这里直接传 None 居然有奇效。
  查看了注释,原来是这个函数会适配 None 的情况,当第一个参数是None的时候,返回第二个参数(可迭代对象)中非空的值,非常方便。
  换用函数的写法,可以这样:
  >>> msg='hello----world' 
  >>> msg.split('-') 
  ['hello', '', '', '', 'world'] 
  >>> 
  >>> filter(lambda item: True if item else False, msg.split('-')) 
  ['hello', 'world'] 

  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系博为峰小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号