文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

使用Python去除字符串中某个字符的多种实现方式比较

2024-04-02 19:55

关注

1、如何去掉字符串中不需要的字符?

实际案例:

(1)过滤掉用户输入前后多余的空白字符:' nick2008@gmail.com '

(2)过滤某windows下编辑文本中的'\r':'hello world\r\n'

(3)去掉文本中的unicode组合符号(调音):u'ní hǎo, chī fàn'(或 èěéēàǎā)

解决方案;

方法1:字符串strip(),lstrip(),rstrip()方法去掉字符串两端字符。

方法2:删除单个固定位置的字符,可以使用切片+拼接的方式。

方法3:字符串的replace()替换方法或正则表达式re.sub()删除任意位置字符。(通用)

方法4:字符串translate()方法,可以同时删除多种不同字符。

2、代码演示

# 方法1:strip类的方法
# 去掉字符串两端的字符
s = '  abc  123   '
'''
str.strip方法介绍:
    strip([chars]) -> string or unicode
    chars不指定默认情况下去掉空白字符(空格,\n,\t,\r)
'''
# 去掉两端空白,但保留了中间的空白
print(s.strip())
# 只去掉左端的空白
print(s.lstrip())
# 只去掉右端的空白
print(s.rstrip())
s2 = '---abc+++'
# 去掉s2中的加减
print(s2.strip('-+'))
 
# 方法2:删除固定位置字符,切片+拼接
s3 = 'abc:123'
# 只删除固定位置的冒号
s4 = s3[0:3] + s3[4:]
print(s4)
 
# 方法3:
'''
因为第1种方法不能删除中间的某些字符,只能在两端进行删除,
第3种就能完成删除中间某些字符的事情。
'''
s5 = '\tabc\t123\txyz'
# 清除s5中的所有\t,可以使用字符串替换replace,
# 但是这种方式只能替换一种
print(s5.replace('\t', ''))
s6 = '\tabc\t123\txyz\ropq\r'
import re
 
# 去除s6中的\t和\r
print(re.sub('[\t\r]', '', s6))
 
# 方法4:
'''
str.translate方法介绍:
    S.translate(table) -> string
    table如果是None不做任何映射,如果存在就是一个字符映射到另一个字符上去的表;
'''
s7 = 'abc1230323xyz'
# 现在对s7字符串进行加密,加密规则是将其中a全部替换成x,
# b替换成y,c替换成z,反过来将其中的xyz分别替换成abc
 
# 构建映射表
make = str.maketrans('abcxyz', 'xyzabc')
print(make)
# 对s7字符串进行加密转换
print(s7.translate(make))
s8 = 'abc\refg\n2342\t'
# 删除s8中\r,\n,\t,构建映射表str_trans
str_trans = str.maketrans('', '', '\t\r\n')
print(s8.translate(str_trans))
 
# 去掉音标符号
u = u'nǐ hǎo, chī fàn'
import unicodedata, sys
 
# 将原始输入标准化为分解形式字符
a = unicodedata.normalize('NFD', u)
'''
使用dict.fromkeys() 方法构造一个字典,每个Unicode和音调作为键,对应的值全部为None
sys.maxunicode : 给出最大Unicode代码点的值的整数,即1114111(十六进制的0x10FFFF)。
unicodedata.combining:将分配给字符chr的规范组合类作为整数返回。如果未定义组合类,则返回0
这样我们就成功将所有组合类的值全部设置为None
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) 
                         if unicodedata.combining(chr(c)))
# 调用translate函数删除所有音调
print(a.translate(cmb_chrs))

总结

到此这篇关于使用Python去除字符串中某个字符的多种实现方式比较的文章就介绍到这了,更多相关Python去除字符串中字符内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯