删除字符串中的指定符号

1
2
3
4
s = "abc123,123。"
# 删除逗号
s = s.replace(',', '')
print(s) # "abc123123。"

删除字符串中的空格

1
2
3
4
5
6
7
8
9
s = "   123abc   "
# 删除开头的空格
print(s.lstrip()) # "123 abc "
# 删除结尾的空格
print(s.rstrip()) # " 123 abc"
# 删除开头和结尾的空格
print(s.strip()) # "123 abc"
# 删除字符串中所有的空格
print(s.replace(' ', '')) # "123abc"

删除字符串中的所有符号,只保留数字和英文字母

1
2
3
4
5
import re
s = "123,abc .?/&?》^_^dddA。"
# 把所有编码非\u0030-\u0039(数字)、\u0041-\u007a(英文字母)的字符替换为空字符串
rs = re.sub("([^\u0030-\u0039\u0041-\u007a])", '', s)
print(rs) # "123abcdddA"

只字符串中的保留汉字

1
2
3
4
5
import re
s = "我爱中国🇨🇳,I love China。"
# 把所有编码非\u4e00-\u9fa5(汉字)的字符替换为空字符串
rs = re.sub("([^\u4e00-\u9fa5])", '', s)
print(rs) # "我爱中国"

对应的unicode编码范围

说明 unicode范围
数字 \u0030-\u0039
汉字 \u4e00-\u9fa5
大写字母 \u0041-\u005a
小写字母 \u0061-\u007a
英文字母 \u0041-\u007a
韩文 \uAC00-\uD7AF
日文 \u3040-\u31FF