字符串是python中重要的数据对象
python字符串是以单引号、双引号、或者三个三单引号三个双引号包含的任意的python数据对象都可以称为python字符串
注意:以单引号或双引号包含的数据对象中间不可以换行(若需要换行需要用转义字符\n),三个单引号或三个双引号可以包含多行的数据对象。
一、转义符
在任何的语言里都有转义符这样的概念存在,转义符是让含有特殊意义的字符失去特殊的意义,按照普通的形式打印。
例如我们需要打印出某个文件的路径
print 'c:\note\takes.txt'
执行结果为
c:
ote akes.txt
这并不是我们想要的结果,这时需要用转义字符,使\n和\t这些含有特殊意义的字符失去本身的意义,才会按照正确的格式打印出来。
print 'c:\\note\\takes.txt'
执行结果为
c:\note\takes.txt
也可以在字符串前面添加“r”使接下来的整个字符串中的特殊字符失去特殊的意义。
print r'c:\note\takes.txt'
二、字符串分片操作(游标)
字符串是有序的序列
索引开始从0开始,结束为-1
分片操作包含索引开始值,但是不包含终止值,通常是终止值减1
字符串变量[游标]:返回当前游标所对应的字符。
字符串变量[开始游标,结束游标,步长]:开始游标指截取字符串的开始下标;结束游标指截取字符串的结束下标;步长是指游标的间隔数。
注意:截取的结果包括开始游标不包括结束游标;开始游标可以省略,省略默认为0;结束游标可省,省略默认为截取到字符串末尾;步长可省,省略默认为1。
a='0123456789'
print a[1]
print a[-2]
print a[2:4]
print a[2:8:2]
print a[:7:2]
print a[2:7:]
print a[2::]
执行结果为
1
8
23
246
0246
23456
23456789
三、字符串方法
字符串方法是针对字符串的操作,方法已经定义并封装,使用简化操作和代码重写
1.字符串填充方法
center(width[,fillchar])
字符串在指定长度内居中
ljust(width[,fillchar])
字符串在指定长度内靠左对齐
rjust(width[,fillchar])
字符串在指定长度内靠右对齐
zfill(width)
zfill()即是以字符0进行填充,在输出数值时比较常用
width:宽度表示字符在什么宽度内居中,该数值包括字符串本身的长度,若指定的长度小于字符串本身的长度,该方法不会生效
fillchar:可选参数,表示以什么字符填充空白部分,默认是空格。
注意:若指定的长度过大,运行窗口一行放不下时会换行显示,影响显示效果。
a='0123456789'
print a.center(50,'*')
print a.ljust(50,'*')
print a.rjust(50,'*')
print '1'.zfill(2)
print '10'.zfill(2)
执行结果为
********************0123456789********************
0123456789****************************************
****************************************0123456789
01
10
expandtabs([tabsize])
expandtabs()的tabsize 参数默认为8。它的功能是把字符串中的制表符tab转换为适当数量的空格。
注意:
tabsize参数包括从该制表符到它的上一个制表符的所有字符;
若tabsize的值小于等于该制表符到它的上一个制表符的所有字符,则显示的空格数是(x*tabsize-该制表符到它的上一个制表符的所有字符数);
若tabsize的值大于该制表符到它的上一个制表符的所有字符,则显示的空格数是(tabsize-该制表符到它的上一个制表符的所有字符数).
a='123\twfdsf\tadfsd'
b='012345678901234567890'
print b
print a.expandtabs(3)
print a.expandtabs(2)
print a.expandtabs(4)
print a.expandtabs(7)
执行结果为
012345678901234567890
123 wfdsf adfsd
123 wfdsf adfsd
123 wfdsf adfsd
123 wfdsf adfsd
2.字符串删减方法
strip()函数族用以去除字符串两端的空白符
strip([chars]) 去掉字符串两端的指定的符号
rstrip([chars]) 去掉字符串右端的指定的符号
lstrip([chars]) 去掉字符串左端的指定的符号
chars:可省参数,表示要去掉的字符,可以是多个字符,省略默认为空格。
a=' adfasdff '
print a.strip()
print a.lstrip()
print a.rstrip()
a='**********adfadsfasdfasd**********'
print a.strip('*')
print a.lstrip('*')
print a.rstrip('*')
a='*!*!*!*!*!adfadsfasdfasd*!*!*!*!'
print a.strip('*!')
print a.lstrip('*!')
print a.rstrip('*!')
执行结果为
adfasdff
adfasdff
adfasdff
adfadsfasdfasd
adfadsfasdfasd**********
**********adfadsfasdfasd
adfadsfasdfasd
adfadsfasdfasd*!*!*!*!
*!*!*!*!*!adfadsfasdfasd
3.字符串变形方法
lower() 将字符串转换为小写
upper() 将字符串转换为大写
capitalize() 首字母大写
swapcase() 大小写之间转换
title() 单词首字母大写(按空格等间隔符来区分单词,不能区分单词拼写是否正确)
a='Hello World,Python!'
print a.lower()
print a.upper()
print a.capitalize()
print a.swapcase()
print a.title()
a='hello world,python!'
print a.capitalize()
print a.title()
执行结果为
hello world,python!
HELLO WORLD,PYTHON!
Hello world,python!
hELLO wORLD,pYTHON!
Hello World,Python!
Hello world,python!
Hello World,Python!
4.字符串切分方法
splitlines([keepends])返回一个列表,将字符串按行\n分隔.keepends:可选参数,若为True,会在列表中分割的子串中显示换行符\n;若为False不显示.默认为False。
split([sep[,maxsplit]])返回一个列表,将字符串按某个字符从左向右分隔
rsplit([sep[,maxsplit]])返回一个列表,将字符串按某个字符从右向左分隔分隔
sep:可选参数,按指定的字符分隔字符串,默认按空格、换行、制表符等符号分隔
maxsplit:可选参数,指定分隔的次数,默认是分隔全部的字符串。
split和rsplit在不指定maxsplit参数的情况下是完全相同的效果。
a='hello world python \ni am comming \nabc123'
print a.splitlines()
print a.splitlines(True)
print a.split()
print a.split(' ')
print a.split(' ',4)
print a.rsplit()
print a.rsplit(' ')
print a.rsplit(' ',4)
执行结果为
['hello world python ', 'i am comming ', 'abc123']
['hello world python \n', 'i am comming \n', 'abc123']
['hello', 'world', 'python', 'i', 'am', 'comming', 'abc123']
['hello', 'world', 'python', '\ni', 'am', 'comming', '\nabc123']
['hello', 'world', 'python', '\ni', 'am comming \nabc123']
['hello', 'world', 'python', 'i', 'am', 'comming', 'abc123']
['hello', 'world', 'python', '\ni', 'am', 'comming', '\nabc123']
['hello world python', '\ni', 'am', 'comming', '\nabc123']
5.字符串连接方法
join(seq)将字符串的值插入到seq参数提供的字符串中
join() 函数的高效率(相对于循环相加而言)使它成为最值得关注的字符串方法之一
print '123'.join('abcdef')
print 'Hello'.join('|||')
执行结果为
a123b123c123d123e123f
|Hello|Hello|
6.字符串判断方法
isalnum()判断是否为字母或数字,不包含其他字符,若是字母或数字返回True
isalpha()判断是否为字母,若是字母,返回True
isdigit()判断是否为数字,若是数字,返回True
islower()判断字符串中的字母是否全部为小写,若是,返回True
isupper()判断字符串中的字母是否全部为大写,若是,返回True
isspace()判断是否是空格,若是空格,返回True
istitle()判断首字母是否是大写,若是,返回True
print 'python!123'.isalnum(),'python123'.isalnum()
print 'Python123'.isalpha(),'Python'.isalpha()
print 'python123'.isdigit(),'123'.isdigit()
print 'python'.islower(),'python123'.islower(),'Python'.islower(),'PYTHON'.islower()
print 'PYTHON'.isupper(),'PYTHON123'.isupper(),'Python'.isupper(),'python'.isupper()
print ' '.isspace(),' python'.isspace()
print 'Python good'.istitle(),'python Good'.istitle(),'Python Good'.istitle()
执行结果为
False True
False True
False True
True True False False
True True False False
True False
False False True
startswith(prex[, start[, end]])判断字符串是否是以prex参数的值开始的,若是,返回True。
endswith(sux[,start[, end]])判断字符串是否是以sux参数的值结束的,若是,返回True。
start:可省参数,指定字符串的开始游标,省略默认为0
end:可省参数,指定字符串的结束游标,省略默认为截取到字符串结尾。
print 'Python123'.startswith('p'),'Python123'.startswith('P'),'Python123'.startswith('Py')
print 'Python123'.startswith('th',2),'Python123'.startswith('h',3,5)
print 'Python123'.endswith('123'),'Python123'.endswith('3')
print 'Python123'.endswith('on',2,6),'Python123'.endswith('123',4)
执行结果为
False True True
True True
True True
True True
7.字符串查找方法
count( sub[, start[, end]])统计sub参数在字符串中出现的次数
find( sub[, start[, end]])查找sub参数在字符串中首次出现的位置,若没找到,返回-1
index( sub[, start[, end]])查找sub参数在字符串中首次出现的位置,若没找到,报错
start参数和end参数与startswith()方法的start,end参数使用方法相同。
a='012345678901234567890123456789'
print a.count('3'),a.count('23',4,14)
print a.find('3'),a.find('23',14,24),a.find('e')
print a.index('3'),a.index('23',14,24),a.index('e')
执行结果为
3 1
3 22 -1
3 22
Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\123.py", line 4, in <module>
print a.index('3'),a.index('23',14,24),a.index('e')
ValueError: substring not found
8.字符串替换方法
replace(old, new[,count])将字符串中old的值替换为new的值。
replace()函数的 count 参数用以指定最大替换次数
a='012345678901234567890123456789'
print a.replace('1','q'),a.replace('1','q',2)
print a.replace('123','qw'),a.replace('123','qw',2)
执行结果为
0q234567890q234567890q23456789 0q234567890q234567890123456789
0qw4567890qw4567890qw456789 0qw4567890qw4567890123456789
9.字符串编码方法
encode([encoding[,errors]])加码
decode([encoding[,errors]])解码
这是一对互逆操作的方法,用以编码和解码字符串。因为str是平台相关的,它使用的内码依赖于操作系统环境,而unicode是平台无关的,是Python内部的字符串存储方式。unicode可以通过编码(encode)成为特定编码的str,而str也可以通过解码(decode)成为unicode