Python的友好在于提供了非常好强大的功能函数模块,对于字符串的使用,同样提供许多简单便捷的字符串函数。Python 字符串自带了很多有用的函数,在字符串函数之前先介绍一个非常实用的dir()内置函数,因为对每一个初学者还是大佬级别的python程序员,都不能完全记住所有方法。而该函数可以查看所有这些函数,可调用 dir 并将参数指定为任何字符串(如 dir("")),其返回值包括字符串可以使用的变量、方法和定义的类型。
>>> dir("")
['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__',
'__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__',
'__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count',
'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric',
'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition',
'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
其也提供对功能函数的查询,比如经常使用的math()函数,所以无论是对后面所阐述的字符串函数还是其它函数,我们都可以用dir()内置函数来了解其它函数的类型、定义等等。下面所讲述的字符串函数会区分其不同功能来分开介绍,其函数的实现功能大致包含以下六个功能:索引特殊字符串、设置字符格式、修改字符串大小写、查看字符串特定格式、替换特定字符串、拆分特定字符串。
1 搜索字符串函数
假如我们需要在一段字符串中查找特定的子串时,通常涉及以下几个函数:
虽然这几个函数都实现了搜索特定字符串的功能,但还是包含一些区别的:
1. 函数 index 和 find 之间的差别在于没有找到指定子串时的情形 ,示例如下:
函数index会抛出异常 ValueError,而如果没有找到指定的子串,函数find将返回 -1。
2.字符串搜索函数通常从左往右(从开头往末尾)搜索,但以 r 打头的函数从右往左搜索。例如:
可以看到, 函数 find 和 index 返回传入字符串第一次出现时的起始位置索引,而 rfind 和 rindex 返回传入字符串最后一次出现时的起始位置索引。
2 设置字符串格式函数
下表列出了一些设置字符串格式的函数:
center(),ljust()和rjust()函数在日常用的使用很少,反倒是Python2.6以后的format()受到了广大字符串处理者的使用。使用format函数需要给它提供变量或者值,一个简单的例子:字符串中的 {0} 和 {1} 引用 format 的参数:它们将被替换为相应字符串或变量的值。也可以使用关键字参数的名称,
>>> '{0} like eat {1}'.format('Wangzi','banana')
'Wangzi like eat banana'
>>> '{who} {id} is Linda'.format(who='My',id='name')
'My name is Linda'
这是一些比较简单的例子,还有更多细节方面的使用可以参考string — Common string operations — Python 3.10.1 documentation。下面举一个在抓取jmx数值的实际使用案例。在大数据组件使用过程中,我们通常抓取jmx接口的数据获取详情,然后将数据接到相关的展示系统中来监控和展示:例如我们需要抓取一个队列任务扥id,使用者,运行时间等指标值(此处IP做了处理,有问题可以咨询博主)。
import json
import urllib3
import re
def get_ative_resourcemanager(rm1, rm2):
http = urllib3.PoolManager()
rm_list = [rm1, rm2]
for resourcemanager in rm_list:
url = 'http://{0}/ws/v1/cluster/info'.format(resourcemanager)
response = http.request('GET', url)
data = json.loads(response.data)
ha_state = data['clusterInfo']['haState']
if ha_state == "ACTIVE":
return resourcemanager
'''Conversion time function'''
# 毫秒级转化为hour/minutes
def conver_time(allTime):
hours = (allTime/(60*60*1000))
return hours
'''get active resourcemanager yarn application metrics'''
def get_queue_metrics():
active_resoucemanager = get_ative_resourcemanager('ip1:port',
'ip2:port')
http = urllib3.PoolManager()
url = 'http://{0}/ws/v1/cluster/apps'.format(active_resoucemanager)
response = http.request('GET', url)
data = json.loads(response.data).get('apps').get('app')
length = len(data)
for i in range(length):
'''判断application状态'''
application_state = data[i]['state']
queue = data[i]['queue']
queue_name = re.findall(r'root.*',queue,re.IGNORECASE)
#print(mobdi_queue)
if (application_state == 'RUNNING' or application_state == 'ACCEPTED'):
if queue_name:
id_metric = data[i]['id']
user_metric = data[i]['user']
queue_metrics = data[i]['queue']
elapsed_time = data[i]['elapsedTime']
runtime_metric = conver_time(elapsed_time)
print(str(id_metric) + " " + str(user_metric) + " " + str(queue_metrics) + " " + str(runtime_metric))
if __name__ == '__main__':
''''''
get_queue_metrics()
执行结果:
3 改变字符串大小写函数
提供改变字符串大小写的函数有以下五个函数:
Python 提供了各种修改字母大小写的函数,如上表。但注意标红的地方,Python并没有修改字符串,而是在这几个函数中,创建并返回一个新字符串,并没有真正修改string源字符串。
4 选定字符串函数
选定字符串函数通常用于删除字符串开头或者末尾多余的字符串,具体有striip,lstrip和rstrip三个函数。
1.如果不加字符串,将删除空白字符串:
2.删除字符串情况:
5 拆分字符串函数
Python提供了以下几个拆分字符串的函数,主要将字符串拆分成多个子串。
注意示例中存在string和string1两个字符串,函数 partition 和 rpartition 将字符串拆分为3部分,这两个函数总是返回一个这样的值:由3个字符串组成, 形式为 (head, sep, tail) ;而函数 split 以指定字符串为分隔符,将 字符串划分为一系列子串,返回一个字符串列表,列表总是分别以 [ 和 ] 打头和结尾,并用逗号分隔元素。splitlines函数按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,使用很少,而且会自行判断字符串是否包含换行符。
6 替换字符串函数
Python内置两个字符串替换函数,包括:
到此这篇关于Python学习之字符串函数使用详解的文章就介绍到这了,更多相关Python字符串函数内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!