文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python实现随机生成一个汉字的方法分享

2023-01-09 12:01

关注

需求来源

在编写爬虫训练场 项目时,碰到一个随机头像的需求,这里用汉字去随机生成。

模拟的效果如下所示,输入一组汉字,然后返回一张图片。

接口地址如下所示:

https://ui-avatars.com/api/?name=梦想橡皮擦&background=03a9f4&color=ffffff&rounded=true

其中参数说明如下:

我们在下一篇博客完成生成图片效果,本篇先实现随机汉字生成。

随机汉字

生成随机汉字的模块不是 Python 自带的功能,但是你可以使用 Python 的 random 模块来生成随机数,然后使用 Unicode 编码来获取对应的汉字。

下面是一个简单的例子,它生成一个随机的汉字:

import random

def get_random_char():
    # 汉字编码的范围是0x4e00 ~ 0x9fa5
    val = random.randint(0x4e00, 0x9fa5)
    # 转换为Unicode编码
    return chr(val)

print(get_random_char())

如果你想生成多个随机汉字,可以使用一个循环来调用 get_random_char() 函数,并将生成的汉字拼接起来。

下面的代码生成了 5 个随机汉字:

import random

def get_random_char():
    # 汉字编码的范围是0x4e00 ~ 0x9fa5
    val = random.randint(0x4e00, 0x9fa5)
    # 转换为Unicode编码
    return chr(val)

# 生成5个随机汉字
random_chars = ""
for i in range(5):
    random_chars += get_random_char()

print(random_chars)

随机生成常用汉字

直接使用 Unicode 编码,会出现很生僻字,在实战中可以使用部分策略解决该问题,例如找一篇长文,将其存储到一个文本文件中,然后使用 Python 的读写文件功能来读取文件中的汉字。

从互联网找一段文字,添加到 demo.txt 中,用于后续生成随机汉字。

从 demo.txt 中读取文字,这里再补充一个步骤,由于随机生成的文本中会有标点符号,所以需要进行去除。使用 Python 的字符串方法 translate 来实现。

import string

s = "Hello, xiangpica! How are you today?"

# 创建字符映射表
translator = str.maketrans('', '', string.punctuation)

# 使用字符映射表去除标点符号
s = s.translate(translator)

print(s)

结果该方法仅能去除 ASCII 编码的标点符号(例如 !、? 等)。如果去除 Unicode 编码的标点符号,还需要切换方法。

最终选定的模块是 Python 的 unicodedata 模块,其提供了一系列的函数,可以帮助你处理 Unicode 字符的相关信息。

下面是一些常用的 unicodedata 函数:

import unicodedata

print(unicodedata.name('X'))
print(unicodedata.name('0'))
print(unicodedata.name('@'))

unicodedata.lookup(name):返回给定名称的 Unicode 字符。

import unicodedata

print(unicodedata.lookup('LATIN CAPITAL LETTER X'))    # X
print(unicodedata.lookup('DIGIT ZERO'))    # 0
print(unicodedata.lookup('COMMERCIAL AT'))    # @

可以使用 unicodedata.category() 函数来判断一个字符是否是标点符号,然后再使用 translate() 函数来去除标点符号。

下面这段代码,就是使用了 unicodedata 模块和 translate() 函数来去除一段文本中的所有标点符号:

import unicodedata

s = "Hello, xiangpica! How are you today?"

# 创建字符映射表
translator = {ord(c): None for c in s if unicodedata.category(c).startswith('P')}

# 使用字符映射表去除标点符号
s = s.translate(translator)
print(s)

将上述代码集成到 Python 随机生成汉字中,示例如下。

import random
import unicodedata

def get_random_common_char():
    # 读取文件中的常用汉字
    with open('demo.txt', 'r',encoding='utf-8') as f:
        common_chars = f.read()
        # 去除空格
        common_chars = common_chars.replace(' ','')
        common_chars = common_chars.strip()

        # 创建字符映射表
        translator = {ord(c): None for c in common_chars if unicodedata.category(c).startswith('P')}

        # 使用字符映射表去除标点符号
        s = common_chars.translate(translator)


    return random.choice(s)

print(get_random_common_char())

随机生成五个汉字

random_chars = ""
for i in range(5):
    random_chars += get_random_common_char()
print(random_chars)

到此这篇关于Python实现随机生成一个汉字的方法分享的文章就介绍到这了,更多相关Python随机生成汉字内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯