文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python图像填充与裁剪/resize的实现代码

2024-04-02 19:55

关注

前言

有时候我们需要把图片填充成某个数字的整数倍才能送进模型。
例如,有些模型下采样倍率是8倍,或者16倍,那么输入的长和高就分别应该是8或16的整数倍。如果图片达不到,除了拉伸图像(会造成比例改变),另一种就是先填充,后裁剪。
相信搞过NLP的同学并不陌生啦。

代码

from math import ceil
from torchvision.transforms.functional import to_tensor, to_pil_image
from PIL import Image
import torch
# 填充到最接近base整数倍的长和宽图像大小
def get_padding_pic_mask(origin_png, result_png, result_mask_png, rgb=[[130, 206, 255]], base=4):
    # C, H, W
    src = Image.open(origin_png)
    src = to_tensor(src)
    # print(src.shape)  # torch.Size([3, 800, 600])
    # channel: (R, G, B) / 255
    origin_h, origin_w = src.shape[1], src.shape[2]
    print('原图像大小, height: {}, width: {}'.format(origin_h, origin_w))

    h = ceil(origin_h / base) * base
    w = ceil(origin_w / base) * base

    img = torch.ones(3, h, w)
    # 如果想要填充是黑色则注释掉上一句,换下面这一句
    # img = torch.zeros(3, h, w)

    img[:, :origin_h, :origin_w] = src 
    # 保存填充后的图片
    to_pil_image(img).save(result_png)

    # 处理一下mask
    mask = torch.tensor(rgb) / 255

    mask = mask.view(3, 1, 1).repeat(1, h, w)
    # 保存填充后的mask
    to_pil_image(mask).save(result_mask_png)
    

# 图像输出后我们需要clip一下
def clip_unpadding(input_png, output_png, origin_h, origin_w):
    # C, H, W
    img = Image.open(input_png)
    img = to_tensor(img)
    img = img[:, :origin_h, :origin_w]
    # 保存裁剪后的图片
    to_pil_image(img).save(output_png)

if __name__ == '__main__':
    # origin_png = 'pic/pic.jpg'
    # result_png = 'pic/pic_padding.jpg'
    # result_mask_png = 'pic/mask_padding.jpg'
    # get_padding_pic_mask(origin_png, result_png, result_mask_png)

    input_png = 'pic/pic_padding.jpg'
    output_png = 'pic/pic_clip.jpg'
    # 原图像大小, height: 567, width: 390
    clip_unpadding(input_png, output_png, 567, 390)

resize

有时候我们也要改变图片的宽和高。

from PIL import Image
def resize_img(origin_png, resize_png, height, width):
    img = Image.open(origin_png)
    img = img.resize((width, height))
    img.save(resize_png)
if __name__ == '__main__':
    origin_png = 'pic/white.jpg'
    resize_png = 'pic/white_resize.png'
    resize_img(origin_png, resize_png, 800, 600)

到此这篇关于python图像填充与裁剪/resize的文章就介绍到这了,更多相关python图像resize内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯