python流水线框架pypeln的安装使用教程-编程学习网

1. 安装和入门使用

安装pip install pypeln，基本元素如下：

在这里插入图片描述

2 基于multiprocessing.Process

这个是基于多进程。


import pypeln as pl
import time
from random import random

def slow_add1(x):
    time.sleep(random()) # <= some slow computation
    return x + 1

def slow_gt3(x):
    time.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.process.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.process.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

3 基于threading.Thread

顾名思义，基于多线程。


import pypeln as pl
import time
from random import random

def slow_add1(x):
    time.sleep(random()) # <= some slow computation
    return x + 1

def slow_gt3(x):
    time.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.thread.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.thread.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

4 基于asyncio.Task

协程，异步io。


import pypeln as pl
import asyncio
from random import random

async def slow_add1(x):
    await asyncio.sleep(random()) # <= some slow computation
    return x + 1

async def slow_gt3(x):
    await asyncio.sleep(random()) # <= some slow computation
    return x > 3

data = range(10) # [0, 1, 2, ..., 9] 

stage = pl.task.map(slow_add1, data, workers=3, maxsize=4)
stage = pl.task.filter(slow_gt3, stage, workers=2)

data = list(stage) # e.g. [5, 6, 9, 4, 8, 10, 7]

5 三者性能对比

IO 密集型应用CPU等待IO时间远大于CPU 自身运行时间，太浪费；常见的 IO 密集型业务包括：浏览器交互、磁盘请求、网络爬虫、数据库请求等。
Python 世界对于 IO 密集型场景的并发提升有 3 种方法：多进程、多线程、异步 IO(asyncio)。理论上讲asyncio是性能最高的，原因如下：
1.进程、线程会有CPU上下文切换
2.进程、线程需要内核态和用户态的交互，性能开销大；而协程对内核透明的,只在用户态运行
3.进程、线程并不可以无限创建，最佳实践一般是 CPU*2；而协程并发能力强，并发上限理论上取决于操作系统IO多路复用(Linux下是 epoll)可注册的文件描述符的极限

在这里插入图片描述

下面是一个数据库访问的测试：

在这里插入图片描述

内存：
串行：75M
多进程：1.4G
多线程：150M
asyncio：120M

以上就是python流水线框架pypeln的安装使用教程的详细内容，更多关于python流水线框架的资料请关注编程网其它相关文章！

文章详情

python流水线框架pypeln的安装使用教程

1. 安装和入门使用

2 基于multiprocessing.Process

3 基于threading.Thread

4 基于asyncio.Task

5 三者性能对比

软考中级精品资料免费领

相关文章

猜你喜欢

python流水线框架pypeln的安装使用教程

Python的GUI框架PySide的安装配置教程

【100天精通python】Day49：python web编程_web框架，Flask框架从安装到使用

在Python程序和Flask框架中使用SQLAlchemy的教程

Python ORM数据库框架Sqlalchemy的使用教程详解

【100天精通Python】Day50：Python Web编程_Django框架从安装到使用

Python的Django框架中使用SQLAlchemy操作数据库的教程

在Python的Flask中使用WTForms表单框架的基础教程

Python的Flask框架标配模板引擎Jinja2的使用教程

Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程

python爬虫之selenium库的安装及使用教程

使用Python的Twisted框架构建非阻塞下载程序的实例教程

Python pip超详细教程之pip的安装与使用

python编写脚本之pyautogui的安装和使用教程

Python使用Selenium WebDriver的入门介绍及安装教程

Python pip超详细教程之pip的安装与使用

Python的Flask框架中使用Flask-Migrate扩展迁移数据库的教程

Python使用django框架实现多人在线匿名聊天的小程序

Python通用验证码识别OCR库ddddocr的安装使用教程

你知道如何使用Python同步关键字来解决框架中的线程安全问题吗？