如上图,最顶层的接口就是Executor,实现ExecutorService接口的类,就是对应的线程池类。
如何创建线程池
用Executors工具类,可以很方便地创建各种线程池。(但是实际开发我们不推荐,阿里巴巴的开发手册严令禁止使用Executors,应该用ThreadPoolExecutor)Executors 类可以创建多种类型的线程池,每种线程池都有不同的特点和适用场景。
(1) FixedThreadPool(固定大小线程池):
- 使用 Executors.newFixedThreadPool(int nThreads) 方法创建。
- 具有固定大小的线程池,即线程数量固定不变。
- 适用于需要控制线程数量的场景,例如服务器端处理请求。
(2) CachedThreadPool(缓存线程池):
- 使用 Executors.newCachedThreadPool() 方法创建。
- 具有自动调整线程数量的线程池,根据需要创建新线程,空闲线程会被回收。
- 适用于执行大量短期异步任务的场景,例如异步IO操作。
(3) SingleThreadPool(单线程线程池):
- 使用 Executors.newSingleThreadExecutor() 方法创建。
- 只有一个工作线程的线程池,所有任务按顺序执行。
- 适用于需要保证顺序执行的任务场景,例如日志处理。
(4) ScheduledThreadPool(定时任务线程池):
- 使用 Executors.newScheduledThreadPool(int corePoolSize) 方法创建。
- 具有定时执行任务的功能,可以按固定的频率执行任务。
- 适用于需要定时执行任务的场景,例如定时任务调度。
(5) WorkStealingPool(工作窃取线程池):
- 使用 Executors.newWorkStealingPool(int parallelism) 方法创建。
- 基于ForkJoinPool实现的线程池,每个线程都有自己的任务队列,可以窃取其他线程的任务来执行。
- 适用于需要处理大量并行任务的场景,例如并行计算任务。
为什么不推荐用Executors创建?
线程池底层原理
我们以ThreadPoolExecutor为例,它是ExecutorService的一种实现。
一般我们根据一个类的构造器,可以看出里面的大致思路:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
参数很多,但是我们每一个都必须要记住。 这个 ThreadPoolExecutor 的构造函数接受以下参数:一个线程池就好比一家公司,甲方员工干不完需求的时候,就要招一些外包人员驻场开发,如果活干完了,就让外包撤场,只留下自己的员工。
- corePoolSize(核心线程数):线程池中保持活跃的线程数量,即使它们处于空闲状态。当提交任务时,线程池会尝试保持至少这么多数量的线程处于活跃状态。 就是公司正式员工的数量。
- maximumPoolSize(最大线程数):线程池中允许的最大线程数量。当任务队列已满且核心线程都处于活跃状态时,线程池会创建新的线程,直到达到这个最大线程数。 就是公司甲方员工+外包员工的总数,不能超过这个数量。
- keepAliveTime(线程空闲时间):非核心线程在空闲状态下的最长存活时间。超过这个时间,多余的非核心线程将被终止,直到线程数量不超过核心线程数。 如果外包员工长时间没需求,就通知乙方撤人,裁掉这个非核心人员。当然,甲方爸爸是不会裁的。
- unit(时间单位):用于指定 keepAliveTime 参数的时间单位,通常是秒、毫秒、微秒等。
- workQueue(工作队列):用于保存等待执行的任务的阻塞队列。当所有线程都处于忙碌状态时,新提交的任务会被放入这个队列中等待执行。 当需求多到加上外包员工都做不完了,就只能往后排期了。
- threadFactory(线程工厂):用于创建新线程的工厂。每个新创建的线程都是通过这个工厂创建的。** 就是定义员工的属性,即工牌,这个员工属于哪个公司的。**
- handler(拒绝策略):当任务无法被执行时(通常是由于线程池已关闭或者任务队列已满),用于处理被拒绝的任务的策略。常见的拒绝策略包括抛出异常、丢弃任务或者在调用者线程中执行任务。 默认是不处理。
这些参数可以用于配置 ThreadPoolExecutor 对象,以满足不同的线程管理需求。
线程池本质就是一个HashSet,所以是无序的。有新的任务提交进来,如果池子还有线程,就直接拿去处理,池子满了就放入阻塞队列,等待有线程空闲。
线程数怎么设置比较合理?
这个是没有银弹的,我们一般认为CPU密集型的应用,设置为CPU核数N+1。所谓CPU密集型,就是这个程序计算量比较多,还比较频繁,计算时间长,也就是所谓的比较吃配置,比如是一个专门做算法的服务(组托,配载运算之类的)。
对于IO密集型的应用,设置为2N+1,什么是IO密集型的应用呢,就是提供数据服务比较多,吞吐量比较大,等待时间长的应用,大部分业务系统都属于此类。
除此之外,线程数还跟jvm,机器cpu是否可以超线程(云服务器一般没法超线程),我们看到的cpu核数一般不是真实的,所以我们推荐先根据常规设置一个线程数量,上线后根据具体情况再调整就行了。