队列与栈的类型很相似,但它遵循的原则是先进先出(FIFO),也就是元素插入的时候只能在该数据结构的末端,而删除只能删除最前面的元素。队列同样应用广泛,例如打印机的队列或者是一个web服务器响应请求。
关于队列的方法
作为一个队列,同样要满足一下几个方法:
-
Q.enqueue(e):向队列Q的队尾添加一个元素
-
Q.dequeue(): 从队列Q中移除并返回一个元素,如果队列为空则触发一个错误
-
Q.first(): 在不移除的前提下返回队列的第一个元素,如果队列为空则触发一个错误。
-
Q.is_empty(): 如果队列Q没有包含任何元素则返回True
-
len(Q): 返回队列Q中元素的数量,通过len这个特殊方法实现
实现的想法
首先队列与栈的结构很相似,栈使用的是基于列表的方式实现的,那么队列也同样如此。
入队很容易想到借助列表的append方法,那么出队就需要一个标识来存储当前列表头部的索引,因为当有元素出队后必须改变队列头部的指向。这时就会有一个问题出现,当队列中的数据不断增多,并且出队的次数也越来越多,那么头部的索引数值也会不断增加,之前用过的头部索引的位置不再存储数据,导致该列表之前占用的位置成为了浪费的位置,这会导致列表的长度越来越大,并产生不利的影响。
对于这种问题,我们首先想到在每次出队的时候将列表中的每一个元素都向前移动一位,使列表的第一个元素永远是队列的首个元素,但是这样每次的出队都会移动所有的队列中的元素,代价太大,不可取。
于是我们使用一种更加健壮的方法,即循环使用列表的方式。简单说就是先创建一个具有默认长度的空列表,向队列添加元素即为append,队首依然用一个变量保存索引,当向队列添加元素,此时的尾部已经到达了原先列表的最大长度处,则将该元素添加到列表的头部,即之前出队后空余的位置,如果空余的位置也没有的话,则将列表的长度扩大,并将队首放到列表的首位置。
具体实现
这里先列出实现的具体代码:
class Empty(Exception):
pass
class Queue():
"""
基于循环列表的队列
"""
DEFAULT_CAPACITY = 10
def __init__(self):
self._data = [None] * Queue.DEFAULT_CAPACITY
self._size = 0
self._front = 0
def __len__(self):
return self._size
def is_empty(self):
return self._size == 0
def first(self):
if self.is_empty():
raise Empty('Queue is empty')
return self._data[self._front]
def dequeue(self):
if self.is_empty():
raise Empty('Queue is empty')
temp = self._data[self._front]
self._front = (self._front + 1) % len(self._data)
self._size -= 1
return temp
def enqueue(self, e):
if self._size == len(self._data):
self._resize(2 * len(self._data))
temp = (self._front + self._size) % len(self._data)
self._data[temp] = e
self._size += 1
def _resize(self, cap):
"""
默认cap是大于原队列长度的
"""
old = self._data
self._data = [None] * cap
front = self._front
for i in range(self._size):
self._data[i] = old[front]
front = (1 + front) % len(old)
self._front = 0
代码中的_data为存储数据的列表,_size为队列的长度,_front为队列首位置的索引。代码认真读一下还是非常容易理解的,主要利用了%求余的方式来判断队列的头部或者要插入元素的位置。其中的_resize方法可以改变队列的长度,并且将队列的首部放到了列表的首位置。
双端队列
双端队列其实已经不属于队列了,它既可以从左进从右出,也可以从右进从左出,这种灵活性其实使它使用的更加广泛。其实他只是在队列的基础上又做了一些增加与修改:
双端队列拥有的基本的方法有:
-
add_first(e)
-
add_last(e)
-
delete_first()
-
delete_last()
-
first()
-
last()
-
is_empty()
-
len(D)
其中的add_last()与队列中的enqueue()相同,delete_first()与dequeue()相同,与之不同的是多了add_first()与delete_last()
def add_first(self, e):
if self._size == len(self._data):
self._resize(2 * len(self._data))
temp = (self._front - 1) % len(self._data)
self._data[temp] = e
self._front = temp
self._size += 1
def delete_last(self):
if self.is_empty():
raise Empty('Queue is empty')
temp = self._data[(self._front + self._size - 1) % len(self._data)]
self._size -= 1
return temp
如果要使用双端队列,其实python标准库已经有现成的双端队列类供使用了,就是collections模块中的deque类。
deque类的常用方法有:
-
len(D)
-
D.appendleft(e)
-
D.append(e)
-
D.popleft()
-
D.pop()
-
D[0] 可通过索引访问
-
D[-1] 访问最后一个元素
-
D[j] = val 可通过索引修改任意一项
-
D.clear() 清除所有内容
-
D.rotate(k) 循环右移k步
-
D.remove(e) 移除第一个匹配的元素
-
D.count(e) 统计对e匹配的数量
这个库双端队列还有一些不同之处,它的构造函数中可以选择一个名为maxlen的参数,它可以设定双端队列的固定长度,当队列已经满的时候,再添加元素,比如append(e),此时并不会报错,而是在队列的另一端进行了pop处理。
参考《数据结构与算法Python语言实现》