在用python绘图的时候,经常由于数据的原因导致画出来的图折线分界过于明显,因此需要对原数据绘制的折线进行平滑处理,本文介绍利用插值法进行平滑曲线处理:
实现所需的库
numpy、scipy、matplotlib
插值法实现
nearest:最邻近插值法 zero:阶梯插值 slinear:线性插值 quadratic、cubic:2、3阶B样条曲线插值
拟合和插值的区别
插值:简单来说,插值就是根据原有数据进行填充,最后生成的曲线一定过原有点。
拟合:拟合是通过原有数据,调整曲线系数,使得曲线与已知点集的差别(最小二乘)最小,最后生成的曲线不一定经过原有点。
代码实现
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
import
matplotlib.pyplot as plt import
numpy as np from
scipy import
interpolate #设置距离 x
=np.array([ 0 ,
1 ,
1.5 ,
2 ,
2.5 ,
3 ,
3.5 ,
4 ,
4.5 ,
5 ,
5.5 ,
6 ,
6.5 ,
70 ,
8 ,
9 , 10 ]) #设置相似度 y
=np.array([ 0.8579087793827057 ,
0.8079087793827057 ,
0.7679087793827057 ,
0.679087793827057 , 0.5579087793827057 ,
0.4579087793827057 ,
0.3079087793827057 ,
0.3009087793827057 , 0.2579087793827057 ,
0.2009087793827057 ,
0.1999087793827057 ,
0.1579087793827057 , 0.0099087793827057 ,
0.0079087793827057 ,
0.0069087793827057 ,
0.0019087793827057 , 0.0000087793827057 ]) #插值法之后的x轴值,表示从 0 到 10 间距为 0.5 的 200 个数 xnew
=np.arange( 0 , 10 , 0.1 ) #实现函数 func
= interpolate.interp1d(x,y,kind= 'cubic' ) #利用xnew和func函数生成ynew,xnew数量等于ynew数量 ynew
= func(xnew) #
原始折线 plt.plot(x,
y, "r" ,
linewidth= 1 ) #平滑处理后曲线 plt.plot(xnew,ynew) #设置x,y轴代表意思 plt.xlabel( "The
distance between POI and user(km)" ) plt.ylabel( "probability" ) #设置标题 plt.title( "The
content similarity of different distance" ) #设置x,y轴的坐标范围 plt.xlim( 0 , 10 , 8 ) plt.ylim( 0 , 1 ) plt.show() |
绘制后的曲线,红色是未进行平滑处理的折线,蓝色是进行平滑处理之后的曲线 cpc30
注意事项
x, y为原来的数据(少量) xnew为一个数组,条件:x??xnew
如:x的最小值为-2.931,最大值为10.312;则xnew的左边界要小于-2.931,右边界要大于10.312。当然也最好注意一下间距,最好小于x中的精度 func为函数,里面的参数x、y、kind,x,y就是原数据的x,y,kind为需要指定的方法 ynew需要通过xnew数组和func函数来生成,理论上xnew数组内的值越多,生成的曲线越平滑