文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

4.累积分布函数CDF

2023-09-03 15:06

关注

累积分布函数CDF

从数学上来说,对于连续型随机变量,累积分布函数(Cumulative Distribution Function, 简称CDF)是概率分布函数的积分。
累积分布函数就是 分布函数 。

对于一维数据的可视化,直方图(Histogram)与核密度估计(Kernel Density Estimates)可以很好的表示各个数据值的概率分布,但在表示数据累积分布上这两种方法就无能为力了。

数据的累积分布,也即小于等于当前数据值的所有数据的概率分布,对于表示数据点在某个区间内出现的概率有很大的帮助。

在这里插入图片描述

以-4到4之间分布的10000个数据点为例,绘制成直方图与核密度估计是这样的:

在这里插入图片描述
在这里插入图片描述
这两张图可以很好的表示-4到4之间任意数据值的概率大小,但是在回答下面几个问题的时候就比较困难了:

在上述例子中,数据集大致遵循正态分布,因此从直方图或核密度估计的结果中推测这两个问题的答案还是可能的;但是对于不规则的概率分布曲线来说,这样做就基本上行不通了。回答上述问题的通用方法是绘制累积分布函数图:
在这里插入图片描述
根据这张累积分布函数图,可以很方便地回答之前的两个问题:

与直方图、核密度估计相比,累积分布函数存在以下几个特点:

PDF:连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

概率密度函数,描述可能性的变化情况,比如正态分布密度函数,给定一个值, 判断这个值在该正态分布中所在的位置后, 获得其他数据高于该值或低于该值的比例。

CDF:能完整描述一个实数随机变量x的概率分布,是概率密度函数的积分。随机变量小于或者等于某个数值的概率P(X<=x)即:F(x) = P(X<=x)。

可使用 CDF 确定取自总体的随机观测值将小于或等于特定值的概率。还可以使用此信息来确定观测值将大于特定值或介于两个值之间的概率。

对于所有实数x,CDF(cumulative distribution function),与概率密度函数PDF(probability density function)相对。任何一个CDF,是一个不减函数,累积和为1。累计分段概率值就是所有比给定x小的数在数据集中所占的比例。任意特定点处的填充x的 CDF 等于 PDF 曲线下直至该点左侧阴影面积。

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npdata = []data = pd.read_csv("D:\\dataset.csv", header=None)print(data)denominator = len(data[0])  # 分母数量Data = pd.Series(data[0])  # 将数据转换为Series利用分组频数计算Fre = Data.value_counts()Fre_sort = Fre.sort_index(axis=0, ascending=True)Fre_df = Fre_sort.reset_index()  # 将Series数据转换为DataFrameFre_df[0] = Fre_df[0] / denominator  # 转换成概率Fre_df.columns = ['Rds', 'Fre']Fre_df['cumsum'] = np.cumsum(Fre_df['Fre'])plot = plt.figure()ax1 = plot.add_subplot(1, 1, 1)ax1.plot(Fre_df['Rds'], Fre_df['cumsum'])ax1.set_title("CDF")ax1.set_xlabel("Rds")ax1.set_ylabel("P")ax1.set_xlim(0.1, 0.5)plt.show()

在这里插入图片描述

概率分布函数(累积概率函数),概率密度函数

Python中概率累计分布函数(CDF)分析

来源地址:https://blog.csdn.net/u014217137/article/details/127800831

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯