首页 >行情 > > 正文

$\Beta$分布推导与可视化

博客园 2023-04-14 16:30:50
$\Gamma$函数

$\Gamma$函数(Gamma函数)是阶乘函数在实数和复数域的扩展。对于正整数$n$,阶乘函数表示为$n! = 1 \times 2 \times ... \times n$。然而,这个定义仅适用于正整数。Gamma函数的目的是将阶乘扩展到实数和复数域,从而计算实数和复数的“阶乘”。$\Gamma$函数定义如下:


(资料图)

$\displaystyle \Gamma(x) = \int_0^\infty t^{x-1}e^{-t} dt $

其中,$x$是一个复数,定义域是$\{x|x\in C- Z^--\{0\}\}$,也就是除了负整数和$0$之外的所有复数。通过这个定义,$\Gamma$函数可以用来计算实数和复数的“阶乘”。在实数域与复数域的可视化如下:

$\Gamma$函数具有以下性质:

1、对于正整数$n$,有$\Gamma(n) = (n - 1)!$。这表明$\Gamma$函数在正整数上与阶乘函数相符。

2、$\Gamma$函数满足递推关系:$\Gamma(x + 1) = x\Gamma(x)$(注意和整数阶乘的联系)。

3、$\Gamma$函数用于定义很多常见的概率分布,如$\Gamma$分布、Beta分布和t分布等。

$\Beta$分布基于伯努利实验的推导

$\Beta$分布(Beta分布)与伯努利试验相关。在伯努利试验中,假设硬币朝上的概率为$p$。当抛$a+b$次硬币,硬币朝上的次数为$a$时,计算该情况的概率为

$ \displaystyle C_{a+b}^ap^a(1-p)^b$

上式表示二项分布在这一事件(即$a+b$次实验,$a$次正面)下的概率。则$\Beta$分布表示:把概率$p$看做随机变量,固定$a,b$,发生相应事件的概率分布。为了获取$\Beta$分布的概率密度,需要计算以上概率关于$p$的积分的归一化系数$k$,使得:

$\displaystyle k \int_0^1C_{a+b}^ap^a(1-p)^b dp=1$

推导出

$\displaystyle k =\left(\int_0^1C_{a+b}^ap^a(1-p)^b dp\right)^{-1}=a+b+1 $

以上积分我不会算,但是可以通过以下程序来验证。

from scipy.special import combdef Int(func, l, h, n=1000): #模拟定积分    a = np.linspace(l, h, n)    return func(a).sum()*(h-l)/na, b = 5, 2 #取任意整数k = a + b + 1def func(x):    return comb(a+b, a) * (x**a) *((1-x)**b)Int(func, 0, 1) * k # = 1

获得概率密度函数:

$ \begin{align} f(p; a, b)&=(a+b+1)C_{a+b}^ap^a(1-p)^b\\ &=\frac{(a+b+1)!}{a!b!}p^a(1-p)^b\\ \end{align} $

把阶乘拓展为$\Gamma$函数,上式就变成

$\begin{align}f(p; a, b)=\frac{\Gamma(a+b+2)}{\Gamma(a+1)\Gamma(b+1)}p^a(1-p)^b\end{align}$

令$a=\alpha-1,b=\beta-1,p=x$,就可以得到常见的$\Beta$分布的密度函数表示形式:

$\begin{align}\displaystyle f(x;\alpha,\beta)=\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}=\frac{1}{\Beta(\alpha,\beta)}x^{\alpha-1}(1-x)^{\beta-1}\end{align}$

其中$\alpha>0,\beta>0,0联合概率密度正整数情况

关于(2)式,我们把其中的$a,b,p$都看作随机变量,再除以一个归一化系数,就可以构成这三个随机变量的联合概率密度,从而可以非常直观地理解$\Beta$分布。分别固定抽样次数$n=0,1,2,5,10,15$,可视化如下:

其中,当以抽样概率$p$为条件时,在y轴上,就是离散的关于$a$的二项分布。当以$a$为条件时,在x轴上,就是连续的关于$p$的$\Beta$分布。可以观察到,当$a

此外,当在y轴方向上进行求和,可以得到$p$的边缘分布,为均匀分布;而当在x轴方向上进行积分,得到$a$的边缘分布,也是均匀分布。但感觉边缘分布似乎没有什么意义,不知理解是否正确。可视化代码如下:

import matplotlib.pyplot as pltfrom scipy.special import gammaimport numpy as npimport matplotlib matplotlib.rcParams["font.family"] = "Times New Roman"def Beta(a, b, p):    g1, g2, g3 = gamma(a+b+2), gamma(a+1), gamma(b+1)    return g1/(g2*g3) * p**(a) * (1-p)**(b)def BetaHot(n, samp_n = 1000):    p = np.linspace(0, 1, samp_n)    a = np.linspace(0, n, n+1)    P, A = np.meshgrid(p, a)    Z = Beta(A, n-A, P)/(n+1)    per_width = samp_n//(n+1)    Z1 = np.repeat(Z, per_width, 0)    # 热力图    plt.imshow(Z1, origin="lower", cmap="Blues")    plt.colorbar()    # 关于p的密度图    for i, t in enumerate(Z):        plt.plot(np.linspace(-0.5, samp_n-0.5, samp_n), i*per_width+per_width*t-0.5, "--", c="red")    # 绘图设置    plt.xlabel("p")    plt.ylabel("a")    old_yticks = np.linspace(per_width/2-0.5, Z1.shape[0]-0.5-per_width/2, n+1)    plt.yticks(old_yticks, [f"{i:.0f}" for i in np.linspace(0, n, n+1)])    old_xticks = np.linspace(-0.5, samp_n-0.5, 6)    plt.xticks(old_xticks, [f"{i:.1f}" for i in np.linspace(0, 1, 6)])    plt.ylim([0, samp_n+4])    plt.title("n = a + b = %d"%n)    plt.savefig("img/n = %d.png"%n)    plt.show()for n in [0, 1, 2, 5, 10, 15]:    BetaHot(n)
一般情况

以上可视化的是$a,b$取为正整数时$\Beta$分布的情况,即(2)式。对于更一般的情况(4)式,即取$\alpha,\beta$为大于0的实数,在(3)式中就是$a>-1,b>-1$,尽管并不符合真实伯努利试验的情况,但仍可以计算。可视化如下:

可以看出,$a,b$都小于0时,密度函数会变成U形。且依旧是,$a$相比$b$越小,形状越往左偏。可视化代码如下:

import matplotlib.pyplot as pltfrom scipy.special import gammaimport numpy as npimport matplotlib matplotlib.rcParams["font.family"] = "Times New Roman"def Beta(a, b, p):    g1, g2, g3 = gamma(a+b+2), gamma(a+1), gamma(b+1)    beta = g1/(g2*g3) * p**(a) * (1-p)**(b)    return betafor n in [-1, 0, 1, 2, 5, 10]:    for a in np.linspace(-0.9, n+0.9, 3):        p = np.linspace(0.0001, 0.9999, 300)        b = n-a        y = Beta(a, b, p)        plt.plot(p, y, label="a = %.1f, b = %.1f"%(a, b))    plt.legend(loc="upper center")    plt.ylim([-0.1, 3])    plt.title("a + b = %.1f" % n)    plt.savefig("img/a + b = %.1f.png" % n)    plt.show()
参考

1. 共轭先验:https://www.zhihu.com/question/41846423?sort=created

2. 狄利克雷分布:https://zhuanlan.zhihu.com/p/425388698

上一篇:同比增长15.8%!一季度全省城镇新增就业24.9万人 山东各项就业主要指标稳中有进 下一篇:最后一页
x
推荐阅读

$\Beta$分布推导与可视化

2023-04-14

同比增长15.8%!一季度全省城镇新增就业24.9万人 山东各项就业主要指标稳中有进

2023-04-14

身边云受邀参加「第十三届InsurDigital数字保险峰会」 当前速讯

2023-04-14

环球即时:冒充学霸叫卖假冒名校文创产品 百万粉丝“网红”获刑

2023-04-14

2017cad产品序列号和密钥 cad产品序列号和密钥

2023-04-14

【独家】长郡十八校2023第二次联考历史答案及试题解析!_更新中

2023-04-14

投资者获利了结 国际油价13日下跌|每日快看

2023-04-14

加速融圈!渠县与新都忠县达成多项合作

2023-04-14

华岭股份:4月13日融资买入2.65万元,融资融券余额41.26万元

2023-04-14

焦点播报:美迪凯:4月13日融资净买入658.38万元,连续3日累计净买入1151.12万元

2023-04-14

基蛋生物:融资净买入45.78万元,融资余额3.22亿元(04-13)-天天快播

2023-04-14

海南矿业:将持续关注全球优质铁矿项目

2023-04-14

西平县气象台发布大雾黄色预警【Ⅲ级/较重】 焦点资讯

2023-04-14

三国志9武将登录器怎么使用_三国志9武将登录器|环球速讯

2023-04-13

属羊人2022年多少岁,属羊人2022年运势运程-独家

2023-04-13

重庆江津警方紧急按下“止付键”,89万被骗资金返还群众!

2023-04-13

今年医疗保险怎么参保 今年医疗保险一个人多少钱? 全球快资讯

2023-04-13

每日简讯:开明投资(00768)3月末每股资产净值约为0.071港元

2023-04-13

人教版高一数学必修一目录_人教版高一数学

2023-04-13

蓝晓科技:公司作为吸附分离技术公司,为国内外多个盐湖提供产业化提锂装置|世界看点

2023-04-13

陆家嘴:参股公司147.78亿元竞得德茗置业、筠铭置业各80%股权及相关债权

2023-04-13

环球短讯!百岁老人生日送什么礼物比较好

2023-04-13

第五套人民币小全套价格(2023年4月13日)

2023-04-13

【天天聚看点】小米AR眼镜桌面控制软件著作权获批登记

2023-04-13

环球讯息:中国3月出口同比增长14.8%

2023-04-13

当前热讯:MySQL的基本术语和概念

2023-04-13

抓农时忙采收!小型农机助力春耕 特色作物让群众增收致富-环球时讯

2023-04-13

湖人以108比102逆转森林狼锁定西部第七 全球看点

2023-04-13

庆元乡贤争当乡村振兴“合伙人” 天天看点

2023-04-13

香港金管局再承接90.51亿港元沽盘 累计接钱2811.35亿港元

2023-04-13

看了50+多个招商总岗位要求,总的来说有3点 全球球精选

2023-04-13

卡方检验自由度怎么算_自由度怎么算

2023-04-13

【新要闻】涉嫌严重职务违法!云阳县人力资源和社会保障局一级主任科员陈钢炼接受监察调查

2023-04-12

天天热点!意贸促机构官员:中国市场极具发展空间 意大利高度重视消博会平台

2023-04-12

世界速看:上海朵云轩拍卖有限公司怎么样_上海朵云轩拍卖有限公司

2023-04-12

每日观点:阜阳师大武术代表队国赛获佳绩

2023-04-12

最新:不是闹着玩的3电影完整版高清_不是闹着玩的3电影完整版

2023-04-12

高质量发展厚植企业再投资热土

2023-04-12

天天热点!一季度中欧班列开行4186列 承运货物日益丰富

2023-04-12

广交会全面恢复实体展 外贸企业如何应对存量时代?

2023-04-12

特斯拉新型Yoke方向盘将采用“改进材料”|全球今日报

2023-04-12

全国水利工程建设工作会议在厦召开 焦点热闻

2023-04-12

当前观察:张家界慈利税务:三队同行吹响税惠春风“集结号”

2023-04-12

全球新消息丨空气净化器还能“靠天吃饭”吗? 空气净化器行业市场分析

2023-04-12

王文涛部长会见英特尔公司首席执行官基辛格

2023-04-12

每日消息!中国社科院金融所一季度中国宏观金融分析:欧美加息方向或难逆转 国内通缩压力隐现

2023-04-12

【全球速看料】北京2023年积分落户4月13日启动申报 规模6000人

2023-04-12

环球资讯:芝加哥农产品期价11日涨跌不一

2023-04-12

“淄博烧烤热”给文旅推介上了一课 天天日报

2023-04-12

天天热消息:航空机场板块4月11日跌1.24%,吉祥航空领跌,主力资金净流出1.59亿元

2023-04-12

4月02日 汤姆·吉沃恩的曲线延伸到宾夕法尼亚州的农舍附近|全球今日报

2023-04-12

世界快资讯丨长三角多地气温直冲30℃ “及时雨”减轻沙尘影响

2023-04-11

世界今日讯!严重安全隐患!波音遭监管部门彻查!

2023-04-11

环球报道:dnf盗号申诉装备找回流程(dnf盗号申诉装备找回)

2023-04-11

锂价要止跌?“锂业双雄”H股同步大涨,行研机构称“需求有回暖迹象”

2023-04-11

江西上饶:喜采春茶助增收_世界快报

2023-04-11

国外超高速照相测量技术有助探索复杂物理现象_当前焦点

2023-04-11

电子书签尺寸_书签尺寸

2023-04-11

什么是节能审查制度?

2023-04-11

环球观焦点:官宣百亿扩产计划!爱旭股份已不再是单纯的光伏电池企业

2023-04-11

【东看西看】柏文喜:特斯拉储能超级工厂落“沪”,马斯克为何再次投票中国? 每日快报

2023-04-11

环球热文:江苏省宿迁市2023-04-11 09:56发布霾黄色预警

2023-04-11

【世界独家】看病记

2023-04-11

环球今热点:影响全省!山东再次出现沙尘天气 预计13日结束

2023-04-11

环球热讯:小剧场演出不断 胡同深处繁星点点

2023-04-11

4月10日国内邻苯产业链价格汇总

2023-04-11

当前要闻:葡萄牙铁路工人继续罢工,大量火车班列被取消

2023-04-11

康宁汉姆谈康复进程:我已经可以完成跳投 但还不太敢大幅度变向|当前观点

2023-04-11

2023年04月11日四川自贡疫情今天多少例及自贡疫情最新通告今天数据 天天微动态

2023-04-11

中国副省级城市一览表图片(中国副省级城市一览表)|当前消息

2023-04-10

电脑表格软件有哪些_做表格的软件有哪些_滚动

2023-04-10

猪肉概念股拉升走高!新五丰一度涨停 天天热讯

2023-04-10

全球微速讯:​跳出自信 跳出健康——我市跳绳运动方兴未艾

2023-04-10

《英雄联盟》2v2v2v2 模式今年年中上线,将听取更多国服玩家意见

2023-04-10

高速成了高铁!背水一战山东队如何调整,王晗能否打破客场魔咒

2023-04-10

“黑科技”进社区 一月省一千电费

2023-04-10

4月10日国内苯酐产业链价格涨跌互现

2023-04-10

上海海事大学回应被举报弄虚作假 具体详细内容是什么|世界新要闻

2023-04-10

薛晨/夏欣怡夺得世界沙排巡回赛伊塔佩马站冠军-全球百事通

2023-04-10

实拍新疆兵团首条“疆电外送”通道输出端

2023-04-10

冷空气携大风沙尘影响北方 南方两轮降雨接踵而至 最新消息

2023-04-10

太仓竞走赛打破尘封30年的全国纪录!奥运会冠军刘虹也再度夺冠_当前热点

2023-04-10

环球百事通!报税网站打不开怎么回事_报税网站

2023-04-10

今日热文:武汉三镇队捧得中国足协超级杯

2023-04-10

4月10日01时贵州遵义最新确诊人数 贵州遵义发现疫情了吗

2023-04-10

新疆:胡杨花儿开|热推荐

2023-04-09

男生成人礼送什么 天天观焦点

2023-04-09

云南省有多少个民族_云南有多少个民族-环球报资讯

2023-04-09

铜川以高质量项目助推高质量全面转型发展 天天视点

2023-04-09

裁员真相!每天350名地产人,离开龙头房企

2023-04-09

天天百事通!“决战上海之巅”!金融城白领挑战迷你铁人三项

2023-04-09

【快播报】河南洛阳:适老家园,让老人更安心

2023-04-09

山药红枣糖水

2023-04-09

今日聚焦!“万泰疫苗杯”健康跑开跑在即!网红打卡区受欢迎

2023-04-09

亚冠联赛东亚区小组赛将迎来新一轮的比赛|全球聚看点

2023-04-09

【科普活动】科学普及不停步,一起走进小营街道!

2023-04-09

环球热讯:家庭贫困情况描述范文(共8篇)

2023-04-08

天天热推荐:全国III卷作文600字 高考满分作文600字:心灵的暖春

2023-04-08

全球快报:OPPO 新专利公布:可避免折叠显示屏多次折叠出现折痕

2023-04-08

焦点速看:济南一学生耗时40小时通过游戏“还原”大明湖,“用自己的方式宣传家乡”

2023-04-08