【機器學習中的數學】比例混合分布
比例混合分布(Scale Mixture Distribution)
混合分布是來自其他隨機變量的集合構成的隨機變量的概率分布:一個隨機變量是根據給定的概率從集合隨機選取的,然后所選隨機變量的值就得到了( first, a random variable is selected by chance from the collection according to given probabilities of selection, and then the value of the selected random variable is realized)。
當潛在的隨機變量是連續的情況下,混合得到的隨機變量也是連續 的,并且其概率密度函數有時被稱作是一個混合密度,其累積分布函數(cumulative distribution function)可以表示成其他分布函數的凸組合(convex combination,i.e. a weighted sum, with non-negative weights that sum to 1)。
有限可數混合體
給定一個有限的概率密度函數集合p1(x),...,pn(x),或者相對應的累積分布函數P1(x),...,Pn(x)和權值w1,...,wn(wi>=0,sum(wi)=1),該混合分布可以被表示為密度函數f,或者分布函數F:


這種類型的混合體稱作有限混合(finite mixture)。
不可數混合體
當組成的分布式不可數的,這個分布就被稱為混合概率分布(compound probability distribution)。這種分布的構造是用積分來代替有限情況下的求和形式。
考慮一個隨機變量為x,參數為a的概率密度函數p(x;a)。對于在集合A中的每一個值a,p(x;a)是一個關于x的概率密度函數,給出概率密度函數w(要求w非負且積分為1),則函數:

f(x)就是一個關于x的概率密度函數。
Gamma函數
了解Gamma函數的性質和一些有用的計算公式,在后面復雜的分布中會用到這些公式和表示方式。


學生t-分布及其混合分布
學生t-分布(Student's t-distribution)
在概率論和統計學中,學生t-分布(Student's t-distribution),可簡稱為t分布。應用在估計呈正態分布的母群體之平均數。它是對兩個樣本均值差異進行顯著性測試的學生t檢定的基礎。

其中,ν被稱作自由度(degrees of freedom),當ν=1時,該分布退化為柯西分布(Cauchy Distribution);當ν→∞時,該分布為高斯分布。
Scale Mixture of Normals
Student T分布可以看做是正態分布和Gamma分布的混合體,由于是連續分布,所以該混合體表示為積分形式。其公式推導如下,在求解積分時用到了之前Gamma函數中列舉的有用的積分公式:

Laplace分布及其混合分布
laplace分布
在概率論與統計學中,拉普拉斯分布是以皮埃爾-西蒙·拉普拉斯的名字命名的一種連續概率分布。由于它可以看作是兩個不同位置的指數分布背靠背拼接在 一起,所以它也叫作雙指數分布。兩個相互獨立同概率分布指數隨機變量之間的差別是按照指數分布的隨機時間布朗運動,所以它遵循拉普拉斯分布。
如果隨機變量的概率密度函數分布為:

那么它就是拉普拉斯分布。其中,μ是位置參數,b>0是尺度參數。
Gaussian-Exponential Mixture
laplace分布可以看成是高斯分布和指數分布的混合體。

負二項分布及其混合分布
負二項分布(Negative Biomial Distribution)
負二項分布是統計學上一種離散概率分布。“負二項分布”與“二項分布”的區別在于:“二項分布”是固定試驗總次數N的獨立試驗中,成功次數k的分布;而“負二項分布”是所有到成功r次時即終止的獨立試驗中,失敗次數k的分布。
其概率質量函數為:

Gamma-Poisson Mixture
Negative Biomial分布可以看做是Gamma分布和泊松分布的混合體。

混合分布的意義
這里我們列舉了三種常見分布及其混合分布,這種混合分布的表示形式的意義在于,復雜分布的期望和方差等數字特征不好求解,但可以將其表示為更加簡單 的分布的混合形式,我們知道高斯分布、泊松分布等分布的數字特征可以由其參數得到,這樣的話,就可以很容易的通過簡單的分布得到復雜分布的一些數字特征。
參考資料
Wiki:Mixture Distribution
LDA-math-神奇的Gamma函數
神奇的伽瑪函數(上)
神奇的伽瑪函數(下)
轉載請注明作者Jason Ding及其出處
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)