[機器學習&數據挖掘]樸素貝葉斯數學原理

jopen 10年前發布 | 22K 次閱讀樸素貝葉斯機器學習

原文 http://www.cnblogs.com/fantasy01/p/4598234.html

1、準備：

(1)先驗概率：根據以往經驗和分析得到的概率，也就是通常的概率，在全概率公式中表現是“由因求果”的果

(2)后驗概率：指在得到“結果”的信息后重新修正的概率，通常為條件概率(但條件概率不全是后驗概率)，在貝葉斯公式中表現為“執果求因”的因

例如：加工一批零件，甲加工60%，乙加工40%，甲有0.1的概率加工出次品，乙有0.15的概率加工出次品，求一個零件是不是次品的概率即為先驗概率，已經得知一個零件是次品，求此零件是甲或乙加工的概率是后驗概率

(3)全概率公式：設E為隨機試驗，B1，B2，....Bn為E的互不相容的隨機事件，且P(Bi)>0(i=1,2....n), B1 U B2 U....U Bn = S,若A是E的事件，則有

P(A) = P(B1)P(A|B1)+P(B2)P(A|B2)+.....+P(Bn)P(A|Bn)

(4)貝葉斯公式：設E為隨機試驗，B1，B2，....Bn為E的互不相容的隨機事件，且P(Bi)>0(i=1,2....n), B1 U B2 U....U Bn = S,E的事件A滿足P(A)>0,則有

(5)條件概率公式：P(A|B) = P(AB)/P(B)

(6)極大似然估計：極大似然估計在機器學習中想當于經驗風險最小化，(離散分布)一般流程：確定似然函數(樣本的聯合概率分布)，這個函數是關于所要估計的參數的函數，然后對其取對數，然后求導，在令導數等于0的情況下，求得參數的值，此值便是參數的極大似然估計

注：經驗風險：在度量一個模型的好壞，引入了損失函數，常見的損失函數有：0-1損失函數、平方損失函數、絕對損失函數、對數損失函數等，同時風險函數(期望風險)是對損失函數的期望，期望風險是關于聯合分布的理論期望，但是理論的聯合分布是無法求得的，只能利用樣本來估計期望，因此引入經驗風險，經驗風險就是樣本的平均損失，根據大數定理在樣本趨于無窮大的時候，這個時候經驗風險會無限趨近與期望風險

2、樸素貝葉斯算法

(1)思路：樸素貝葉斯算法的樸素在于對與特征之間看作相互獨立的意思例如：輸入向量(X1, X2,....,Xn)的各個元素是相互獨立的，因此計算概率 P(X1=x1,X2=x2,....Xn=xn)=P(X1=x1)P(X2=x2)......P(Xn=xn),其次基于貝葉斯定理，對于給定的訓練數據集，首先基于特征條件獨立假設學習聯合概率分布，然后基于此模型，對于給定的輸入向量，利用貝葉斯公式求出后驗概率最大的輸出分類標簽

(2)詳細：以判斷輸入向量x的類別的計算過程來具體說下樸素貝葉斯計算過程

<1>要計算輸入向量x的類別，即是求在x的條件下的y的概率，當y取某值最大概率，則此值便為x的分類，則概率為P(Y=ck|X=x)

<2>利用條件概率公式推導貝葉斯公式(此步非必要，本人在記貝葉斯公式時習慣這么記)

由條件概率公式得P(Y=ck|X=x) = P(Y=ck,X=x)/P(X=x) = P(X=x | Y=ck)P(Y=ck)/P(X=x)

由全概率公式可得(替換P(X=x))： [機器學習&數據挖掘]樸素貝葉斯數學原理