提高人臉檢測性能新模型HPM

jopen 9年前發布 | 18K 次閱讀 人臉檢測

近期,一篇新的技術Paper《Occlusion Coherence Detecting and Localizing Occluded Faces》,在 FDDB測試結果 表明可以提高當前人臉檢測的性能。本文簡要摘錄和介紹了有關HDM算法的部分內容。

1:一種人臉檢測、姿勢估計、標記估計的統一模型

這個要從 CVPR 2012上獲得Google student paper award的一篇Paper說起,即《Face Detection, Pose Estimation, and Landmark Localization in the Wild》,具體摘要如下。

提高人臉檢測性能新模型HPM

該文針對真實環境中的雜亂圖像,提出了一種人臉檢測、姿勢估計、標記估計的統一模型。該模型基于一種混合樹結構模型的算法,樹之間有部分共享池。 該模型根據不同的視角采用全局的混合來獲取拓撲改變。樹結構模型在獲取全局彈性變形上有令人驚訝的效果,可以很容易的優化不同密度的圖結構。該文提供了在 標準人臉benchmark上的擴展結果,同樣在一個新的真實環境注解的數據集上也進行了驗證。實驗結果證實了該系統,在三個任務(人臉探測、姿勢估計、 標記定位)都優于當前的最好結果。盡管該模型是采用成百上千的人臉訓練出來的,但結果不亞于(compare favourably with)由數十億級別樣本訓練出來的商業系統(例如Google Picasa和face.com)。

提高人臉檢測性能新模型HPM

上圖:我們的混合樹模型將不同視角的拓撲變化進行了編碼。紅線表示成對部分跳變;注意這里是沒有閉環的,保持樹的屬性。所有的樹利用了一個公用的部分模版的共享池,可以形成有效的學習和推理。

Paper、Slide下載

X. Zhu , D. Ramanan . “Face detection, pose estimation and landmark localization in the wild” Computer Vision and Pattern Recognition (CVPR) Providence, Rhode Island, June 2012.

[pdf]   [slides (Keynote file,36M)] [slides (PPT file, converted from keynote, animation may not work correctly,17M)]

</div>

代碼和數據集下載:

</tr>

</tr>

</tr>

</tr>

</tr>

</tr>

</tr>

</tr> </tbody> </table>

更多原始資料, Project: http://www.ics.uci.edu/~xzhu/face/

2: HPM模型

遮擋物對目標識別的準確性有較大的影響。無論如何,典型的遮擋被當做各種非結構的噪聲源,對于遮擋物的顯式模型落后于目標表面和形狀的建模。本文 我們描述了一種級聯可變形部件模型(HPM:hierarchical deformable part model)來進行人臉探測和關鍵點定位,該模型顯式的對部分遮擋進行了建模。提出的模型結構通過用大量合成的遮擋物來擴展正訓練樣本,這允許我們很容易 的將遮擋模式統計融入到一種特殊的訓練模型中。

我們在幾個benchmarks中進行了測試,關鍵點定位和探測,也包括競賽數據集。我們發現一個遮擋的顯式模型的添加,使得系統性能優于現存的方法。

提高人臉檢測性能新模型HPM

上圖:我們的模型包含三個部分(黑圈),其中每個部分都連接一組關鍵點(綠色或者紅色)在一個星狀拓撲中。此處的用例模版,對應不同的部件形狀和 遮擋模式。紅色表示遮擋的關鍵點。形狀參數獨立于遮擋狀態。關鍵點外觀是用小的Hog模版來建模(第二行),遮擋的關鍵點是限制為一個設置為0的模版。注 意本模型如何產生一個廣范圍的形狀結構和遮擋模式.

提高人臉檢測性能新模型HPM

上圖:虛擬的正樣本是通過合成產生的,從一個完全可見的訓練樣本開始,隨機選擇相干遮擋模式。

提高人臉檢測性能新模型HPM

上圖:標記定位和遮擋估計的結果,圖片來自HELEN(第一行)和COFW(第二行)數據集。紅色表示被HPM算法預測為被遮擋的關鍵點

提高人臉檢測性能新模型HPM

上圖:在連續-ROC FDDB benchmark測試集中。多分辨HPM是通過正臉數據集進行訓練的,而這個數據集有很多側臉的測試數據。與當前最好的基于正臉和側臉訓練數據的檢測方法相比,本文的模型展現了有競爭力的性能結果。

相關Paper和Code下載:

1)[cvpr14] Occlusion Coherence Localizing Occluded Faces with a Hierarchical Deformable Part Model

2)G. Ghiasi, C. Fowlkes, “Occlusion Coherence: Detecting and Localizing Occluded Faces”, Technical Report, June 2015  arXiv:1506.08347 [pdf] [code] [dataset]

</div> </div> 原文 http://www.cvrobot.net/occlusion-coherence-detecting-and-localizing-occluded-faces/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
Filename Description Size
README Description of contents. 2.3 KB
face-release1.0-basic.zip Basic code (matlab) for face detection, pose and landmark estimation with pre-trained models. 8.3 MB
face-release1.0-full.zip Full code (matlab) for training and testing. You need MultiPIE dataset to run it. 59 MB
sideview_annotation.zip Landmark annotations of 400 sideview faces labeled by us. You also need the other annotations from CMU to reproduce the results in our paper (we don’t have permission to release them here). 300 KB
mex-windows-compatible.zip Windows compatible mex files(.cc). 11 KB
models_CVPR2012.zip The fully shared and independent model we used to produce the curves in our CVPR2012 paper. 6.8 MB
AFW.zip The Annotated Faces in the Wild (AFW) testset. 47 MB
  • sesese色