Spss K-means聚類分析案例——某移動公司客戶細分模型

jopen 10年前發布 | 27K 次閱讀 K-means 機器學習

原文 http://www.i#cn/article/020441052015.html

聚類分析在各行各業應用十分常見，而顧客細分是其最常見的分析需求，顧客細分總是和聚類分析掛在一起。

顧客細分，關鍵問題是找出顧客的特征，一般可從顧客自然特征和消費行為入手，在大型統計分析工具出現之前，主要是通過兩種方式進行“分群別類”，第一種，用單一變量進行劃段分組，比如，以消費頻率變量細分，即將該變量劃分為幾個段，高頻客戶、中頻客戶、低頻客戶，這樣的狀況；第二種，用多個變量交叉分組，比如用性別和收入兩個變量，進行交叉細分。

事實是，我們總是希望考慮多方面特征進行聚類，這樣基于多方面綜合特征的客戶細分比單個特征的細分更有意義，這正是 spss 聚類分析可以做到的，以下通過k-means聚類分析做一個小小案例來展示。

【數據來源及分析內容】

《SPSS統計分析高級教程》telco.sav，是反映移動電話用戶使用手機情況的數據集。包含7個變量：用戶編號、工作日上班時間電話時長、工作日下班時間電話時長、周末電話時長、國際電話時長、總通話時長、平均每次通話時長，現希望對移動用戶細分，了解他們不同的手機消費習慣。根據研究調研及經驗，認為移動用戶應分為5個主要消費群體。數據分析工具：spss，參考教程：張文彤，《 SPSS12 統計分析高級教程》。

【數據分析流程】

Spss K-means聚類分析案例——某移動公司客戶細分模型

【獲取數據】

Spss K-means聚類分析案例——某移動公司客戶細分模型

【數據預處理】

現在存儲于后臺的數據太多了，以前做項目擔心沒有真實可靠的數據，現在這個問題沒有那么復雜，但數據太多卻引發了其他問題。辛苦采集到的數據口徑不一致，存儲格式不同，不符合數據分析要求還有待派生新的變量。

這些過程看似簡單卻非常有必要！

僅僅預處理以上這些問題還不夠，當數據分析方法復雜時，我們還需對采集的數據進行篩選構成小的數據集，對于數據集中變量的分布、缺失、描述統計指標進行一定程度的分析。

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

【數據分析】

K-means聚類也稱快速聚類，可以用于大量數據進行聚類的情形。在開始聚類之前，需要分析者自己制定類數目，并不是一次指定，可以經過多輪反復分析，根據實際情況最終判定最優類的數目。 K-means聚類是采用計算距離的方式測度變量間的親疏程度，距離直接影響最終的結果，因此慎重審核數據質量。

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

【分析結論】

做一個數據分析的項目，不能不下結論！

雷聲大，雨點小的事情，作為數據分析師千萬要避免發生。提交數據分析報告，對分析下結論，對業務問題進行及時解決，養成這個良好的習慣。

Spss K-means聚類分析案例——某移動公司客戶細分模型

Spss K-means聚類分析案例——某移動公司客戶細分模型

(責任編輯：king)

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1423122581061.html

K-means 機器學習

相關經驗

相關資訊

相關文檔