商業活動中必備的數據分析工具
雖然收集和分析“大數據”存在一些分析和技術方面的挑戰,但事實上大部分公司已經能夠應對這種挑戰。這是因為有一些非常強大的分析工具都是免費、開源的,可以充分利用這些工具來提升自己的能力。
1、Tableau Public

這是一個簡單直觀的可視化工具。它在商業活動中表現的很強大,因為它通過可視化來表達。它有足夠的空間和免費使用時長讓你體驗,在分析的過程中,Tableau的圖片呈現可以讓你快速的調查一個假設、驗證你的直覺,做更好的商業決策。
2、OpenRefine

它是以前的GoogleRefine,OpenRefine是一款數據清理軟件,可以對準備好的一切數據進行分析。例如最近我清理了一個含有化學名稱的數據庫,并且各行有不同的拼寫、大小寫、空格等,用計算機來處理非常困難,幸運的是, OpenRefine包含許多聚類算法,對這個問題可以快速解決。
3、KNIME

KNIME可以通過可視化編程的方式來操作、分析和建模。不僅可以寫代碼。你還可以在操作中建立聯系節點。基本上你只需要將功能模塊拖拽到工作區,并將模塊按照運行流程連接起來,就可以實現以往編程才能實現的工作。更重要的是,KNIME可以擴展到運行R, python, text mining,chemistry data等等,這可以讓你選擇用更先進的編碼來分析。 Tip:讀取CSV文件時需要用“File Reader”代替CSV閱讀器。
4、RapidMiner

和KNIME類似, RapidMiner通過可視化編程操作,建模和分析數據。最近,RapidMiner贏得kdnuggets的軟件調查。
5、GoogleFusion Tables

這是針對數據分析、大數據集的可視化和映射的一個非常強大的工具,谷歌的地圖軟件在其中起著重要作用。拿下面這張圖來說,這是一張墨西哥灣石油生產平臺的圖,我只需要上傳數據,Google Fusion Tables確認維度和經度的數據之后就開始工作了。
6、NodeXL

NodeXL是針對網絡和關系的可視化分析軟件。想想科技巨頭地圖上代表LinkedIn或非死book的連接,NodeXL提供了進一步精確的計算。如果你在不需要那么先進的東西,你可以看看Google Fusion Tables,或者嘗試用Gephi。
7、import.io

從網上抓取網頁和信息曾經是技術人員的專利,現在用import.io,每個人都可以從網站和論壇獲取數據。簡單提出你想要的數據,幾分鐘之后import.io就可以通過你的搜索知道你在找什么,從而會挖掘、提供數據用于你的分析或輸出。
8、Google Search Operators

不可否認谷歌最初是一個強大的資源和搜索公司,運營商可以讓你快速過濾掉谷歌的結果得到的最有用的和相關的信息。比如說,你正想從ABC咨詢里尋找一個今年的數據科學報告。如果我們認為該報告可能是PDF格式的,可以搜索 “數據科學報告”網站::ABCConsulting.com Filetype:PDF 然后在下面的搜索欄,使用“搜索工具”來屏蔽去年的結果。這在發現新的信息或市場研究方面非常有用。
9、Solver
Solver是一個在excel中做優化和線性規劃的工具,允許你設置一些約束條件(例如不超過什么價格,要在哪天之前完成之類)。雖然更有效的優化可能會需要另一個程序(例如R的優化包),但是Solver應用范圍比較廣。
10、WolframAlpha

Wolfram Alpha的搜索引擎是一個隱藏的寶石,可以媲美蘋果的Siri。WolframAlpha類似于不那么智能的Google,對科技搜索提供詳細的回復,對微積分作用也能快速的搜索。對企業用戶來說,它提供了信息圖表,對歷史價格、商品信息、主題概述。
雖然這些工具使得分析更簡單,但他們只是把信息放進去然后進行分析,這些你自己也可以做到。所以用一點時間來學習新的技巧,用這些工具來提高自己完成工作。
轉載自數據堂