登錄
注冊
首頁
項目
經驗
代碼
文庫
問答
博客
資訊
數據挖掘
(共
173
篇經驗)
0
推薦
46K
瀏覽
每天近百億條用戶數據,攜程大數據高并發應用架構涅槃
互聯網二次革命的移動互聯網時代,如何吸引用戶、留住用戶并深入挖掘用戶價值,在激烈的競爭中脫穎而出,是各大電商的重要課題。通過各類大數據對用戶進行研究,以數據驅動產品是解決這個課題的主要手段,攜程...
ouyangzhizhong
8年前
NOSQL
數據挖掘
大數據
分布式/云計算/大數據
0
推薦
45K
瀏覽
每天TB級數據處理,攜程大數據高并發應用架構涅槃
互聯網二次革命的移動互聯網時代,如何吸引用戶、留住用戶并深入挖掘用戶價值,在激烈的競爭中脫穎而出,是各大電商的重要課題。通過各類大數據對用戶進行研究,以數據驅動產品是解決這個課題的主要手段,攜程...
JBIKatherin
8年前
NOSQL
數據挖掘
大數據
分布式/云計算/大數據
0
推薦
111K
瀏覽
直播彈幕審核系統和文本分析技術
作為深受二次元人士歡迎的互動方式,彈幕已經從原來的動漫網站 Acfun?和 bilibili 向各類視頻和直播網站蔓延,但是彈幕存在大量低俗、色情、垃圾廣告、謾罵的內容,數量極為龐大,變形變換極...
NorWheat
8年前
數據挖掘
中文分詞
軟件架構
多媒體處理
0
推薦
10K
瀏覽
機器學習算法基礎概念
FP-growth算法是一種用于發現數據集中頻繁模式的有效方法。FP-growth算法利用Apriori原則,執行更快。Apriori算法產生候選項集,然后掃描數據集來檢查他們是否頻繁。由于只對...
BasilBBX
8年前
算法
數據挖掘
機器學習
0
推薦
60K
瀏覽
劉鐵巖:博弈機器學習是什么?
人工智能早就不是一個新詞了。早在六十年前,在達特茅斯學院舉行的一次會議就正式確立了人工智能(Artificial Intelligence)的名稱,以及研究領域和任務。在那之后,人工智能幾經沉浮...
lh_2010
8年前
人工智能
數據挖掘
機器學習
0
推薦
16K
瀏覽
Meson:支持Netflix的機器學習工作流
Netflix的目標是能預測顧客之所想觀看的電影,也即推薦預測。為了做到這一點,每天會運行大量機器學習工作流,而為了支撐創建這么多機器學習工作流和有效利用資源,Netflix的工程師開發了Meson。
MichelineKo
8年前
工作流
數據挖掘
分布式/云計算/大數據
0
推薦
14K
瀏覽
一個自動化解決數據科學問題的python工具
在本文中,我們要經歷機器學習流程(pipline)設計中三個乏味的過程,但卻如此重要。之后,我們將演示工具來遍歷之前的過程,來體現智能自動化的機器學習流程設計,這樣我們就可以花時間在數據科學的更有趣的方面。
oidw8485
8年前
Python
數據挖掘
Python開發
0
推薦
16K
瀏覽
教機器學習閱讀
機器學會閱讀將是人工智能在處理和理解人類語言進程中一個里程碑式的事件,是一個真正AI必須達到的標準。最近一家叫做 Maluuba 的科技公司,號稱開發了目前最領先的機器閱讀理解系統EpiRead...
文亮2014
8年前
數據挖掘
機器學習
向量
0
推薦
23K
瀏覽
Apache Spark 2.0前瞻:為機器學習模型注入持久性
在所有的這些例子中,如果有了模型的持久性,那么保存和加載模型的問題將變得更容易解決。在即將到來的2.0版本中,通過基于DataFrame的API,Spark機器學習庫MLlib將實現幾乎完整的M...
e鴻619
8年前
數據挖掘
Spark
分布式/云計算/大數據
0
推薦
148K
瀏覽
用Spark進行大數據處理之機器學習篇
在本篇文章,作者將討論機器學習概念以及如何使用Spark MLlib來進行預測分析。后面將會使用一個例子展示Spark MLlib在機器學習領域的強悍。
co880591
8年前
數據挖掘
大數據
Spark
分布式/云計算/大數據
0
推薦
18K
瀏覽
如何自己搭建釣魚網站檢測系統
隨著電子商務、互聯網金融的快速發展,在利益的驅使下,從事“釣魚攻擊”的黑產呈逐漸上升趨勢。“釣魚攻擊”不僅對企業的品牌形象造成嚴重損害,還對用戶的賬戶安全、甚至資金安全構成了極大的威脅。
NevWalch
8年前
數據挖掘
網絡技術
網絡釣魚
0
推薦
61K
瀏覽
六款強大的開源數據挖掘工具
為您推薦六款強大的開源數據挖掘工具
awnt2749
8年前
開源
數據挖掘
0
推薦
43K
瀏覽
大數據與機器學習周報 第7期:谷歌CEO皮查伊稱人工智能將成為未來發展關鍵
《IBM發布首個深度學習類腦超級計算平臺IBM TrueNorth》 :IBM 日前發布了一款用于深度學習的類腦超級計算平臺 IBM TrueNorth。新智元芯片專家群的幾位專家討論后認為:T...
zfxt5608
8年前
谷歌
人工智能
數據挖掘
分布式/云計算/大數據
0
推薦
35K
瀏覽
數據分析/數據挖掘/機器學習---- 必讀書目
總結一下我讀過的機器學習/數據挖掘/數據分析方面的書,有的適合入門,有的適合進階,沒有按照層次排列,先總結一下,等總結的差不多了再根據入門--->進階分塊寫。下面列的書基本上我寫的都是讀完過的,...
cy_ygs
8年前
數據挖掘
數據分析
分布式/云計算/大數據
0
推薦
17K
瀏覽
RDD、DataFrame和DataSet的區別是什么
RDD、DataFrame和DataSet是容易產生混淆的概念,必須對其相互之間對比,才可以知道其中異同:DataFrame多了數據的結構信息,即schema。RDD是分布式的 Java對象的集...
si19891002
8年前
數據挖掘
分布式系統
Spark SQL
0
推薦
70K
瀏覽
使用開源軟件快速搭建數據分析平臺
使用開源軟件快速搭建數據分析平臺:最近,國內涌現出了不少數據分析平臺產品,例如魔鏡和數據觀。 這些產品的目標應該都是self service的B...
BessMcfarla
8年前
數據挖掘
0
推薦
42K
瀏覽
機器學習算法選擇
對于你的分類問題,你知道應該如何選擇哪一個機器學習算法么?當然,如果你真的在乎精度(accuracy),最好的方法就是通過交叉驗證(cross-validation)對各個算法一個個地進行測試,...
了解點
8年前
算法
數據挖掘
0
推薦
42K
瀏覽
機器學習算法選擇
對于你的分類問題,你知道應該如何選擇哪一個機器學習算法么?當然,如果你真的在乎精度(accuracy),最好的方法就是通過交叉驗證(cross-validation)對各個算法一個個地進行測試,...
ZackSoft
8年前
算法
數據挖掘
0
推薦
19K
瀏覽
【R】如何確定最適合數據集的機器學習算法
抽查(Spot checking)機器學習算法是指如何找出最適合于給定數據集的算法模型。本文中我將介紹八個常用于抽查的機器學習算法,文中還包括各個算法的 R 語言代碼,你可以將其保存并運用到下一...
jjf_123456
8年前
算法
數據挖掘
0
推薦
39K
瀏覽
基于日志文件的數據挖掘機理分析與研究
摘 要: 介紹了數據挖掘的定義,分析了日志數據面臨的挑戰及對其進行挖掘的原因。討論了日志數據挖掘的需求,歸納了對日志數據挖掘的具體內容,總結了日志數據挖掘的具體
MartinCudmo
8年前
數據挖掘
1
2
3
4
5
6
7
8
9
經驗分享,提升職場影響力
投稿
熱門問答
熱門文檔
sesese色