紐約消防局是怎樣利用數據挖掘的?
英文原文:How New York’s Fire Department Uses Data Mining
紐約大概有一百萬棟建筑,每年其中 3 千棟會起大火。官員們能夠預測哪些樓會著火么?
紐約市消防局認為他們可以利用數據挖掘來做到這點。消防局的分析員稱某些建筑和一些更容易起火的因素有關聯。
貧窮就是其一。
“低收入社區和火災有相關性,” 消防局的分析主管 Jeff Chen 在拉斯維加斯上的一個工業會議上這樣說道。
其他一些和致命火災相關的因素有:建筑物的年齡,它有沒有電路問題,灑水器的數量和位置,及有無電梯。Chen 說那些空置的或者沒有安保的建筑著火概率是其他建筑的兩倍。
這些聽起來都顯而易見,但一下子要消化全部的相關因素也不容易。
紐約的官員們采用了大約 60 個不同的因素做了一個算法,該算法給城里的 33 萬可審查的建筑物都算了一個危險系數(消防局不檢查獨棟或者雙拼別墅)。
當消防員進行每周的例行審查時,電腦會生成一份按危險系數排序的建筑清單,他們應當先去檢查這些建筑。
這個數據挖掘程序在七月被正式啟用,在接下來的幾個月里會被擴展到 2400 個類別里。Chen 說在用這個程序之前他們進行的檢查都是很隨機的。
像學校和圖書館這種擁有高安全優先級的地方理應更經常審查。然而從前紐約市并沒有根據危險系數來針對某些特定建筑。
在前紐約市長 Michael Bloomberg 的帶領下紐約正變得更以數據為驅使,這是諸多市政當局在嘗試使用已有的常規數據來改善服務的一個例子。
波士頓在他們的“問題建筑”項目中采用了大數據。它利用了不同的城市資源信息,比如投訴電話、安全記錄、犯罪和征稅信息來認定警察應該去查訪哪些建筑。
盡管應該給大數據系統投資看起來像是常識,市政當局還是很難衡量系統的成功性。官員也許能夠引用一些比如火災或者犯罪數量減小了之類的統計數據,但是卻很難論證大數據工具就是其根本原因。因為它需要證明的是一個負數:因為他們的努力,某些事情沒發生。
消防管理部門的助理官員 Jeff Roth 說:“最終,火災的數量會減少,火災也應不像以前那么嚴重。”
翻譯: 伯樂在線 - XiaoxiaoLi