Flickr公布百萬圖像供研究者使用
近日,雅虎洛杉磯研究院的人機交互研究員 David Ayman Shamma 在雅虎研究院網站新聞上發布了 Flickr 圖片數據集,內有百萬張基于 Creative Common 許可的圖片,以供研究者使用。David 是雅虎人機交互研究組的高級經理和組長,同時也是雅虎研究院在 Flickr 的科研聯絡人。
在官網上對于數據集進行描述和結識的文章中,David 表示,信息時代的攝影在不停的發生變化,從古老的C-41 逐步演變成為完全不同的形式。粗略估計當前全世界的照片中,有 10% 的來自過去一年,這還是三年之前給出的估計。圖片服務網站 Flickr 以 Creative Common 許可為基礎,成了人們分享照片的便捷途徑。
當前學術界大部分的圖像研究,還只能使用小規模數據集進行算法的測試。因此雅虎研究院聯手 Flickr 給全世界的研究人員提供一個更為宏偉的平臺。因此 Flickr 迅速得到了學術界的青睞,每張圖片的原始數據,元數據,分享方式、分享網絡,都可以為現有的研究問題如計算機視覺、社會網絡研究等帶來解答,同時也將孕育 新的研究萌芽,比如現在機器學習領域的深度學習。
Flickr 此次公布的數據集中,包括近 1 億張圖片和 70 萬部視頻,它們全部來自 Flickr,并且受 Creative Common 許可保護。數據集大概有 12GB,包括圖片 id、jpeg 格式圖片的下載地址,視頻的下載地址以及標題、描述、相機類型、標簽等元數據。指的一提的是,其中大概 5 千萬圖片有地理信息標記,而且關于圖片的評論,點贊以及分享數據都可以通過 Flickr 的 API 進一步得到。
更令人非常佩服的是,與以往的數據分享機構簡單的發布原始數據這種方式不同,雅虎研究院非常認真的要進一步擁抱學術界,David 表示,由于
1
億張圖片的處理需要大量的計算能力和時間,并不是隨便一個研究機構都能辦到,雅虎研究院聯合位于伯克利的國際計算科學研究所(ICSI)以及勞倫斯利弗莫
爾國家實驗室,會基于這些圖片和視頻提取業界常用的視覺和音頻特征,然后放到亞馬遜云服務(整個處理過的數據在 50TB 左右),供全世界的研究人員使用。
此外,David 還對研究方向給出了一些建議,如不借助圖片的經緯度信息來給出拍攝地點的 MediaEval Placing 任務,物體定位、概念識別和抽取等任務。
目前數據集的下載需要向雅虎研究院提交申請,審核后可以下載。
<span id="shareA4" class="fl">
</span>