Nutch的發展歷程
nutch 是一個開源的、Java 實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。是一個應用程序,可以以 Lucene 為基礎實現搜索引擎應用。Nutch的創始人是Doug Cutting,他同時也是Lucene、Hadoop和Avro開源項目的創始人
下面是Nutch的發展歷程:
2002年8月由Doug Cutting發起,托管于Sourceforge,之后發布了0.4、0.5、0.6三個版本
2004年9月Oregon State University(俄勒岡州立大學)采用Nutch
2004年9月Creative Commons(知識共享)推出基于Nutch的搜索服務
2005年1月加入Apache的孵化器
2005年6月孵化結束成為Lucene的子項目
2005年8月發布版本0.7(Apache Lucene sub-project)
2005年10月發布版本0.7.1
2006年3月發布版本0.7.2
2006年7月發布版本0.8(全新的架構,基于Hadoop0.4 ,Hadoop誕生)
2006年9月發布版本0.8.1
2007年4月發布版本0.9
2009年3月發布版本1.0(Tika誕生,0.1-incubating)
2010年4月Nutch成為Apache頂級項目
2010年6月發布版本1.1
2010年9月發布版本1.2
2011年6月發布版本1.3(從搜索引擎到網絡爬蟲)
2011年11月發布版本1.4
2012年6月發布版本1.5
2012年7月發布版本2.0(2.X Gora誕生,table-based architecture)
2012年7月發布版本1.5.1
2012年8月Nutch誕生十周年
2012年10月發布版本2.1( 2.X開始支持elastic search )
2012年12月發布版本1.6
2013年6月發布版本2.2(crawler-commons 誕生)
2013年6月發布版本1.7(crawler-commons 誕生)
2013年7月發布版本2.2.1
2014年3月發布版本1.8
2014年8月發布版本1.9
2015年1月發布版本2.3
</div> 來自:http://my.oschina.net/apdplat/blog/397151