LRU緩存介紹與實現 (Java)
我們平時總會有一個電話本記錄所有朋友的電話,但是,如果有朋友經常聯系,那些朋友的電話號碼不用翻電話本我們也能記住,但是,如果長時間沒有聯系了,要再次聯系那位朋友的時候,我們又不得不求助電話本,但是,通過電話本查找還是很費時間的。但是,我們大腦能夠記住的東西是一定的,我們只能記住自己最熟悉的,而長時間不熟悉的自然就忘記了。
其實,計算機也用到了同樣的一個概念,我們用緩存來存放以前讀取的數據,而不是直接丟掉,這樣,再次讀取的時候,可以直接在緩存里面取,而不用再重新查找一遍,這樣系統的反應能力會有很大提高。但是,當我們讀取的個數特別大的時候,我們不可能把所有已經讀取的數據都放在緩存里,畢竟內存大小是一定的,我們一般把最近常讀取的放在緩存里(相當于我們把最近聯系的朋友的姓名和電話放在大腦里一樣)。現在,我們就來研究這樣一種緩存機制。
LRU緩存:
LRU緩存利用了這樣的一種思想。LRU是Least Recently Used 的縮寫,翻譯過來就是“最近最少使用”,也就是說,LRU緩存把最近最少使用的數據移除,讓給最新讀取的數據。而往往最常讀取的,也是讀取次數最多的,所以,利用LRU緩存,我們能夠提高系統的performance.
實現:
要實現LRU緩存,我們首先要用到一個類 LinkedHashMap。 用這個類有兩大好處:一是它本身已經實現了按照訪問順序的存儲,也就是說,最近讀取的會放在最前面,最最不常讀取的會放在最后(當然,它也可以實現按照插入順序存儲)。第二,LinkedHashMap本身有一個方法用于判斷是否需要移除最不常讀取的數,但是,原始方法默認不需要移除(這是,LinkedHashMap相當于一個linkedlist),所以,我們需要override這樣一個方法,使得當緩存里存放的數據個數超過規定個數后,就把最不常用的移除掉。LinkedHashMap的API寫得很清楚,推薦大家可以先讀一下。
要基于LinkedHashMap來實現LRU緩存,我們可以選擇inheritance, 也可以選擇 delegation, 我更喜歡delegation。基于delegation的實現已經有人寫出來了,而且寫得很漂亮,我就不班門弄斧了。代碼如下:
package LRU;
import java.util.LinkedHashMap;
import java.util.Collection;
import java.util.Map;
import java.util.ArrayList;
/**
 * An LRU cache, based on <code>LinkedHashMap</code>.
 * 
 * <p>
 * This cache has a fixed maximum number of elements (<code>cacheSize</code>).
 * If the cache is full and another entry is added, the LRU (least recently
 * used) entry is dropped.
 * 
 * <p>
 * This class is thread-safe. All methods of this class are synchronized.
 * 
 * <p>
 * Author: Christian d'Heureuse, Inventec Informatik AG, Zurich, Switzerland<br>
 * Multi-licensed: EPL / LGPL / GPL / AL / BSD.
 */
public class LRUCache<K, V> {
    private static final float hashTableLoadFactor = 0.75f;
    private LinkedHashMap<K, V> map;
    private int cacheSize;
    /**
     * Creates a new LRU cache.
     * 
     * @param cacheSize
     *            the maximum number of entries that will be kept in this cache.
     */
    public LRUCache(int cacheSize) {
        this.cacheSize = cacheSize;
        int hashTableCapacity = (int) Math
                .ceil(cacheSize / hashTableLoadFactor) + 1;
        map = new LinkedHashMap<K, V>(hashTableCapacity, hashTableLoadFactor,
                true) {
            // (an anonymous inner class)
            private static final long serialVersionUID = 1;
            @Override
            protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
                return size() > LRUCache.this.cacheSize;
            }
        };
    }
    /**
     * Retrieves an entry from the cache.<br>
     * The retrieved entry becomes the MRU (most recently used) entry.
     * 
     * @param key
     *            the key whose associated value is to be returned.
     * @return the value associated to this key, or null if no value with this
     *         key exists in the cache.
     */
    public synchronized V get(K key) {
        return map.get(key);
    }
    /**
     * Adds an entry to this cache. The new entry becomes the MRU (most recently
     * used) entry. If an entry with the specified key already exists in the
     * cache, it is replaced by the new entry. If the cache is full, the LRU
     * (least recently used) entry is removed from the cache.
     * 
     * @param key
     *            the key with which the specified value is to be associated.
     * @param value
     *            a value to be associated with the specified key.
     */
    public synchronized void put(K key, V value) {
        map.put(key, value);
    }
    /**
     * Clears the cache.
     */
    public synchronized void clear() {
        map.clear();
    }
    /**
     * Returns the number of used entries in the cache.
     * 
     * @return the number of entries currently in the cache.
     */
    public synchronized int usedEntries() {
        return map.size();
    }
    /**
     * Returns a <code>Collection</code> that contains a copy of all cache
     * entries.
     * 
     * @return a <code>Collection</code> with a copy of the cache content.
     */
    public synchronized Collection<Map.Entry<K, V>> getAll() {
        return new ArrayList<Map.Entry<K, V>>(map.entrySet());
    }
    public static void main(String[] args) {
        LRUCache<String, String> c = new LRUCache<String, String>(3);
        c.put("1", "one"); // 1
        c.put("2", "two"); // 2 1
        c.put("3", "three"); // 3 2 1
        c.put("4", "four"); // 4 3 2
        if (c.get("2") == null)
            throw new Error(); // 2 4 3
        c.put("5", "five"); // 5 2 4
        c.put("4", "second four"); // 4 5 2
        c.put("4", "second four"); // 4 5 2
        c.put("4", "second four"); // 4 5 2
        c.put("4", "second four"); // 4 5 2
        // Verify cache content.
        //if (c.usedEntries() != 3)
            //throw new Error();
        if (!c.get("4").equals("second four"))
            throw new Error();
        if (!c.get("5").equals("five"))
            throw new Error();
        if (!c.get("2").equals("two"))
            throw new Error();
        // List cache content.
        for (Map.Entry<String, String> e : c.getAll()) {
            System.out.println(e.getKey() + " : " + e.getValue());
        }
    }
} 代碼出自:http://www.source-code.biz/snippets/java/6.htm
在博客 http://gogole.iteye.com/blog/692103 里,作者使用的是雙鏈表 + hashtable 的方式實現的。如果在面試題里考到如何實現LRU,考官一般會要求使用雙鏈表 + hashtable 的方式。 所以,我把原文的部分內容摘抄如下:
雙鏈表 + hashtable實現原理:
將Cache的所有位置都用雙連表連接起來,當一個位置被命中之后,就將通過調整鏈表的指向,將該位置調整到鏈表頭的位置,新加入的Cache直接加到鏈表頭中。這樣,在多次進行Cache操作后,最近被命中的,就會被向鏈表頭方向移動,而沒有命中的,而想鏈表后面移動,鏈表尾則表示最近最少使用的Cache。當需要替換內容時候,鏈表的最后位置就是最少被命中的位置,我們只需要淘汰鏈表最后的部分即可。
package LRU;
import java.util.Hashtable;
public class LRUCached {
    private int cacheSize;
    private Hashtable<Object, Entry> nodes;//緩存容器
    private int currentSize;
    private Entry first;//鏈表頭
    private Entry last;//鏈表尾
    public LRUCached(int i) {
        currentSize = 0;
        cacheSize = i;
        nodes = new Hashtable<Object, Entry>(i);//緩存容器
    }
    /**
     * 獲取緩存中對象,并把它放在最前面
     */
    public Entry get(Object key) {
        Entry node = nodes.get(key);
        if (node != null) {
            moveToHead(node);
            return node;
        } else {
            return null;
        }
    }
    /**
     * 添加 entry到hashtable, 并把entry 
     */
    public void put(Object key, Object value) {
        //先查看hashtable是否存在該entry, 如果存在,則只更新其value
        Entry node = nodes.get(key);
        if (node == null) {
            //緩存容器是否已經超過大小.
            if (currentSize >= cacheSize) {
                nodes.remove(last.key);
                removeLast();
            } else {
                currentSize++;
            }           
            node = new Entry();
        }
        node.value = value;
        //將最新使用的節點放到鏈表頭,表示最新使用的.
        moveToHead(node);
        nodes.put(key, node);
    }
    /**
     * 將entry刪除, 注意:刪除操作只有在cache滿了才會被執行
     */
    public void remove(Object key) {
        Entry node = nodes.get(key);
        //在鏈表中刪除
        if (node != null) {
            if (node.prev != null) {
                node.prev.next = node.next;
            }
            if (node.next != null) {
                node.next.prev = node.prev;
            }
            if (last == node)
                last = node.prev;
            if (first == node)
                first = node.next;
        }
        //在hashtable中刪除
        nodes.remove(key);
    }
    /**
     * 刪除鏈表尾部節點,即使用最后 使用的entry
     */
    private void removeLast() {
        //鏈表尾不為空,則將鏈表尾指向null. 刪除連表尾(刪除最少使用的緩存對象)
        if (last != null) {
            if (last.prev != null)
                last.prev.next = null;
            else
                first = null;
            last = last.prev;
        }
    }
    /**
     * 移動到鏈表頭,表示這個節點是最新使用過的
     */
    private void moveToHead(Entry node) {
        if (node == first)
            return;
        if (node.prev != null)
            node.prev.next = node.next;
        if (node.next != null)
            node.next.prev = node.prev;
        if (last == node)
            last = node.prev;
        if (first != null) {
            node.next = first;
            first.prev = node;
        }
        first = node;
        node.prev = null;
        if (last == null)
            last = first;
    }
    /*
     * 清空緩存
     */
    public void clear() {
        first = null;
        last = null;
        currentSize = 0;
    }
}
class Entry {
    Entry prev;//前一節點
    Entry next;//后一節點
    Object value;//值
    Object key;//鍵
}