算法 Java中的String簡單模糊相似度算法

whoami__ 8年前發布 | 5K 次閱讀 Java 算法

[Java]代碼

public List<char[]> bigram(String input)
{
    ArrayList<char[]> bigram = new ArrayList<char[]>();
    for (int i = 0; i < input.length() - 1; i++)
    {
        char[] chars = new char[2];
        chars[0] = input.charAt(i);
        chars[1] = input.charAt(i+1);
        bigram.add(chars);
    }
    return bigram;
}

[Java]代碼

public double dice(List<char[]> bigram1, List<char[]> bigram2)
{
    List<char[]> copy = new ArrayList<char[]>(bigram2);
    int matches = 0;
    for (int I = bigram1.size(); --i >= 0;)
    {
        char[] bigram = bigram1.get(i);
        for (int j = copy.size(); --j >= 0;)
        {
            char[] toMatch = copy.get(j);
            if (bigram[0] == toMatch[0] && bigram[1] == toMatch[1])
            {
                copy.remove(j);
                matches += 2;
                break;
            }
        }
    }
    return (double) matches / (bigram1.size() + bigram2.size());
}
 本文由用戶 whoami__ 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!