C語言經典算法 - 字符串核對
說明今日的一些高階程式語言對于字串的處理支援越來越強大(例如Java、Perl等),不過字
串搜尋本身仍是個值得探討的課題,在這邊以Boyer- Moore法來說明如何進行字串說明,這個
方法快且原理簡潔易懂。
解法字串搜尋本身不難,使用暴力法也可以求解,但如何快速搜尋字串就不簡單了,傳統的
字串搜尋是從關鍵字與字串的開頭開始比對,例如Knuth-Morris-Pratt 演算法字串搜尋,這個
方法也不錯,不過要花時間在公式計算上;Boyer-Moore字串核對改由關鍵字的后面開始核對字
串,并制作前進表,如果比對不符合則依前進表中的值前進至下一個核對處,假設是p好了,然
后比對字串中p-n+1至p的值是否與關鍵字相同。
如果關鍵字中有重復出現的字元,則前進值就會有兩個以上的值,此時則取前進值較小的值,
如此就不會跳過可能的位置,例如texture這個關鍵字,t的前進值應該取后面的3而不是取前面的
7。
#include <stdio.h>include <stdlib.h>
include <string.h>
void table(char); // 建立前進表 int search(int, char , char); // 搜尋關鍵字 void substring(char , char *, int, int); // 取出子字串 int skip[256]; int main(void) { char str_input[80]; char str_key[80]; char tmp[80] = { '\0' }; int m, n, p; printf("請輸入字串:"); gets(str_input); printf("請輸入搜尋關鍵字:"); gets(str_key); m = strlen(str_input); // 計算字串長度 n = strlen(str_key); table(str_key); p = search(n - 1, str_input, str_key); while (p != - 1) { substring(str_input, tmp, p, m); printf("%s\n", tmp); p = search(p + n + 1, str_input, str_key); } printf("\n"); return 0; }
void table(char *key) { int k, n; n = strlen(key); for (k = 0; k <= 255; k++) skip[k] = n; for (k = 0; k < n - 1; k++) skip[key[k]] = n - k - 1; }
int search(int p, char input, char key) { int i, m, n; char tmp[80] = { '\0' }; m = strlen(input); n = strlen(key); while (p < m) { substring(input, tmp, p - n + 1, p); if (!strcmp(tmp, key)) // 比較兩字串是否相同 return p - n + 1; p += skip[input[p]]; } return - 1; }
void substring(char text, char tmp, int s, int e) { int i, j; for (i = s, j = 0; i <= e; i++, j++) mp[j] = text[i]; tmp[j] = '\0'; }</pre>