• shell 字符串操作

    0
    Linux C/C++ 正則表達式 Bash 13531 次瀏覽

    得到長度
    代碼:

    %x="abcd"
    # 方法一
    %expr length $x
    4
    # 方法二
    靐o $
    4
    # 方法三
    %expr "$x" : ".*"
    4
    # expr 的幫助
    # STRING : REGEXP anchored pattern match of REGEXP in STRING

    查找子串
    代碼:

    %expr index $x "b"
    2
    %expr index $x "a"
    1
    %expr index $x "b"
    2
    %expr index $x "c"
    3
    %expr index $x "d"
    4

    得到子字符串
    代碼:

    # 方法一
    # expr <string> startpos length
    %expr substr "$x" 1 3
    abc
    %expr substr "$x" 1 5
    abcd
    %expr substr "$x" 2 5
    bcd
    # 方法二
    # $
    靐o $
    bcd
    靐o $
    cd
    靐o $
    abcd
    靐o $
    ab
    %pos=1
    %len=2
    靐o $
    bc

    匹配正則表達式
    代碼:

    # 打印匹配長度
    %expr match $x "."
    1
    %expr match $x "abc"
    3
    %expr match $x "bc"
    0

    字符串的掐頭去尾
    代碼:

    %x=aabbaarealwwvvww
    靐o "$"
    aabbaarealwwvv
    靐o "$"
    aabbaareal
    靐o "$"
    lwwvvww
    靐o "$"
    bbaarealwwvvww

    其中 , # 表示掐頭, 因為鍵盤上 # 在 $ 的左面。
    其中 , % 表示%, 因為鍵盤上 % 在 $ 的右面。
    單個的表示最小匹配,雙個表示最大匹配。
    也就是說,當匹配的有多種方案的時候,選擇匹配的最大長度還是最小長度。

    字符串的替換
    代碼:

    %x=abcdabcd
    靐o $ # 只替換一個
    bbcdabcd
    靐o $ # 替換所有
    bbcdbbcd

    不可以使用 regexp , 只能用 * ? 的文件擴展方式

    ——————————————————————————————————————————————————————————-

    對字符串的處理
    包括:截取,連接,匹配,替換,翻轉… …
    字符串的處理:
    1,截取
    方法一:
    echo $a|awk '{print substr( ,1,8)}'
    substr是awk中的一個子函數,對第一個參數的進行截取,從第一個字符開始,共截取8個字符,如果不夠就從第二個字符中補
    方法二
    echo $a|cut -b2-8
    cut:對標準輸入的字符串進行處理
    cut -bn-m:以byte為單位,從第n個byte開始,取m個
    cut -bn,m:以byte為單位,截取第n,m個byte
    cut -b-n,m:以byte為單位,截取1-n,和第m個
    -c:以 charactor為單位
    -d:指定分隔符,默認為tab
    -s:使標準輸入中沒有delimeter
    cut -f1:截取第1個域
    方法三
    a=123456
    echo $
    方法四
    使用sed截取字符串的最后兩位
    echo $test |sed 's/\(.*\)\(..\)$//'
    截取字符串的前2位
    echo $test |sed 's/^\(..\)\(.*\)//'
    歡迎訪問007電腦資訊
    2,比較
    好像沒有什么可以比較的
    3,連接
    $a$b
    或者
    $string
    4,翻轉
    方法一:
    使用rev命令
    方法二:
    編寫腳本實現
    #!/usr/bin/awk -f
    ################################################################
    # Description : duplicate rev in awk
    ################################################################
    {
    revline = ""
    for (i=1;i<=length;i++)
    {
    revline = substr(,i,1) revline
    }
    }
    END{print revline}

    5,匹配
    grep
    egrep
    fgrep
    6,排序
    7,替換
    bash中:
    %x=abcdabcd
    %echo $ # 只替換一個
    bbcdabcd
    %echo $ # 替換所有
    bbcdbbcd
    sh 中:
    ??
    如何替換/
    使用sed
    替換所有匹配
    echo $test |sed 's/xx/yy'
    替換單個匹配
    ??
    8,得到字符串的長度:
    bash當中
    $
    或者
    expr "$VAR" : '.*'
    9,判斷字符串是否為數字
    10,得到字符串中某個字符的重復次數
    echo $a |tr "x" "\n" |wc -l
    得到的結果需要減去1
    或者 echo $a |awk -F"x" '{print NF-1}'
    11,得到字符串中某個string的重復次數 007電腦資訊
    12,將一批文件中的所有string替換
    for i in file_list
    do
    vi $i <<-!
    :g/xxxx/s//XXXX/g
    :wq
    !
    done
    13,如何將字符串內每兩個字符中間插入一個字符
    使用sed
    echo $test |sed 's/../&[insert char]/g'

    ============================================================================
    象專業人員那樣截斷字符串

    盡管 basename 和 dirname 是很好的工具,但有時可能需要執行更高級的字符串“截斷”,而不只是標準的路徑名操作。當需要更強的說服力時,可以利用 bash 內置的變量擴展功能。已經使用了類似于 ${MYVAR} 的標準類型的變量擴展。但是 bash 自身也可以執行一些便利的字符串截斷。看一下這些例子:

    第一種方法:

    ${varible##*string} 從左向右截取最后一個string后的字符串

    ${varible#*string}從左向右截取第一個string后的字符串

    ${varible%%string*}從右向左截取最后一個string后的字符串

    ${varible%string*}從右向左截取第一個string后的字符串

    "*"只是一個通配符可以不要

    $ MYVAR=foodforthought.jpg
    $ echo ${MYVAR##*fo}
    rthought.jpg
    $ echo ${MYVAR#*fo}
    odforthought.jpg

    在第一個例子中,輸入了 ${MYVAR##*fo}。它的確切含義是什么?基本上,在 ${ } 中輸入環境變量名稱,兩個 ##,然后是通配符 ("*fo")。然后,bash 取得 MYVAR,找到從字符串 "foodforthought.jpg" 開始處開始、且匹配通配符 "*fo" 的 最長 子字符串,然后將其從字符串的開始處截去。剛開始理解時會有些困難,為了感受一下這個特殊的 "##" 選項如何工作,讓我們一步步地看看 bash 如何完成這個擴展。首先,它從 "foodforthought.jpg" 的開始處搜索與 "*fo" 通配符匹配的子字符串。以下是檢查到的子字符串:

    f  
    fo      MATCHES *fo
    foo
    food
    foodf     
    foodfo      MATCHES *fo
    foodfor
    foodfort  
    foodforth
    foodfortho 
    foodforthou
    foodforthoug
    foodforthought
    foodforthought.j
    foodforthought.jp
    foodforthought.jpg

    在搜索了匹配的字符串之后,可以看到 bash 找到兩個匹配。它選擇最長的匹配,從初始字符串的開始處除去,然后返回結果。

    上面所示的第二個變量擴展形式看起來與第一個相同,但是它只使用一個 "#" — 并且 bash 執行 幾乎同樣的過程。它查看與第一個例子相同的子字符串系列,但是 bash 從初始字符串除去 最短 的匹配,然后返回結果。所以,一查到 "fo" 子字符串,它就從字符串中除去 "fo",然后返回 "odforthought.jpg"。

    這樣說可能會令人十分困惑,下面以一簡單方式記住這個功能。當搜索最長匹配時,使用 ##(因為 ## 比 # 長)。當搜索最短匹配時,使用 #。看,不難記吧!等一下,怎樣記住應該使用 '#' 字符來從字符串開始部分除去?很簡單!注意到了嗎:在美國鍵盤上,shift-4 是 "$",它是 bash 變量擴展字符。在鍵盤上,緊靠 "$" 左邊的是 "#"。這樣,可以看到:"#" 位于 "$" 的“開始處”,因此(根據我們的記憶法),"#" 從字符串的開始處除去字符。您可能要問:如何從字符串末尾除去字符。如果猜到我們使用美國鍵盤上緊靠 "$" 右邊 的字符 ("%),那就猜對了。這里有一些簡單的例子,解釋如何截去字符串的末尾部分:

    $ MYFOO="chickensoup.tar.gz"
    $ echo ${MYFOO%%.*}
    chickensoup
    $ echo ${MYFOO%.*}
    chickensoup.tar

    正如您所見,除了將匹配通配符從字符串末尾除去之外,% 和 %% 變量擴展選項與 # 和 ## 的工作方式相同。請注意:如果要從末尾除去特定子字符串,不必使用 "*" 字符:

    MYFOOD="chickensoup"
    $ echo ${MYFOOD%%soup}
    chicken

    在此例中,使用 "%%" 或 "%" 并不重要,因為只能有一個匹配。還要記住:如果忘記了應該使用 "#" 還是 "%",則看一下鍵盤上的 3、4 和 5 鍵,然后猜出來。

    第二種方法:${varible:n1:n2}:截取變量varible從n1到 n2之間的字符串。

    可以根據特定字符偏移和長度,使用另一種形式的變量擴展,來選擇特定子字符串。試著在 bash 中輸入以下行:

    $ EXCLAIM=cowabunga
    $ echo ${EXCLAIM:0:3}
    cow
    $ echo ${EXCLAIM:3:7}
    abunga

    這種形式的字符串截斷非常簡便,只需用冒號分開來指定起始字符和子字符串長度。

    應用字符串截斷

    現在我們已經學習了所有截斷字符串的知識,下面寫一個簡單短小的 shell 腳本。我們的腳本將接受一個文件作為自變量,然后打印:該文件是否是一個 tar 文件。要確定它是否是 tar 文件,將在文件末尾查找模式 ".tar"。如下所示:

    mytar.sh — 一個簡單的腳本

    #!/bin/bash

    if [ "${1##*.}" = "tar" ]
    then
        echo This appears to be a tarball.
    else
        echo At first glance, this does not appear to be a tarball.
    fi

    要運行此腳本,將它輸入到文件 mytar.sh 中,然后輸入 "chmod 755 mytar.sh",生成可執行文件。然后,如下做一下 tar 文件試驗:

    $ ./mytar.sh thisfile.tar
    This appears to be a tarball.
    $ ./mytar.sh thatfile.gz
    At first glance, this does not appear to be a tarball.

    好,成功運行,但是不太實用。在使它更實用之前,先看一下上面使用的 "if" 語句。語句中使用了一個布爾表達式。在 bash 中,"=" 比較運算符檢查字符串是否相等。在 bash 中,所有布爾表達式都用方括號括起。但是布爾表達式實際上測試什么?讓我們看一下左邊。根據前面所學的字符串截斷知識,"${1##*.}" 將從環境變量 "1" 包含的字符串開始部分除去最長的 "*." 匹配,并返回結果。這將返回文件中最后一個 "." 之后的所有部分。顯然,如果文件以 ".tar" 結束,結果將是 "tar",條件也為真。

    您可能會想:開始處的 "1" 環境變量是什么。很簡單 — $1 是傳給腳本的第一個命令行自變量,$2 是第二個,以此類推

    來自:http://www.linuxpig.com/2010/06/shellzifuchuancaozuo/

    相似問題

    相關經驗

    相關資訊

    相關文檔

  • sesese色