shell 字符串操作

Linux C/C++ 正則表達式 Bash 13531 次瀏覽

得到長度
代碼:

%x="abcd"
# 方法一
%expr length $x
4
# 方法二
靐o $
4
# 方法三
%expr "$x" : ".*"
4
# expr 的幫助
# STRING : REGEXP anchored pattern match of REGEXP in STRING

查找子串
代碼:

%expr index $x "b"
2
%expr index $x "a"
1
%expr index $x "b"
2
%expr index $x "c"
3
%expr index $x "d"
4

得到子字符串
代碼:

# 方法一
# expr <string> startpos length
%expr substr "$x" 1 3
abc
%expr substr "$x" 1 5
abcd
%expr substr "$x" 2 5
bcd
# 方法二
# $
靐o $
bcd
靐o $
cd
靐o $
abcd
靐o $
ab
%pos=1
%len=2
靐o $
bc

匹配正則表達式
代碼:

# 打印匹配長度
%expr match $x "."
1
%expr match $x "abc"
3
%expr match $x "bc"
0

字符串的掐頭去尾
代碼:

%x=aabbaarealwwvvww
靐o "$"
aabbaarealwwvv
靐o "$"
aabbaareal
靐o "$"
lwwvvww
靐o "$"
bbaarealwwvvww

其中 , # 表示掐頭，因為鍵盤上 # 在 $ 的左面。
其中 , % 表示%，因為鍵盤上 % 在 $ 的右面。
單個的表示最小匹配，雙個表示最大匹配。
也就是說，當匹配的有多種方案的時候，選擇匹配的最大長度還是最小長度。

字符串的替換
代碼:

%x=abcdabcd
靐o $ # 只替換一個
bbcdabcd
靐o $ # 替換所有
bbcdbbcd

不可以使用 regexp ，只能用 * ? 的文件擴展方式

——————————————————————————————————————————————————————————-

對字符串的處理
包括：截取，連接，匹配，替換，翻轉… …
字符串的處理：
1，截取
方法一：
echo $a|awk '{print substr( ,1,8)}'
substr是awk中的一個子函數，對第一個參數的進行截取，從第一個字符開始，共截取8個字符，如果不夠就從第二個字符中補
方法二
echo $a|cut -b2-8
cut：對標準輸入的字符串進行處理
cut -bn-m:以byte為單位，從第n個byte開始，取m個
cut -bn,m:以byte為單位，截取第n,m個byte
cut -b-n,m:以byte為單位，截取1-n,和第m個
-c:以 charactor為單位
-d:指定分隔符，默認為tab
-s:使標準輸入中沒有delimeter
cut -f1:截取第1個域
方法三
a=123456
echo $
方法四
使用sed截取字符串的最后兩位
echo $test |sed 's/$.*$$..$$//'
截取字符串的前2位
echo $test |sed 's/^$..$$.*$//'
歡迎訪問007電腦資訊
2，比較
好像沒有什么可以比較的
3，連接
$a$b
或者
$string
4，翻轉
方法一：
使用rev命令
方法二：
編寫腳本實現
#!/usr/bin/awk -f
################################################################
# Description : duplicate rev in awk
################################################################
{
revline = ""
for (i=1;i<=length;i++)
{
revline = substr(,i,1) revline
}
}
END{print revline}

5，匹配
grep
egrep
fgrep
6，排序
7，替換
bash中：
%x=abcdabcd
%echo $ # 只替換一個
bbcdabcd
%echo $ # 替換所有
bbcdbbcd
sh 中：
？？
如何替換/
使用sed
替換所有匹配
echo $test |sed 's/xx/yy'
替換單個匹配
？？
8，得到字符串的長度：
bash當中
$
或者
expr "$VAR" : '.*'
9，判斷字符串是否為數字
10，得到字符串中某個字符的重復次數
echo $a |tr "x" "\n" |wc -l
得到的結果需要減去1
或者 echo $a |awk -F"x" '{print NF-1}'
11，得到字符串中某個string的重復次數 007電腦資訊
12，將一批文件中的所有string替換
for i in file_list
do
vi $i <<-!
:g/xxxx/s//XXXX/g
:wq
!
done
13，如何將字符串內每兩個字符中間插入一個字符
使用sed
echo $test |sed 's/../&[insert char]/g'

============================================================================
象專業人員那樣截斷字符串

盡管 basename 和 dirname 是很好的工具，但有時可能需要執行更高級的字符串“截斷”，而不只是標準的路徑名操作。當需要更強的說服力時，可以利用 bash 內置的變量擴展功能。已經使用了類似于 ${MYVAR} 的標準類型的變量擴展。但是 bash 自身也可以執行一些便利的字符串截斷。看一下這些例子：

第一種方法:

${varible##*string} 從左向右截取最后一個string后的字符串

${varible#*string}從左向右截取第一個string后的字符串

${varible%%string*}從右向左截取最后一個string后的字符串

${varible%string*}從右向左截取第一個string后的字符串

"*"只是一個通配符可以不要

$ MYVAR=foodforthought.jpg
$ echo ${MYVAR##*fo}
rthought.jpg
$ echo ${MYVAR#*fo}
odforthought.jpg

在第一個例子中，輸入了 ${MYVAR##*fo}。它的確切含義是什么？基本上，在 ${ } 中輸入環境變量名稱，兩個 ##，然后是通配符 ("*fo")。然后，bash 取得 MYVAR，找到從字符串 "foodforthought.jpg" 開始處開始、且匹配通配符 "*fo" 的最長子字符串，然后將其從字符串的開始處截去。剛開始理解時會有些困難，為了感受一下這個特殊的 "##" 選項如何工作，讓我們一步步地看看 bash 如何完成這個擴展。首先，它從 "foodforthought.jpg" 的開始處搜索與 "*fo" 通配符匹配的子字符串。以下是檢查到的子字符串：

f
fo      MATCHES *fo
foo
food
foodf
foodfo      MATCHES *fo
foodfor
foodfort
foodforth
foodfortho
foodforthou
foodforthoug
foodforthought
foodforthought.j
foodforthought.jp
foodforthought.jpg

在搜索了匹配的字符串之后，可以看到 bash 找到兩個匹配。它選擇最長的匹配，從初始字符串的開始處除去，然后返回結果。

上面所示的第二個變量擴展形式看起來與第一個相同，但是它只使用一個 "#" — 并且 bash 執行幾乎同樣的過程。它查看與第一個例子相同的子字符串系列，但是 bash 從初始字符串除去最短的匹配，然后返回結果。所以，一查到 "fo" 子字符串，它就從字符串中除去 "fo"，然后返回 "odforthought.jpg"。

這樣說可能會令人十分困惑，下面以一簡單方式記住這個功能。當搜索最長匹配時，使用 ##（因為 ## 比 # 長）。當搜索最短匹配時，使用 #。看，不難記吧！等一下，怎樣記住應該使用 '#' 字符來從字符串開始部分除去？很簡單！注意到了嗎：在美國鍵盤上，shift-4 是 "$"，它是 bash 變量擴展字符。在鍵盤上，緊靠 "$" 左邊的是 "#"。這樣，可以看到："#" 位于 "$" 的“開始處”，因此（根據我們的記憶法），"#" 從字符串的開始處除去字符。您可能要問：如何從字符串末尾除去字符。如果猜到我們使用美國鍵盤上緊靠 "$" 右邊的字符 ("%)，那就猜對了。這里有一些簡單的例子，解釋如何截去字符串的末尾部分：

$ MYFOO="chickensoup.tar.gz"
$ echo ${MYFOO%%.*}
chickensoup
$ echo ${MYFOO%.*}
chickensoup.tar

正如您所見，除了將匹配通配符從字符串末尾除去之外，% 和 %% 變量擴展選項與 # 和 ## 的工作方式相同。請注意：如果要從末尾除去特定子字符串，不必使用 "*" 字符：

MYFOOD="chickensoup"
$ echo ${MYFOOD%%soup}
chicken

在此例中，使用 "%%" 或 "%" 并不重要，因為只能有一個匹配。還要記住：如果忘記了應該使用 "#" 還是 "%"，則看一下鍵盤上的 3、4 和 5 鍵，然后猜出來。

第二種方法：${varible:n1:n2}:截取變量varible從n1到 n2之間的字符串。

可以根據特定字符偏移和長度，使用另一種形式的變量擴展，來選擇特定子字符串。試著在 bash 中輸入以下行：

$ EXCLAIM=cowabunga
$ echo ${EXCLAIM:0:3}
cow
$ echo ${EXCLAIM:3:7}
abunga

這種形式的字符串截斷非常簡便，只需用冒號分開來指定起始字符和子字符串長度。

應用字符串截斷

現在我們已經學習了所有截斷字符串的知識，下面寫一個簡單短小的 shell 腳本。我們的腳本將接受一個文件作為自變量，然后打印：該文件是否是一個 tar 文件。要確定它是否是 tar 文件，將在文件末尾查找模式 ".tar"。如下所示：

mytar.sh — 一個簡單的腳本

#!/bin/bash

if [ "${1##*.}" = "tar" ]
then
echo This appears to be a tarball.
else
echo At first glance, this does not appear to be a tarball.
fi

要運行此腳本，將它輸入到文件 mytar.sh 中，然后輸入 "chmod 755 mytar.sh"，生成可執行文件。然后，如下做一下 tar 文件試驗：

$ ./mytar.sh thisfile.tar
This appears to be a tarball.
$ ./mytar.sh thatfile.gz
At first glance, this does not appear to be a tarball.

好，成功運行，但是不太實用。在使它更實用之前，先看一下上面使用的 "if" 語句。語句中使用了一個布爾表達式。在 bash 中，"=" 比較運算符檢查字符串是否相等。在 bash 中，所有布爾表達式都用方括號括起。但是布爾表達式實際上測試什么？讓我們看一下左邊。根據前面所學的字符串截斷知識，"${1##*.}" 將從環境變量 "1" 包含的字符串開始部分除去最長的 "*." 匹配，并返回結果。這將返回文件中最后一個 "." 之后的所有部分。顯然，如果文件以 ".tar" 結束，結果將是 "tar"，條件也為真。

您可能會想：開始處的 "1" 環境變量是什么。很簡單 — $1 是傳給腳本的第一個命令行自變量，$2 是第二個，以此類推

來自：http://www.linuxpig.com/2010/06/shellzifuchuancaozuo/

jopen

14年前提問

shell 字符串操作

相似問題

相關經驗

相關資訊

相關文檔