Shell 變量知多少?

語言: CN / TW / HK

Shell 變量(一)

bash shell 編程和其他編程語言差不多,同樣包含變量(存放字符串和數值的容器,可以進行修改、比較、傳遞)。在引用 bash 變量時,可以使用一些非常特殊的運算符。bash 還擁有內建變量,這些變量可以提供有關腳本中其他變量的重要信息。下面介紹 bash 變量和一些特殊的變量引用機制,展示如何將其運用於你自己的腳本。

1、shell 變量基礎知識

bash 腳本中的變量名稱通常採用全大寫,但這並非強制性的,只是一種常見做法而已。變量不用事先聲明,直接使用就行了。變量基本上都是字符串類型,不過有些運算符能夠將變量內容視為數字。變量的實際用法如下所示。

# 使用shell變量的普通腳本
MYVAR="something"
echo $MYVAR
# 寫法類似,但沒有引號
MY_2ND=anotherone
echo $MY_2ND
# 這裏因為包含空客,需要使用引號:
MYOTHER="more stuff to echo"
echo $MYOTHER

bash 變量的語法有兩處要點,但可能不那麼一目瞭然。

  • 首先,賦值語法 name=value 看起來相當直觀,但 = 兩側不能有任何空白字符。如果允許 = 兩側出現空白字符,那麼變量賦值就會變成下面這樣:
MYVAR = something

此時 shell 很難區分出到底是要調用命令還是要給變量賦值。對於能夠以 = 為參數的命令(如 test)更是如此。所以,還是讓事情簡單點吧:變量賦值時,shell 不允許在 = 兩側出現空白字符。該規定的另一方面也值得注意,不要在文件名中使用 =。

  • 其次需要注意的是,引用變量時要使用 $ 符號。給變量賦值時不需要在變量名前加 $,但獲取變量值時需要。出現在表達式 $(( ))中的變量是個例外。原因很簡單,就是為了消除歧義。如下:

    MYVAR=something
    
    echo MYVAR is now MYVAR
    

    你能分辨出哪個是字符串 MYVAR,哪個是變量 MYVAR 嗎?bash 中的一切都是字符串,所以需要用 $ 來表明變量引

    用。

2、記錄腳本

詳細討論 shell 腳本或變量前,我們還得説説如何記錄腳本。畢竟,你得能看明白自己的腳本,即便是在編寫完的幾個月後。

用註釋記錄腳本。# 代表註釋的開始。該行上隨後的所有字符都會被shell 忽略。

#
# 這是一行註釋
#
# 多用註釋
# 註釋是你的好朋友

如果您是java開發工作者,你會發現,這就是我們平時常説的代碼註釋。

3、將變量名與周圍的文本分開

如果你需要輸出變量以及其他文本。引用變量要用到 $,但是該怎麼區分變量名與緊隨其後的其他文本呢?例如,你想要用 shell 變量作為文件名的一部分,如下所示:

for FN in 1 2 3 4 5
do
 somescript /tmp/rep$FNport.txt #執行某個腳本,把文件當作執行參數,如cat
done

shell 會怎麼理解這段代碼?它會認為變量名從 $ 開始,到點號結束。換句話説,它將 $FNport 視為變量名,而非我們想要的 $FN。

那麼,我們如何讓shell知道我們的變量是FN呢?

使用完整的變量引用語法,不僅要包括 $,還要在變量名周圍加上花括號,如下:

somescript /tmp/rep${FN}port.txt

因為 shell 變量名中只能包含字母、數字以及下劃線,所以很多時候並不需要使用花括號。任何空白字符或標點符號(下劃線除外)都足以提示變量名的結束位置。但只要有疑問,就應該用花括號。

4、導出變量

你在某個腳本中定義了一個變量,但在調用其他腳本時,該腳本並不知道這個變量的存在。為了解決這個問題,我們需要將傳給其他腳本的變量導出。如下所示:

export MYVAR

export NAME=value

要想查看所有已導出的變量,敲入命令 env(或者內建命令 export-p)就能列出各個變量及其值。當腳本運行時,這些變量都可供使用,其中很多是 bash 啟動腳本已經設置好的,如$PATH。

可以在 export 後面跟上變量賦值,不過這種寫法不適用於比較老的 shell 版本。然後導出之後,就可以隨意給變量賦值,不用重複導出。因此,有時你會看到下列語句:

# 導出變量
export FNAME
export SIZE
export MAX
# 為變量賦值
MAX=2048
SIZE=64
FNAME=/tmp/scratch

注意,導出的變量實際上是按值調用的。在被調用腳本中修改導出變量的值並不會改變調用腳本中該變量的值。

對於導出的變量,我們該如何刪除呢?

# 刪除變量
unset myvar

Shell 變量(二)

你希望用户能在調用腳本時指定參數。可以要求用户設置一個 shell變量,但這種做法似乎不夠靈活。另外還需要向其他腳本傳遞數據。這可以通過環境變量實現,但會使兩個腳本之間的聯繫過於緊密。因此,此處我們可以用到腳本參數。

1、在shell腳本中使用參數

使用命令行參數。在命令行上,出現在腳本名之後的任意單詞都可以在腳本中作為編號變量(numbered variable)被訪問。假設有下列腳本 simplest.sh。

# 一個簡單的shell腳本
echo $1

該腳本會顯示在命令行上被調用時所指定的第一個參數。我們來看一種實際用法。

$ cat simplest.sh
# 一個簡單的shell腳本
echo ${1}
$ ./simplest.sh you see what I mean
you
$ ./simplest.sh one more time
one
$

其他參數的可用形式分別為 ${2}、${3}、${4}、${5} 等。單個數位的數字用不着花括號,除非要區分變量名與其後出現的文本。典型的腳本只用到少部分參數,但如果涉及 ${10},那就得使用花括號了,否則 shell 會將 $10 理解為 ${1} 後面緊跟着字符串 0,如下所示。

$ cat tricky.sh
echo $1 $10 ${10}
$ ./tricky.sh I II III IV V VI VII VIII IX X XI
I I0 X   #注意觀察第二個輸出
$

第 10 個參數的值是 X,但如果在腳本中寫成 $10,那麼你在 echo語句中得到的會是第一個參數 $1,後面緊跟着一個字符串 0。

因為第三個使用了${},所以三個${10}可以正常輸出X。

2、遍歷傳入腳本的參數: $*

如果你想對指定的一系列參數執行某些操作。在編寫 shell 腳本時,對單個參數進行處理不是什麼問題,只需要用 $1 引用這個參數即可。但如果面對的是一大批文件呢?你可能想這樣調用腳本。

./actall *.txt

shell 會進行模式匹配,生成匹配 *.txt 模式(以 .txt 結尾的文件名)的文件名列表。對於腳本而言,我們永遠無法預估傳入的參數的個數,那麼我們就無法通過${數字}獲取所有參數,那麼${數字}方式將不再適用。

特殊的 shell 變量 $* 能夠引用所有的參數,可以將其用於 for 循環,如下所示:

#!/usr/bin/env bash
# 實例文件:actall.sh
# 批量修改文件權限
#
for FN in $*
do
 echo changing $FN
 chmod 0750 $FN
done

變量 $FN 是我們自己挑選的;使用別的變量名也沒有任何問題。$*引用的是命令行上出現的所有參數。假如用户輸入

./actall abc.txt another.txt allmynotes.txt

調用該腳本時,$1 等於 abc.txt、$2 等於 another.txt、$3 等於allmynotes.txt,而 $* 等於整個參數列表。換句話説,shell 替換for 語句中的 $* 後,腳本就變成了如下這樣:

for FN in abc.txt another.txt allmynotes.txt
do
 echo changing $FN
 chmod 0750 $FN
done

for 循環從列表中獲取第一個值,並將其賦給變量 $FN,然後執行do 和 done 之間的語句。列表中的其他值會重複執行該過程。

3、處理包含空格的參數: “”

你編寫了一個可以接受文件名作為參數的腳本,看起來一切正常,但有一次腳本出現了問題,結果發現是因為文件名中帶有空格。你得仔細將所有可能包含文件名的命令參數全部加上引號。引用變量時,將其放入雙引號中。

在 shell 腳本中,曾經簡單的寫作 ls -l $1 的地方,現在最好給參數加上引號,改寫成 ls -l "$1"。否則,如果參數包含空格,那麼會被 shell 解析成兩個單詞,$1 中只會包含部分文件名。如下:

$ cat simpls.sh
# 一個簡單的shell腳本
ls -l ${1}
$
$ ./simple.sh Oh the Waste
ls: Oh: No such file or directory
$

如果調用腳本時沒有將文件名放進引號,那麼 bash 會看到 3 個參數並將 $1 替換成第 1 個參數(Oh)。ls 命令運行時只有一個參數Oh,結果就是無法找到該文件。

接下來,我們在調用腳本時給文件名加上引號。

$ ./simpls.sh "Oh the Waste"
ls: Oh: No such file or directory
ls: the: No such file or directory
ls: Waste: No such file or directory
$

還是不行。bash 得到了一個包含 3 個單詞的文件名,並將 ls 命令中的 $1 替換成了該文件名。到目前一切都還好。但是,我們並沒有將腳本中的變量引用放入引號,因此 ls 將文件名中的各個單詞視為單獨的參數(作為單獨的文件名)。結果還是無法找到這些文件,相當執行命令:

ls -l Oh the Waste

因此,我們需要將我們變量引用放進引號,修改腳本內容如下:

$ cat simpls.sh
# 一個簡單的shell腳本,注意此處${1}與第一次腳本里的區別,多了雙引號
ls -l "${1}"
$
$ ./simple.sh "Oh the Waste"
$

4、處理包含空格的參數列表:$@

對於第二節,我們通過$*,可以獲取參數列表,那麼如果這個時候我們傳入的參數列表包含空格會不會有問題呢? 如下所示:

$ ./actall.sh  "Oh the Waste"
changing Oh        
chmod: 無 法 訪 問 "Oh": 沒 有 那 個 文 件 或 目 錄 
changing the
chmod: 無 法 訪 問 "the": 沒 有 那 個 文 件 或 目 錄 
changing Waste
chmod: 無 法 訪 問 "Waste": 沒 有 那 個 文 件 或 目 錄
$

按照上節中的建議,你給變量加上引號,但是仍然出現了錯誤。如下:

#!/usr/bin/env bash
#實例文件:actall.sh
#批量修改文件權限
#
for FN in $*
do
   echo changing "$FN"
   chmod 0750 "$FN"
done


如果文件名中帶有空格,就會報錯,報錯的原因與 for 循環中使用的 $* 有關。在這個示例中,我們需要用到另一個不同但相關的 shell 變量 $@。如果該變量出現在引號中,則會得到一個命令行參數列表,其中每個參數都會被單獨引用起來。修改後的 shell 腳本如下:

#!/usr/bin/env bash
# 實例文件:chmod_all.2
# 在文件名包含空格時選擇更好的引號添加方式,批量修改文件權限
#
for FN in "$@"
do
 chmod 0750 "$FN"
done

如果不加引號,$* 和 $@ 沒什麼兩樣。但當兩者出現在引號中時,bash 就會區別對待了。"$*" 得到的是整個參數列表,而"$@" 得到的可不是一個字符串,而是與各個參數對應的帶有引號的字符串列表。

如果你知道文件名中沒有空格,沿用老的 $ 語法基本沒什麼大礙。對於那些更穩健的腳本而言,安全起見,建議使用 "$@"*

Shell 變量(三)

1、統計參數數量

你想知道調用腳本時使用了多少個參數。使用 shell 內建變量 $#。如下,展示了一個嚴格要求3個參數的腳本:

#!/usr/bin/env bash
# 實例文件:check_arg_count
#
# 檢查正確的參數數量:
# 使用下列語法或者:if [ $# -lt 3 ]

if (( $# < 3 ))
then
 printf "%b" "Error. Not enough arguments.\n" >&2
 printf "%b" "usage: myscript file1 op file2\n" >&2
 exit 1
elif (( $# > 3 ))
then
 printf "%b" "Error. Too many arguments.\n" >&2
 printf "%b" "usage: myscript file1 op file2\n" >&2
 exit 2
else
 printf "%b" "Argument count correct. Proceeding...\n"
fi

以下分別是參數過多和參數數量正好時的運行情況。

$ ./myscript myfile is copied into yourfile
Error. Too many arguments.
usage: myscript file1 op file2

$ ./myscript myfile copy yourfile
Argument count correct. Proceeding...

我們用 if 測試所提供的參數數量(保存在 $# 中)是否大於 3。如果答案是肯定的,則輸出一條錯誤信息,提醒用户正確的腳本用法,然後退出。

標準提示錯誤信息會被重定向到標準錯誤(>&2)。這種做法符合標準錯誤的本意:作為所有錯誤信息的通道。

2、丟棄參數:shift

所有的正式腳本可能都要有兩種參數:修改腳本行為的選項以及要處理的真正參數。你需要用一種方法在處理完選項後將其丟棄。例如,現在有如下腳本:

for FN in "$@"
do
 echo changing $FN
 chmod 0750 "$FN"
done

腳本內容非常簡單,它會顯示正在處理的文件名,然後修改文件權限。但有時你希望腳本靜悄悄地工作,不要顯示文件名,而有時又希望顯示文件名。如何在保留for 循環的同時添加一個能夠關閉文件名顯示的選項呢?

用 shift 刪除處理過的參數,如下:

# 自定義變量
VERBOSE=0
# 判斷第一個參數的值
if [[ $1 = -v ]]
then
 # 使用變量保存參數值
 VERBOSE=1
 # 刪除參數
 shift
fi

# 此時for拿到的參數已經少了$1,從$2開始讀取
for FN in "$@"
do
 if (( VERBOSE == 1 ))
 then
 echo changing $FN
 fi
 chmod 0750 "$FN"

done

我們添加了標記變量 $VERBOSE,藉此瞭解是否應該輸出所處理的文件名。可是一旦 shell 腳本發現 -v 選項並設置好標記,我們就用不着參數列表中的 -v 了。shift 語句告訴 bash 將命令行參數挪動一個位置,使 $2 變成 $1、$3 變成 $2,以此類推,這樣就丟棄了第一個參數($1)。如此一來,當 for 循環啟動時,參數列表($@)中就再也沒有 -v,剩下的是緊隨其後的那些參數。

運行結果如下:

# 執行腳本,帶-v參數,輸出修改的文件名
$ ./shift_test.sh -v error.out  
changing error.out

# 執行腳本,不帶-v參數,悄悄執行,不輸出文件名
$./shift_test.sh  error.out                                                                                                
$   

3、獲取默認值:${:-}

有一個可以接受命令行參數的 shell 腳本。如你希望能夠提供默認值,這樣就不用每次都讓用户輸入那些頻繁用到的值了。

用 ${:-} 語法引用參數並提供默認值,如下所示:

FILEDIR=${1:-/tmp}

在引用 shell 變量時,有多種特殊運算符可用。:- 運算符的意思是,如果指定參數(這裏是 $1)不存在或為空,則將運算符之後的內容(本例為 /tmp)作為值。否則,使用已經設置好的參數值。該運算符可用於任何 shell 變量,並不侷限於位置參數$1、$2、$3等。

當然,你也可以用更多的代碼來實現:用 if 語句檢查變量是否為空或不存在,但在 shell 腳本中,此類處理司空見慣,:- 運算符可謂是一種頗受歡迎的便捷寫法。

4、設置環境變量默認值: ${HOME:=/tmp}

你的腳本依賴於某些常用(如 $USER)或業務特定的環境變量。要想構建一個穩健的 shell 腳本,就得確保這些變量都有合理的默認值。那麼該如何確保呢?

首次引用 shell 變量時,如果該變量沒有值,則使用賦值運算符為其賦值,如下:

cd ${HOME:=/tmp}

示例中所引用的 $HOME 會返回其當前值,除非它為空或者壓根就沒設置。對於後兩種情況(為空或沒有設置),返回 /tmp,該值還會被賦給 $HOME,隨後再引用 $HOME 的話,返回的就是這個新值。如下所示,

注意:下面的例子會改變環境變量HOME,請慎重執行

$ echo ${HOME:=/tmp}
/home/uid002
$ unset HOME # 刪除環境變量值
$ echo ${HOME:=/tmp} # 重新獲取,此時不存在,將重新賦值並返回新值
/tmp
$ echo $HOME # 此時再查看變量,輸出新設置的值
/tmp
$ cd;pwd
/tmp
$

賦值運算符有一個重要的例外:不能對位置參數(如 $1 或$*)賦值。在這種情況下,可以使用 :-(如 ${1:-default}),該表達式只返回值,但不進行賦值。

${VAR:=value} 和 ${VAR:-value} 在形式上的差異,也許可以幫助你記憶這兩種讓人抓狂的符號。:= 執行賦值操作,同時返回運算符右側的值。:- 只做了前者一半的工作:返回值,但不賦值。因此,它的符號也只有等號的一半(一個橫槓,而不是兩個)。

Shell 變量(四)

1、獲得某個數的絕對值

變量中的數值可能是負數,也可能是零或正數。你想得到它的大小(也就是絕對值),但 bash 似乎沒有求絕對值的功能。但是,我們可以利用字符串操作。如下:

${MYVAR#-}

這是一種簡單的字符串操作。# 從字符串起始位置開始搜索負號(-)。如果找到,則將其刪除;如果沒有找到,就保留原值。不管是哪種情況,最後得到的都是不包含負號的絕對值。

然而,我們也可以使用 if/then/else 按照數學方法來實現。如下:

# 通過判斷數值於0的關係,並且通過與-1相乘
if (( MYVAR < 0 ))
then
 let MYVAR=MYVAR*-1
fi

對比上面2種方法,明顯第一種更簡單,所以推薦第一種。

2、選取CSV的替換值

你想製作一個由逗號分隔的值列表,但不希望開頭或結尾處出現逗號,然後這是我們日常工作中很普遍的需求。如果在循環內部用 LIST="${LIST},${NEWVAL}" 構建該列表,那麼第一次循環(此時 LIST 為空)過後會得到一個前導逗號。你可以對 LIST 進行特殊的初始化處理,以便它在進入循環前就先得到第一個值,但如果覺得這種方法不實用,或是為了避免重複代碼(用於得到新值),你可以改用 bash 中的 ${:+} 語法。如下:

LIST="${LIST}${LIST:+,}${NEWVAL}"

如果 {LIST} 為空或不存在,那麼 $LIST 的兩個表達式不會產生任何內容。這就意味着,第一次循環過後,LIST 中保存的只有NEWVAL 的值。如果 LIST 不為空,則第二個表達式 ${LIST:+,}會被替換為逗號,將先前的值與新值分隔開來。

下面的代碼片段用於讀取並構建 CSV 列表。

LIST=""                                           
for NEWVAL in "$@" 
do
LIST="${LIST}${LIST:+,}${NEWVAL}"
done 
echo ${LIST}  

3、使用數組變量

到目前為止,我們已經見識了不少使用變量的腳本,但是 bash 能不能處理數組呢?當然可以,bash 有專門的一維數組語法。

如果編寫腳本時已經知道具體的值,則初始化數組就很容易了。格式如下:

MYRA=(first second third home)

注意:數組是用(),這同java裏的數組符號[]不同。

括號內列表的每個單詞都對應着一個數組元素。你可以像下面這樣引用各個元素:

echo runners on ${MYRA[0]} and ${MYRA[2]}

輸出結果如下:

runners on first and third

注意:如果只寫 $MYRA,那麼只會得到第一個數組元素,相當於${MYRA[0]}。

4、轉換大小寫

bash 4.0 中的幾個運算符可以在引用變量名時轉換其大小寫。如果變量 $FN 中包含一個需要轉換成小寫的文件名(字符串),那麼${FN,,} 會返回全部是小寫形式的字符串。與此類似,${FN^^} 會返回全部是大寫形式的字符串。甚至還有 ${FN~~},它可以切換大小寫,將所有的小寫字母轉換成大寫,大寫字母轉換成小寫。

以下的 for 循環會將所有參數更改成小寫字母。

for FN in "$@"

do

 echo "${FN}" 轉為小寫的結果為:"${FN,,}"

done

或者寫成單行腳本:

for FN in "$@";  do  echo "${FN}" 轉為小寫的結果為:"${FN,,}" ; done

5、對不存在的參數輸出錯誤消息

有時你需要強制用户指定某個值,否則就無法繼續往下進行。用户有可能會遺漏某個參數,因為他們確實不知道該怎樣調用腳本。你希望能給用户點提示,省得他們自己瞎猜。相較於堆砌成堆的 if 語句,有沒有更簡潔的方法來檢查各個參數?

引用參數時使用 ${:?} 語法。如果指定參數不存在或為空,那麼 bash 會輸出錯誤消息並退出。

#!/usr/bin/env bash
# 實例文件:check_unset_parms
#

USAGE="usage: myscript scratchdir sourcefile conversion"

FILEDIR=${1:?"Error. You must supply a scratch directory."}

FILESRC=${2:?"Error. You must supply a source file."}

CVTTYPE=${3:?"Error. ${USAGE}"}

如果執行腳本時沒有指定足夠的參數,則會出現下列結果。

$ ./myscript /tmp /dev/null

./myScript.sh:行11: 3: Error. usage: myscript scratchdir sourcefile conversion

$

bash 會測試各個參數,如果參數不存在或為空,則輸出錯誤信息並退出。$3 所對應的錯誤消息中使用了另一個 shell 變量。

如果 $3 不存在,則錯誤消息中會包含短語 "Error."、變量$USAGE 的值。

另一方面,${:?} 生成的錯誤信息包含 shell 腳本文件名和行號。

本文由傳智教育博學谷教研團隊發佈。

如果本文對您有幫助,歡迎關注點贊;如果您有任何建議也可留言評論私信,您的支持是我堅持創作的動力。

轉載請註明出處!