AWK 備忘單

2022-04-22 11:09 更新

AWK 備忘單

這是 GNU awk 的 一頁快速參考備忘單,其中涵蓋了常用的 awk 表達(dá)式和命令。

開始

嘗試一下

$ awk -F: '{print $1, $NF}' /etc/passwd
-F:冒號(hào)作為分隔符
{...}awk 程序
print打印當(dāng)前記錄
$1第一個(gè)字段
$NF最后一個(gè)字段
/etc/passwd輸入數(shù)據(jù)文件

awk 程序

BEGIN          {<initializations>} 
   <pattern 1> {<program actions>} 
   <pattern 2> {<program actions>} 
   ...
END            {< final actions >}

例子

awk '
    BEGIN { print "\n>>>Start" }
    !/(login|shutdown)/ { print NR, $0 }
    END { print "<<<END\n" }
' /etc/passwd

變量

          $1      $2/$(NF-1)    $3/$NF
           ▼          ▼           ▼ 
        ┌──────┬──────────────┬───────┐
$0/NR ? │  ID  │  WEBSITE     │  URI  │
        ├──────┼──────────────┼───────┤
$0/NR ? │  1   │  quickref.me │  awk  │
        ├──────┼──────────────┼───────┤
$0/NR ? │  2   │  google.com  │  25   │
        └──────┴──────────────┴───────┘
# First and last field
awk -F: '{print $1,$NF}' /etc/passwd

# With line number
awk -F: '{print NR, $0}' /etc/passwd

# Second last field
awk -F: '{print $(NF-1)}' /etc/passwd

# Custom string 
awk -F: '{print $1 "=" $6}' /etc/passwd

請(qǐng)參閱:變量

awk 程序示例

awk 'BEGIN {print "hello world"}'        # Prints "hello world"
awk -F: '{print $1}' /etc/passwd         # -F: Specify field separator

# /pattern/ Execute actions only for matched pattern
awk -F: '/root/ {print $1}' /etc/passwd                     

# BEGIN block is executed once at the start
awk -F: 'BEGIN { print "uid"} { print $1 }' /etc/passwd     

# END block is executed once at the end
awk -F: '{print $1} END { print "-done-"}' /etc/passwd

條件

awk '{if ($3>30) print $1}' /etc/passwd

見:條件

生成 1000 個(gè)空格

awk 'BEGIN{
    while (a++ < 1000)
        s=s " ";
    print s
}'

請(qǐng)參閱:循環(huán)

數(shù)組

awk 'BEGIN {
   fruits["mango"] = "yellow";
   fruits["orange"] = "orange"
   print fruits["orange"] 
   print fruits["mango"]
}'

請(qǐng)參閱:數(shù)組

函數(shù)

# => 5
awk 'BEGIN{print length("hello")}'
# => HELLO
awk 'BEGIN{print toupper("hello")}'
# => hel
awk 'BEGIN{print substr("hello", 1, 3)}'

請(qǐng)參閱:函數(shù)

awk 變量

內(nèi)置變量

$0全線
$1, $2...$NF第一個(gè),第二個(gè)……最后一個(gè)字段
NR已經(jīng)處理過的總記錄數(shù)目,或者說行號(hào)(不一定是一個(gè)文件,可能是多個(gè))
NF一條記錄的字段的數(shù)目
OFS當(dāng)與輸出上的 ?FS?, 默認(rèn)是以一個(gè)空格字符作為輸出分隔符的
FS讀取并解析輸入文件中的每一行時(shí),默認(rèn)按照空格分隔為字段變量,$1,$2...等
ORS相當(dāng)于輸出的 ?RS?。 每條記錄在輸出時(shí)候會(huì)用分隔符隔開,
RS定義了一行記錄。讀取文件時(shí),默認(rèn)將一行作為一條記錄。
FILENAME文件名

表達(dá)式

$1 == "root"第一個(gè)字段等于根
{print $(NF-1)}倒數(shù)第二個(gè)字段
NR!=1{print $0}從第 2 個(gè)記錄
NR > 3從第 4 記錄
NR == 1第一條記錄
END{print NR}總記錄
BEGIN{print OFMT}輸出格式
{print NR, $0}電話號(hào)碼
{print NR " " $0}行號(hào)(選項(xiàng)卡)
{$1 = NR; print}用行號(hào)替換第 1 個(gè)字段
$NF > 4最后一個(gè)字段 > 4
NR % 2 == 0連記錄
NR==10, NR==20記錄 10 到 20
BEGIN{print ARGC}總參數(shù)
ORS=NR%5?",":"\n"連接記錄

例子

打印總和和平均值

awk -F: '{sum += $3}
     END { print sum, sum/NR }
' /etc/passwd

打印參數(shù)

awk 'BEGIN {
    for (i = 1; i < ARGC; i++)
        print ARGV[i] }' a b c

輸出字段分隔符為逗號(hào)

awk 'BEGIN { FS=":";OFS=","}
    {print $1,$2,$3,$4}' /etc/passwd

打印該字符串匹配Tw的起始位置

awk 'BEGIN {
    if (match("One Two Three", "Tw"))
        print RSTART }'

打印該字符串匹配re的字符串長(zhǎng)度

awk 'BEGIN {
    if (match("One Two Three", "re"))
        print RLENGTH }'

環(huán)境變量

ARGC數(shù)字或參數(shù)
ARGV參數(shù)數(shù)組
FNRFILEN的紅棕色Records
OFMT數(shù)字格式
(默認(rèn)為“%.6g”)
RSTART字符串中的位置
RLENGTH比賽時(shí)長(zhǎng)
SUBSEP多維數(shù)組分隔符
(默認(rèn)“\034”)
ARGIND參數(shù)索引

僅限 GNU awk

ENVIRON環(huán)境變量
IGNORECASE忽略大小寫
CONVFMT轉(zhuǎn)換格式
ERRNO系統(tǒng)錯(cuò)誤
FIELDWIDTHS固定寬度字段

定義變量

awk -v var1="Hello" -v var2="Wold" '
    END {print var1, var2}
' </dev/null

使用 shell 變量

awk -v varName="$PWD" '
    END {print varName}' </dev/null

awk 操作符

操作符

--
{print $1}第一個(gè)字段
$2 == "foo"等于
$2 != "foo"不等于
"foo" in array在數(shù)組中

正則表達(dá)式

--
/regex/線路匹配
!/regex/行不匹配
$1 ~ /regex/字段匹配
$1 !~ /regex/字段不匹配

更多條件

--
($2 <= 4 || $3 < 20)或者
($1 == 4 && $3 < 20)

運(yùn)算符

算術(shù)運(yùn)算

  • +
  • -
  • *
  • /
  • %
  • ++
  • --

速記作業(yè)

  • +=
  • -=
  • *=
  • /=
  • %=

比較運(yùn)算符

  • ==
  • !=
  • <
  • >
  • <=
  • >=

例子

awk 'BEGIN {
    if ("foo" ~ "^fo+$")
        print "Fooey!";
}'

不匹配

awk 'BEGIN {
    if ("boo" !~ "^fo+$")
        print "Boo!";
}'

如果在數(shù)組中

awk 'BEGIN {
    assoc["foo"] = "bar";
    assoc["bar"] = "baz";
    if ("foo" in assoc)
        print "Fooey!";
}'

awk 函數(shù)

常用功能

FunctionDescription
index(s,t)字符串 s 中出現(xiàn)字符串 t 的位置,如果未找到則為 0
length(s)字符串 s 的長(zhǎng)度(如果沒有 arg,則為 $0)
rand0 到 1 之間的隨機(jī)數(shù)
substr(s,index,len)返回從索引開始的 s 的 len-char 子串(從 1 開始計(jì)數(shù))
srand為 rand 設(shè)置種子并返回之前的種子
int(x)將 x 截?cái)酁檎麛?shù)值
split(s,a,fs)將字符串 s 拆分為由 fs 拆分的數(shù)組 a,返回 a 的長(zhǎng)度
match(s,r)字符串 s 中出現(xiàn)正則表達(dá)式 r 的位置,如果未找到則為 0
sub(r,t,s)將 t 替換為字符串 s 中第一次出現(xiàn)的正則表達(dá)式 r(如果未給出 s,則為 $0)
gsub(r,t,s)將 t 替換為字符串 s 中所有出現(xiàn)的正則表達(dá)式 r
system(cmd)執(zhí)行cmd并返回退出狀態(tài)
tolower(s)字符串 s 轉(zhuǎn)小寫
toupper(s)字符串 s 為大寫
getline將 $0 設(shè)置為當(dāng)前輸入文件的下一條輸入記錄。

用戶定義函數(shù)

awk '
    # Returns minimum number
    function find_min(num1, num2){
       if (num1 < num2)
       return num1
       return num2
    }
    # Returns maximum number
    function find_max(num1, num2){
       if (num1 > num2)
       return num1
       return num2
    }
    # Main function
    function main(num1, num2){
       result = find_min(num1, num2)
       print "Minimum =", result
      
       result = find_max(num1, num2)
       print "Maximum =", result
    }
    # Script execution starts here
    BEGIN {
       main(10, 60)
    }
'

awk 數(shù)組

帶索引的數(shù)組

awk 'BEGIN {
    arr[0] = "foo";
    arr[1] = "bar";
    print(arr[0]); # => foo
    delete arr[0];
    print(arr[0]); # => ""
}'

帶鍵的數(shù)組

awk 'BEGIN {
    assoc["foo"] = "bar";
    assoc["bar"] = "baz";
    print("baz" in assoc); # => 0
    print("foo" in assoc); # => 1
}'

拆分?jǐn)?shù)組

awk 'BEGIN {
    split("foo:bar:baz", arr, ":");
    for (key in arr)
        print arr[key];
}'

帶排序的數(shù)組

awk 'BEGIN {
    arr[0] = 3
    arr[1] = 2
    arr[2] = 4
    n = asort(arr)
    for (i = 1; i <= n ; i++)
        print(arr[i])
}'

多維數(shù)組

awk 'BEGIN {
    multidim[0,0] = "foo";
    multidim[0,1] = "bar";
    multidim[1,0] = "baz";
    multidim[1,1] = "boo";
}'

多維迭代

awk 'BEGIN {
    array[1,2]=3;
    array[2,3]=5;
    for (comb in array) {
        split(comb,sep,SUBSEP);
        print sep[1], sep[2], 
        array[sep[1],sep[2]]
    }
}'

awk 條件

if-else 語句

awk -v count=2 'BEGIN {
    if (count == 1)
        print "Yes";
    else
        print "Huh?";
}'

三元運(yùn)算符

awk -v count=2 'BEGIN {
    print (count==1) ? "Yes" : "Huh?";
}'

存在

awk 'BEGIN {
    assoc["foo"] = "bar";
    assoc["bar"] = "baz";
    if ("foo" in assoc)
        print "Fooey!";
}'

不存在

awk 'BEGIN {
    assoc["foo"] = "bar";
    assoc["bar"] = "baz";
    if ("Huh" in assoc == 0 )
        print "Huh!";
}'

switch 語句

awk -F: '{
    switch (NR * 2 + 1) {
        case 3:
        case "11":
            print NR - 1
            break
        
        case /2[[:digit:]]+/:
            print NR
        
        default:
            print NR + 1
        
        case -1:
            print NR * -1
    }
}' /etc/passwd

Awk 循環(huán)

for...i

awk 'BEGIN {
    for (i = 0; i < 10; i++)
        print "i=" i;
}'

1 到 100 之間的 2 次冪

awk 'BEGIN {
    for (i = 1; i <= 100; i *= 2)
        print i
}'

for...in

awk 'BEGIN {
    assoc["key1"] = "val1"
    assoc["key2"] = "val2"
    for (key in assoc)
        print assoc[key];
}'

參數(shù)

awk 'BEGIN {
    for (argnum in ARGV)
        print ARGV[argnum];
}' a b c

例子

反向記錄

awk -F: '{ x[NR] = $0 }
    END {
        for (i = NR; i > 0; i--)
        print x[i]
    }
' /etc/passwd

反向字段

awk -F: '{
    for (i = NF; i > 0; i--)
        printf("%s ",$i);
    print ""
}' /etc/passwd

按記錄求和

awk -F: '{
    s=0;
    for (i = 1; i <= NF; i++)
        s += $i;
    print s
}' /etc/passwd

總和整個(gè)文件

awk -F: '
    {for (i = 1; i <= NF; i++)
        s += $i;
    };
    END{print s}
' /etc/passwd

while 語句

awk 'BEGIN {
    while (a < 10) {
        print "- " " concatenation: " a
        a++;
    }
}'

do...while 語句

awk '{
    i = 1
    do {
        print $0
        i++
    } while (i <= 5)
}' /etc/passwd

break

awk 'BEGIN {
    break_num = 5
    for (i = 0; i < 10; i++) {
        print i
        if (i == break_num)
            break
    }
}'

continue

awk 'BEGIN {
    for (x = 0; x <= 10; x++) {
        if (x == 5 || x == 6)
            continue
        printf "%d ", x
    }
    print ""
}'

Awk 格式化打印

用法

右對(duì)齊

awk 'BEGIN{printf "|%10s|\n", "hello"}'

|     hello|

左對(duì)齊

awk 'BEGIN{printf "|%-10s|\n", "hello"}'

|hello     |

常用說明符

CharacterDescription
cASCII 字符
d十進(jìn)制整數(shù)
eE,f浮點(diǎn)格式
o無符號(hào)八進(jìn)制值
s細(xì)繩
%文字百分比

空間

awk -F: '{
    printf "%-10s %s\n", $1, $(NF-1)
}' /etc/passwd | head -n 3

輸出

root       /root
bin        /bin
daemon     /sbin

標(biāo)題

awk -F: 'BEGIN {
    printf "%-10s %s\n", "User", "Home"
    printf "%-10s %s\n", "----","----"}
    { printf "%-10s %s\n", $1, $(NF-1) }
' /etc/passwd | head -n 5

輸出

User       Home
----       ----
root       /root
bin        /bin
daemon     /sbin

其他

正則表達(dá)式元字符

  • \
  • ^
  • $
  • .
  • [
  • ]
  • |
  • (
  • )
  • *
  • +
  • ?

轉(zhuǎn)義序列

\b退格
\f換頁
\n換行(換行)
\r回車
\t水平標(biāo)簽
\v垂直標(biāo)簽

運(yùn)行腳本

$ cat demo.awk
#!/usr/bin/awk -f
BEGIN { x = 23 }
      { x += 2 }
END   { print x }
$ awk -f demo.awk /etc/passwd
69

另見


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)