亚洲国产日韩人妖另类,久久只有这里有精品热久久,依依成人精品视频在线观看,免费国产午夜视频在线

      
      

        Linux文本處理工具:AWK的妙用

        在平時的工作中,會涉及到很多腳本的編寫及文本的處理,學(xué)好awk可以使你寫的腳本看起來更高級,而且涉及到大本文的時候效率也會更高哦,快點贊來學(xué)習(xí)吧!評論可獲得作者精心整理的大廠awk面試相關(guān)題目一份

        AWK的基本格式

        awk [options] ‘program’ file…注釋:program->pattern{action statements;..}pattern和action:pattern部分決定動作語句何時觸發(fā)及觸發(fā)事件(BEGIN,END)action statements對數(shù)據(jù)進行處理,放在{}內(nèi)指明(print, printf)

        awk工作原理:

        第一步:執(zhí)行BEGIN{action;… }語句塊中的語句第二步:從文件或標準輸入(stdin)讀取一行,然后執(zhí)行pattern{ action;… }語句塊,它逐行掃描文件,從第一行到最后一行重復(fù)這個過程,直到文件全部被讀取完畢。第三步:當(dāng)讀至輸入流末尾時,執(zhí)行END{action;…}語句塊注意:pattern語句塊中的通用命令是最重要的部分,也是可選的。如果沒有提供pattern語句塊,則默認執(zhí)行{ print },即打印每一個讀取到的行,awk讀取的每一行都會執(zhí)行該語句塊

        注意:awk程序通常由:BEGIN語句塊、能夠使用模式匹配的通用語句塊、END語句塊,共3部分組成。BEGIN語句塊和END語句塊分別為文家處理前和處理后執(zhí)行的語句段

        1)OPTIONS

        選項(options):

        -F指明輸入時用到的字段分隔符(默認以空格為分隔符)-v var內(nèi)置變量|var=value: 自定義變量變量分為內(nèi)置變量和自定義變量:

        內(nèi)置變量:

        • FS:輸入字段分隔符,默認為空白字符(與-F效果相同)

        [root@dashui ~]# awk -v FS=”:” ‘{print $1,$3}’ /etc/passwdroot 0bin 1daemon 2

        • OFS:輸出字段分隔符,默認為空白字符

        [root@dashui ~]# awk -v FS=”:” -v OFS=”*” ‘{print $1,$3}’ /etc/passwdroot*0bin*1daemon*2

        • RS:輸入記錄分隔符,指定讀入時的換行符,原換行符仍有效

        [root@dashui ~]# awk -v RS=’ ‘ ‘{print}’ hah //指定讀入時的分割符,只要出現(xiàn)空格就被換行nihaoahahaiamfanin[root@dashui ~]# cat hah nihao a hahai amfanin

        • ORS:輸出記錄分隔符,輸出時用指定符號代替換行符

        [root@dashui ~]# cat hah nihao a hahai amfanin[root@dashui ~]# awk -v ORS=’=== ‘ ‘{print}’ hah //指定輸出分隔符為===,所以原來換行被替換成===nihao a haha=== i amfanin=== [root@dashui ~]#

        • NF:字段數(shù)量

        [root@dashui ~]# awk -F: ‘{print NF}’ /etc/passwd //以:為分隔符,每一行有幾個字段777

        • NR:行號(如果有多個文件,則行號統(tǒng)計在一起)

        [root@dashui ~]# awk ‘{print NR}’ hah12[root@dashui ~]# awk ‘{print NR}’ hah /etc/fstab //hah的行號和/etc/fstab的統(tǒng)計在了一塊 1234567891011121314

        • FNR:各文件分別計數(shù),行號

        [root@dashui ~]# awk ‘{print FNR}’ hah /etc/fstab 12123456789101112FILENAME:當(dāng)前文件名[root@dashui ~]# awk ‘{print FILENAME}’ hah //因為前面的pattern沒有寫,所以默認每讀入一行,就執(zhí)行一次printhahhah[root@dashui ~]# cat hah nihao a hahai amfanin

        • ARGC:命令行參數(shù)的個數(shù)

        [root@dashui ~]# awk ‘{print ARGC}’ hah //其中第一個參數(shù)為awk ,第二個為 hah22

        • ARGV:數(shù)組,保存的是命令行所給定的各參數(shù)

        [root@dashui ~]# awk ‘{print ARGV[0]}’ hah //0是第一個參數(shù),1是第二個參數(shù)awkawk[root@dashui ~]# awk ‘{print ARGV[1]}’ hah hahhah

        • 自定義變量
        • (1) -v var=value變量名區(qū)分字符大小寫(2) 在program中直接定義

        [root@dashui ~]# awk -v name=xiaoshui ‘BEGIN{print name}’xiaoshui[root@dashui ~]# awk ‘BEGIN{name=”xiaozhao”;print name}’xiaozhao 注意:自定義變量時需要加上雙引號,不加的話可能會定義不成功,如下[root@dashui ~]# awk ‘BEGIN{name=xiaozhao;print name}'[root@dashui ~]# awk ‘BEGIN{name=”xiaozhao”;print name}’xiaozhao

        2)program

        program分為pattern和action

        pattern部分決定動作語句何時觸發(fā)及觸發(fā)事件(BEGIN,END)action statements對數(shù)據(jù)進行處理,放在{}內(nèi)指明(print, printf)(1)action(print、printf)

        Expressions:算術(shù),比較表達式等Control statements:if, while等Compound statements:組合語句input statementsoutput statements:print等

        print

        print格式:print item1, item2, …

        (1) 逗號分隔符(2) 輸出的各item可以字符串,也可以是數(shù)值;當(dāng)前記錄的字段、變量或awk的表達式(3) 如省略item,相當(dāng)于print $0

        [root@dashui ~]# awk -F : ‘{print $1,$3}’ /etc/passwdroot 0bin 1daemon 2[root@dashui ~]# awk -F : ‘{print $1,”xiaoshui”,$3}’ /etc/passwdroot xiaoshui 0bin xiaoshui 1daemon xiaoshui 2[root@dashui ~]# awk -F : ‘{print }’ /etc/passwdroot:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologin

        • printf

        格式化輸出:printf“FORMAT”, item1, item2, …(1) 必須指定FORMAT(2) 不會自動換行,需要顯式給出換行控制符,(3) FORMAT中需要分別為后面每個item指定格式符

        格式符:與item一一對應(yīng)

        %c: 顯示字符的ASCII碼%d, %i: 顯示十進制整數(shù)%e, %E:顯示科學(xué)計數(shù)法數(shù)值%f:顯示為浮點數(shù)%g, %G:以科學(xué)計數(shù)法或浮點形式顯示數(shù)值%s:顯示字符串%u:無符號整數(shù)%%: 顯示%自身

        修飾符:

        #[.#]:第一個數(shù)字控制顯示的寬度;第二個#表示小數(shù)點后精度,%3.1f-: 左對齊(默認右對齊)%-15s+:顯示數(shù)值的正負符號%+d[root@dashui ~]# awk -F : ‘{printf “%s %d”,$1,$3 }’ /etc/passwd //如果不加默認是不換行的root 0bin 1daemon 2

        (2)pattern

        • PATTERN:根據(jù)pattern條件,過濾匹配的行,再做處理

        (1)如果未指定:空模式,匹配每一行(2) /regular expression/:僅處理能夠模式匹配到的行,需要用/ /括起來

        [root@dashui ~]# awk ‘/^UUID/{print $1}’ /etc/fstab // 以UUID開頭的行UUID=136f7cbb-d8f6-439b-aa73-3958bd33b05fUUID=bf3d4b2f-4629-4fd7-8d70-a21302111564UUID=cbf33183-93bf-4b4f-81c0-ea6ae91cd4f6UUID=5e11b173-f7e2-4994-95b9-55cc4c41f20b

        • relational expression: 關(guān)系表達式,結(jié)果有“真”有“假”,結(jié)果為“真”才會被處理

        真:結(jié)果為非0值,非空字符串假:結(jié)果為空字符串或0值

        [root@dashui ~]# awk ‘0{print $0}’ hah //因為前面為0,所以不執(zhí)行[root@dashui ~]# awk ‘!0{print $0}’ hah //與上面相反nihao a hahai amfanin[root@dashui ~]# awk -F: ‘$3==0{print $0}’ /etc/passwd //只有當(dāng)$3=0時候,才會執(zhí)行printroot:x:0:0:root:/root:/bin/bash

        • (4) line ranges:行范圍

        startline,endline:/pat1/,/pat2/不支持直接給出數(shù)字格式

        [root@dashui ~]# awk -F: ‘/^root>/,/^daemon>/{print}’ /etc/passwd //打印以root開頭與以daemon開頭的之間的行root:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologin[root@dashui ~]#

        • (5)(5) BEGIN/END模式

        BEGIN{}: 僅在開始處理文件中的文本之前執(zhí)行一次END{}:僅在文本處理完成之后執(zhí)行一次

        [root@dashui ~]# awk ‘BEGIN{print “start”}{print $0}END{print “end”}’ hah //在開始和結(jié)束時候分別打印start和endstartnihao a hahai amfaninend[root@dashui ~]# cat hahnihao a hahai amfanin


        AWK的操作

        • 算術(shù)操作符:

        x+y, x-y, x*y, x/y, x^y, x%y-x: 轉(zhuǎn)換為負數(shù)+x: 轉(zhuǎn)換為數(shù)值

        [root@dashui ~]# awk ‘BEGIN{i=1;j=2;sum=i+j;{print sum}}’ 3

        • 字符串操作符:沒有符號的操作符,字符串連接

        賦值操作符:=, +=, -=, *=, /=, %=, ^=++, –比較操作符:, >=, <, <=, !=, ==模式匹配符:~:左邊是否和右邊匹配包含!~:是否不匹配

        [root@dashui ~]# awk -F: ‘$1~”root”{print $0}’ /etc/passwd //當(dāng)$1即usrename為root或者包含 root時候,執(zhí)行printroot:x:0:0:root:/root:/bin/bashchroot:x:1003:1003:,62984566:/home/chroot:/bin/bashrooter:x:3320:4327:,62984566:/home/rooter:/bin/bash[root@dashui ~]# awk -F: ‘$3<2{print $0}' /etc/passwd //$3即uid小于2時,執(zhí)行printroot:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologin

        • 邏輯操作符:與&&,或||,非!

        [root@dashui ~]# awk -F: ‘$3>1000 && $3<2000{print $0}' /etc/passwdxiaoshui:x:1001:1001:xiaoshui,342342342:/home/xiaoshui:/bin/bashchroot:x:1003:1003:,62984566:/home/chroot:/bin/bashcentos:x:1004:1004:,62984566:/home/centos:/bin/bash[root@dashui ~]# awk -F: '$1=="root" || $1=="xiaoshui"{print $0}' /etc/passwdroot:x:0:0:root:/root:/bin/bashxiaoshui:x:1001:1001:xiaoshui,342342342:/home/xiaoshui:/bin/bash

        • awk控制語句

        { statements;… } 組合語句 if(condition) {statements;…} if(condition) {statements;…} else {statements;…} while(conditon) {statments;…} do {statements;…} while(condition) for(expr1;expr2;expr3) {statements;…} break continue delete array[index] delete array exit

        • (1){ statements;… } 組合語句

        [root@dashui ~]# awk ‘{a=1;print a}’ hah //將多個語句組合在一起11

        • (2) if(condition) {statements;…}

        [root@dashui ~]# awk -F: ‘{if($3==0){print $0}}’ /etc/passwdroot:x:0:0:root:/root:/bin/bash**注意:條件在小括號中,條件后的語句需在{ }中**

        • (3) if(condition) {statements;…} else {statements;…}
        • if(condition1){statement1}else if(condition2){statement2}else{statement3}

        [root@dashui ~]# awk ‘{if($0==”dashui”){print “dashui”} else{print “not dashui”}}’ hahnot dashuinot dashuidashui[root@dashui ~]# cat hahnihao a hahai amfanindashui

        • (4) while(conditon) {statments;…}

        //下面是找到以空格開頭后跟linux16的行,將匹配到的行中的每個字段的長度與8比較,大于8的輸出[root@dashui ~]# awk ‘/^[[:space:]]+linux16/{i=1;while(i8){print $i,length($i)};i++}}’ /etc/grub2.cfg /vmlinuz-3.10.0-327.el7.x86_64 30root=UUID=136f7cbb-d8f6-439b-aa73-3958bd33b05f 46net.ifnames=0 13/vmlinuz-0-rescue-3f3be6c44d1047a8b32f91efd2f2c5ab 50root=UUID=136f7cbb-d8f6-439b-aa73-3958bd33b05f 46net.ifnames=0 13 做上面的實驗時,因為手抖輸出了點,將if后面的print中i前面的$符號給忘記了,結(jié)果就成了下面的情況[root@dashui ~]# awk ‘/^[[:space:]]+linux16/{i=1;while(i8){print i,length(i)};i++}}’ /etc/grub2.cfg 2 13 17 12 13 17 1

        //分析:print i,因為前面i賦值的是數(shù)字,本意是想打印

        符號丟掉時,i也只是代表數(shù)字了所以打印出來的237237表示的就是第幾個字段,而length(i)就更好理解了,因為length()就是求括號中的字符串的長度,且因為i都為個位數(shù),所以就為1嘍(注意:如果單單是length(i),i之前沒有被定義,此時打印出來的為0,以為i之前沒有被定義,所以為空)

        • (5)do-while循環(huán)

        語法:do {statement;…}while(condition)意義:無論真假,至少執(zhí)行一次循環(huán)體

        [root@dashui ~]# awk ‘BEGIN{i=0;do{i++}while(i<1){print i}}'1[root@dashui ~]# awk 'BEGIN{i=0;do{i++}while(i<=1){print i}}'2

        • (6)for循環(huán)

        語法:for(expr1;expr2;expr3) {statement;…}

        [root@dashui ~]# awk ‘/^[[:space:]]+linux16/{for(i=1;i<NF;i++){print $i}}' /etc/grub2.cfg linux16/vmlinuz-3.10.0-327.el7.x86_64root=UUID=136f7cbb-d8f6-439b-aa73-3958bd33b05frorhgbquietlinux16/vmlinuz-0-rescue-3f3be6c44d1047a8b32f91efd2f2c5abroot=UUID=136f7cbb-d8f6-439b-aa73-3958bd33b05frorhgbquiet特殊用法:能夠遍歷數(shù)組中的元素;語法:for(varin array) {for-body}[root@dashui ~]# awk -F: '{bash[$7]++}END{for (i in bash){print i,bash[i]}}' /etc/passwd/etc/nologin 2/bin/sync 1/bin/bash 47/shell/csh 1/sbin/nologin 34/sbin/halt 1/bin/csh 2/sbin/shutdown 1[root@dashui ~]#

        • (7)switch語句

        語法:switch(expression) {case VALUE1 or /REGEXP/: statement; case VALUE2 or /REGEXP2/: statement; …; default: statement}

        • (8)break和continue

        break表示跳出循環(huán),而continue表示跳過本輪循環(huán)

        [root@dashui ~]# awk ‘BEGIN{sum=0;for(i=1;i<10;i++){if(i==5){break}print i}}'1234[root@dashui ~]# awk 'BEGIN{sum=0;for(i=1;i<10;i++){if(i==5){continue}print i}}'12346789

        • (9)next

        提前結(jié)束對本行處理而直接進入下一行處理(awk自身循環(huán))

        #$3%2!=0即uid為奇數(shù),跳過此行,即只打印uid為偶束的行[root@dashui ~]# awk -F: ‘{if($3%2!=0) next; print $1,$3}’ /etc/passwdroot 0daemon 2lp 4shutdown 6mail 8games 12

        awk數(shù)組

        關(guān)聯(lián)數(shù)組:array[index-expression]

        index-expression:

        (1) 可使用任意字符串;字符串要使用雙引號括起來(2) 如果某數(shù)組元素事先不存在,在引用時,awk會自動創(chuàng)建此元素,并將其值初始化為“空串”若要判斷數(shù)組中是否存在某元素,要使用“index in array”格式進行遍歷

        注意:如果數(shù)組的鍵值為字符串時,最后以雙引號給引起來

        [root@dashui ~]# awk ‘BEGIN{weekdays[“mon”]=”Monday”;weekdays[“tue”]=”Tuesday”;print weekdays[“mon”]}’Monday若要遍歷數(shù)組中的每個元素,要使用for循環(huán)[root@dashui ~]# netstat -tan|awk ‘/^tcp>/{state[$NF]++}END{for(i in state){print i,state[i]}}’LISTEN 3ESTABLISHED 1

        awk函數(shù)

        • 數(shù)值處理:

        rand():返回0和1之間一個隨機數(shù)

        注意:需配合srand()函數(shù)使用,不然不是隨機數(shù)

        [root@dashui ~]# awk ‘BEGIN{srand(); for (i=1;i<=10;i++)print int(rand()*100)}'54452324147256923131

        • 字符串處理:

        length([s]):返回指定字符串的長度

        sub(r,s,[t]):對t字符串進行搜索r表示的模式匹配的內(nèi)容,并將第一個匹配的內(nèi)容替換為s

        gsub(r,s,[t]):對t字符串進行搜索r表示的模式匹配的內(nèi)容,并全部替換為s所表示的內(nèi)容

        [root@dashui ~]# echo “2008:08:08 08:08:08″|awk ‘sub(“:”,”-“,$0)’2008-08:08 08:08:08[root@dashui ~]# echo “2008:08:08 08:08:08″|awk ‘gsub(“:”,”-“,$0)’2008-08-08 08-08-08[root@dashui ~]#

        split(s,array,[r]):以r為分隔符,切割字符s,并將切割后的結(jié)果保存至array所表示的數(shù)組中,第一個索引值為1,第二個索引值為2,…

        這里使用split函數(shù)將第五個字段中的ip和端口號分開,只取出了ip。

        [root@dashui ~]# netstat -tan | awk ‘/^tcp>/{split($5,ip,”:”);count[ip[1]]++}END{for (i in count) {print i,count[i]}}’10.1.0.82 10.0.0.0 3[root@dashui ~]# netstat -tan Active Internet connections (servers and established)Proto Recv-Q Send-Q Local Address Foreign Address State tcp 0 0 0.0.0.0:22 0.0.0.0:* LISTEN tcp 0 0 127.0.0.1:631 0.0.0.0:* LISTEN tcp 0 0 127.0.0.1:25 0.0.0.0:* LISTEN tcp 0 52 10.1.0.26:22 10.1.0.82:54143 ESTABLISHEDtcp6 0 0 :::22 :::* LISTEN tcp6 0 0 ::1:631 :::* LISTEN tcp6 0 0 ::1:25 :::* LISTEN [root@dashui ~]#

        • 自定義函數(shù)

        格式:function name ( parameter, parameter, … ) {statementsreturn expression}

        這里自定義了一個函數(shù),求出兩個變量的最大值。

        [root@dashui ~]# awk -f awk.fun 3[root@dashui ~]# cat awk.fun function max(v1,v2) {v1>v2?var=v1:var=v2return var}BEGIN{a=3;b=2;print max(a,b)}**注意:和之前的shell中的函數(shù)有些不同,這里如果需要像awk函數(shù)中傳遞變量,則需要在括號中定義形參。**

        awk中調(diào)用shell命令

        • system命令

        [root@dashui ~]# awk BEGIN'{system(“hostname”)}’dashui.localdomain

        空格是awk中的字符串連接符,如果system中需要使用awk中的變量可以使用空格分隔,或者說除了awk的變量外其他一律用””引用起來。

        [root@dashui ~]# awk ‘BEGIN{name=”xiaoshui”;system(“echo your name is ” name)}’your name is xiaoshui

        awk腳本

        將awk程序?qū)懗赡_本,直接調(diào)用或執(zhí)行

        將action寫入到腳本中,然后調(diào)用執(zhí)行[root@dashui ~]# awk -F: -f f1.awk /etc/passwdroot 0bin 1daemon 2adm 3hu [root@dashui ~]# cat f1.awk {if($3<4)print $1,$3}# 腳本文件中的/bin/awk -f表示是用awk -f來執(zhí)行下面語句[root@dashui ~]# ./f1.awk -F: /etc/passwdroot 0bin 1daemon 2adm 3hu [root@dashui ~]# cat f1.awk #!/bin/awk -f#this is a awk script{if($3<4)print $1,$3}

        • 向awk腳本傳遞參數(shù)

        格式:awkfile var=value var2=value2… Inputfile

        # min和max分別對應(yīng)腳本文件中的min和max[root@dashui ~]# ./f1.awk -F: min=100 max=200 /etc/passwdavahi-autoipd 170abrt 173rtkit 172usbmuxd 113pulse 171[root@dashui ~]# cat f1.awk #!/bin/awk -f{if($3>=min && $3<=max)print $1,$3}

        強化練習(xí)

        • 1.打印一個表頭,并且打印用戶名和ID

        [root@dashui ~]# awk -F: ‘BEGIN{printf “Username UID”}{printf “%-20s %d”,$1,$3}’ /etc/passwdUsername UIDroot 0bin 1daemon 2adm 3lp 4sync 5shutdown 6halt 7mail 8operator 11games 12

        • 2.打印一個表頭和表尾,并打印用戶名,ID,及shell

        [root@dashui ~]# awk -F: ‘BEGIN{printf “Username UID Shell”}{printf “%-20s %d %10s”,$1,$3,$5}END{print “Finished…”}’ /etc/passwdUsername UID Shellroot 0 rootbin 1 bindaemon 2 daemonadm 3 admlp 4 lpsync 5 syncshutdown 6 shutdown…省略…haha 4376 xixi 4377 hehe 4378 Finished…[root@dashui ~]#

        • 3.對文本中的字段進行字符個數(shù)統(tǒng)計

        [root@dashui ~]# awk ‘{print $0,length($0)}’ hahnihao a haha 12i amfanin 9dashui 6

        • 4.打印字符個數(shù)大于等于8的字段

        #其實就是比題3多了一條if判斷語句[root@dashui ~]# awk ‘{if(length($0)>8){print $0,length($0)}}’ hahnihao a haha 12i amfanin 9

        • 5.統(tǒng)計系統(tǒng)中shell的類型,并打印shell引用的次數(shù)

        #中間運用了數(shù)組和for循環(huán)[root@dashui ~]# awk -F: ‘{count[$7]++}END{for (i in count){print i,count[i]}}’ /etc/passwd/etc/nologin 2/bin/sync 1/bin/bash 47/shell/csh 1/sbin/nologin 34/sbin/halt 1/bin/csh 2/sbin/shutdown 1

        • 6.統(tǒng)計fstab文件中,各文件系統(tǒng)被引用的次數(shù)

        #比上題多了一步地址定界[root@dashui ~]# awk ‘/^[^#]/{count[$3]++}END{for (i in count){print i,count[i]}}’ /etc/fstab swap 1xfs 3

        • 7.統(tǒng)計系統(tǒng)中各TCP連接狀態(tài)的數(shù)量

        [root@dashui ~]# netstat -tan|awk ‘/^tcp>/{state[$6]++}END{for (i in state){print i,state[i]}}’LISTEN 3ESTABLISHED 1

        • 8.將文本的重復(fù)行去掉

        #第一次讀取aaa,arr[aaa]因為沒有定義,所以為空,又取非,所以為真,arr[aaa]++是先賦值后加加,所以第一次打印出來#第二次,在遇見aaa時候,因為之前有值了arr[aaa]=1,所以取反為0,不執(zhí)行后的print操作,但是++依然正常運行[root@dashui ~]# awk ‘!arr[$0]++’ hahaaabbbcccdddfff[root@dashui ~]# cat hah aaabbbcccaaadddaaaaaafffccc[root@dashui ~]#

        謝謝瀏覽,以后會不定時更新…

        鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。
        上一篇 2022年6月21日 09:16
        下一篇 2022年6月21日 09:16

        相關(guān)推薦

        聯(lián)系我們

        聯(lián)系郵箱:admin#wlmqw.com
        工作時間:周一至周五,10:30-18:30,節(jié)假日休息