Linux實(shí)用運(yùn)維腳本分享
#查看僵尸進(jìn)程ps -al | gawk ‘{print $2,$4}’ | grep Z# 匹配電子郵件的地址cat index.html | egrep -o “[A-Za-z0-9._]+@[A-Za-z0-9.]+.[a-zA-Z]{2,4}” > ans.txt#匹配http URLcat index.html | egrep -o “http://[A-Za-z0-9.]+.[a-zA-Z]{2,3}” > ans.txt #純文本形式下載網(wǎng)頁lynx -dump www.rumenz.com > plain.txt#只打印HTTP頭部信息,無須遠(yuǎn)程下載文件curl –head www.rumenz.com#使用POST提交數(shù)據(jù)curl -d “param2=nickwolfe?m2=12345” http://www.rumenz.com/login.cgi#顯示分組途經(jīng)的網(wǎng)關(guān)traceroute www.rumenz.com#列出系統(tǒng)中的開放端口以及運(yùn)行在端口上的服務(wù)lsof -i #nc命令建立socket連接#設(shè)置監(jiān)聽 nc -l 5555#連接到套接字 nc 192.0.0.1 5555#快速文件傳輸#接收端 nc -l 5555 > destination_filename#發(fā)送端 nc 192.0.0.1 5555 < source_filename#找出指定目錄最大的n個(gè)文件du -ak target_dir | sort -nrk 1 | head -n 4# du中a為遞歸,k為kb;sort中n為數(shù)字,r為降序,k指定列#向終端中的所有登陸用戶發(fā)送廣播信息cat message.txt | wall#創(chuàng)建新的screen窗口screen#打印所有的.txt和.pdf文件find . ( -name "*.txt" -o -name "*.pdf" ) -print# -exec command {} ;是連用的,所有符合的都會(huì)放置在{}中,去執(zhí)行command #將文件分割成多個(gè)大小為10kb的文件split -b 10k data.file #打印兩個(gè)文件的交集comm A.txt B.txt -3 | sed 's/^//'#sed移除空白行sed '/^$/d' file
mysql備份
#!/bin/bashset -eUSER=”backup”PASSWORD=”backup”# 數(shù)據(jù)庫數(shù)據(jù)目錄 #DATA_DIR=”/data/mysql”BIN_INDEX=$DATA_DIR”/mysql-bin.index”# 備份目錄 #BACKUP_DIR=”/data/backup/mysql”BACKUP_LOG=”/var/log/mysql/backup.log”DATE=`date +”%Y%m%d”`TIME=`date +”%Y%m%d%H”`LOG_TIME=`date +”%Y-%m-%d %H:%M:%S”`DELETE_BINLOG_TIME=”7 day”INCREMENT_INTERVAL=”3 hour”note() { printf “[$LOG_TIME] note: $*” >> $BACKUP_LOG;}warning() { printf “[$LOG_TIME] warning: $*” >> $BACKUP_LOG;}error() { printf “[$LOG_TIME] error: $*” >> $BACKUP_LOG; exit 1;}full_backup() { local dbs=`ls -l $DATA_DIR | grep “^d” | awk -F ” ” ‘{print $9}’` for db in $dbs do local backup_dir=$BACKUP_DIR”/full/”$db local filename=$db”.”$DATE local backup_file=$backup_dir”/”$filename”.sql” if [ ! -d $backup_dir ] then mkdir -p $backup_dir || { error “創(chuàng)建數(shù)據(jù)庫 $db 全量備份目錄 $backup_dir 失敗”; continue; } note “數(shù)據(jù)庫 $db 全量備份目錄 $backup_dir 不存在,創(chuàng)建完成”; fi note “full backup $db start …” mysqldump –user=${USER} –password=${PASSWORD} –flush-logs –skip-lock-tables –quick $db > $backup_file || { warning “數(shù)據(jù)庫 $db 備份失敗”; continue; } cd $backup_dir tar -cPzf $filename”.tar.gz” $filename”.sql” rm -f $backup_file chown -fR mysql:mysql $backup_dir note “數(shù)據(jù)庫 $db 備份成功”; note “full backup $db end.” done}increment_backup() { local StartTime=`date “-d $INCREMENT_INTERVAL ago” +”%Y-%m-%d %H:%M:%S”` local DELETE_BINLOG_END_TIME=`date “-d $DELETE_BINLOG_TIME ago” +”%Y-%m-%d %H:%M:%S”` local dbs=`ls -l $DATA_DIR | grep “^d” | awk -F ” ” ‘{print $9}’` mysql -u$USER -p$PASSWORD -e “purge master logs before ‘$DELETE_BINLOG_END_TIME'” && note “delete $DELETE_BINLOG_TIME days before log”; filename=`cat $BIN_INDEX | awk -F “/” ‘{print $2}’` for i in $filename do for db in $dbs do local backup_dir=$BACKUP_DIR”/increment/”$db local filename=$db”.”$TIME local backup_file=$backup_dir”/”$filename”.sql” if [ ! -d $backup_dir ] then mkdir -p $backup_dir || { error “創(chuàng)建數(shù)據(jù)庫 $db 增量備份目錄 $backup_dir 失敗”; continue; } note “數(shù)據(jù)庫 $db 增量備份目錄 $backup_dir 不存在,創(chuàng)建完成”; fi note “increment backup $db form time $StartTime start …” mysqlbinlog -d $db –start-datetime=”$StartTime” $DATA_DIR/$i >> $backup_file || { warning “數(shù)據(jù)庫 $db 備份失敗”; continue; } note “increment backup $db end.” done done for db in $dbs do local backup_dir=$BACKUP_DIR”/increment/”$db local filename=$db”.”$TIME local backup_file=$backup_dir”/”$filename”.sql” cd $backup_dir tar -cPzf $filename”.tar.gz” $filename”.sql” rm -f $backup_file note “數(shù)據(jù)庫 $db 備份成功”; done}case “$1” in full) full_backup ;; increment) increment_backup ;; *) exit 2 ;;esacexit 1
目錄備份
#!/bin/bash### 時(shí)間DATE=$(date ‘+%Y-%m-%d_%H_%M_%S’)# 備份目錄 BACKUPDIR=”/home/backups”# 需要備份的目錄SORFILE=/opt# 目標(biāo)文件名DESFILE=/home/backups/$SORFILE.$(date ‘+%Y-%m-%d_%H_%M_%S’).zip[ ! -d $BACKUPDIR ] && mkdir -p $BACKUPDIRcd $BACKUPDIRecho “start backup $SORFILE …”sleep 3#echo “$DESFILE”#tar cvf $DESFILE $SORFILE#gzip -f .zip $DESFILEzip -r $DESFILE $SORFILE &>/dev/nullif [ “$?” == “0” ]then echo $(date +%Y-%m-%d)” zip sucess”>>backup.logelse echo $(date +%Y-%m-%d)” zip failed”>>backup.log exit 0fi# 刪除3天前的備份find $BACKUPDIR -type f -ctime +3 | xargs rm -rf
PING查詢
#!/bin/bash#用途:根據(jù)網(wǎng)絡(luò)配置對(duì)網(wǎng)絡(luò)地址192.168.0進(jìn)行修改,檢查是否是活動(dòng)狀態(tài)#{start..end}shell擴(kuò)展生成一組地址for ip in 192.168.0.{1..255}do ( ping $ip -c 2 &> /dev/null # > 標(biāo)準(zhǔn)輸出重定向,和1>一致 # 2>&1 將標(biāo)準(zhǔn)錯(cuò)誤輸出 重定向 到標(biāo)準(zhǔn)輸出 # &>file 將標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯(cuò)誤輸出都重定向到文件filename中 if [ $? -eq 0 ];then echo $ip is alive fi )&donewait#并行ping,加速
磁盤IO檢查
##iostat是查看磁盤活動(dòng)統(tǒng)計(jì)情況##顯示所有設(shè)備負(fù)載情況 r/s: 每秒完成的讀 I/O 設(shè)備次數(shù)。即 rio/s;w/s: 每秒完成的寫 I/O 設(shè)備次數(shù)。即 wio/s等iostat ##每隔2秒刷新磁盤IO信息,并且每次顯示3次iostat 2 3#顯示某個(gè)磁盤的IO信息iostat -d sda1##顯示tty和cpu信息iostat -t##以M為單位顯示磁盤IO信息iostat -m##查看TPS和吞吐量信息 kB_read/s:每秒從設(shè)備(drive expressed)讀取的數(shù)據(jù)量;kB_wrtn/s:每秒向設(shè)備(drive expressed)寫入的數(shù)據(jù)量;kB_read:讀取的總數(shù)據(jù)量;kB_wrtn:寫入的總數(shù)量數(shù)據(jù)量;iostat -d -k 1 1#查看設(shè)備使用率(%util)、響應(yīng)時(shí)間(await)iostat -d -x -k 1 1#查看CPU狀態(tài)iostat -c 1 3#統(tǒng)計(jì)進(jìn)程(pid)的stat,進(jìn)程的stat自然包括進(jìn)程的IO狀況pidstat#只顯示IOpidstat -d 1 #-d IO 信息,-r 缺頁及內(nèi)存信息-u CPU使用率-t 以線程為統(tǒng)計(jì)單位1 1秒統(tǒng)計(jì)一次pidstat -u -r -d -t 1#文件級(jí)IO分析,查看當(dāng)前文件由哪些進(jìn)程打開lsof ls /proc/pid/fd#利用 sar 報(bào)告磁盤 I/O 信息DEV 正在監(jiān)視的塊設(shè)備 tps 每秒鐘物理設(shè)備的 I/O 傳輸總量 rd_sec/s 每秒從設(shè)備讀取的扇區(qū)數(shù)量 wr_sec/s 每秒向設(shè)備寫入的扇區(qū)數(shù)量 avgrq-sz I/O 請(qǐng)求的平均扇區(qū)數(shù)#avgqu-sz I/O 請(qǐng)求的平均隊(duì)列長度 await I/O 請(qǐng)求的平均等待時(shí)間,單位為毫秒 svctm I/O 請(qǐng)求的平均服務(wù)時(shí)間,單位為毫秒 %util I/O 請(qǐng)求所占用的時(shí)間的百分比,即設(shè)備利用率sar -pd 10 3 #iotop top的io版iotop#查看頁面緩存信息 其中的Cached 指用于pagecache的內(nèi)存大?。╠iskcache-SwapCache)。隨著寫入緩存頁,Dirty 的值會(huì)增加 一旦開始把緩存頁寫入硬盤,Writeback的值會(huì)增加直到寫入結(jié)束。cat /proc/meminfo #查看有多少個(gè)pdflush進(jìn)程 Linux 用pdflush進(jìn)程把數(shù)據(jù)從緩存頁寫入硬盤#pdflush的行為受/proc/sys/vm中的參數(shù)的控制/proc/sys/vm/dirty_writeback_centisecs (default 500): 1/100秒, 多長時(shí)間喚醒pdflush將緩存頁數(shù)據(jù)寫入硬盤。默認(rèn)5秒喚醒2個(gè)(更多個(gè))線程。如果wrteback的時(shí)間長于dirty_writeback_centisecs的時(shí)間,可能會(huì)出問題cat /proc/sys/vm/nr_pdflush_threads#查看I/O 調(diào)度器#調(diào)度算法#noop anticipatory deadline [cfq] #deadline : deadline 算法保證對(duì)既定的IO請(qǐng)求以最小的延遲時(shí)間。#anticipatory:有個(gè)IO發(fā)生后,如果又有進(jìn)程請(qǐng)求IO,則產(chǎn)生一個(gè)默認(rèn)6ms猜測時(shí)間,猜測下一個(gè)進(jìn)程請(qǐng)求IO是干什么。這對(duì)于隨機(jī)讀取會(huì)造成較大的延時(shí)。對(duì)數(shù)據(jù)庫應(yīng)用很糟糕,而對(duì)于Web Server等則會(huì)表現(xiàn)不錯(cuò)。#cfq: 對(duì)每個(gè)進(jìn)程維護(hù)一個(gè)IO隊(duì)列,各個(gè)進(jìn)程發(fā)來的IO請(qǐng)求會(huì)被cfq以輪循方式處理,對(duì)每一個(gè)IO請(qǐng)求都是公平。適合離散讀的應(yīng)用。#noop: 對(duì)所有IO請(qǐng)求都用FIFO隊(duì)列形式處理。默認(rèn)IO不會(huì)存在性能問題。cat /sys/block/[disk]/queue/scheduler#改變IO調(diào)度器$ echo deadline > /sys/block/sdX/queue/scheduler#提高調(diào)度器請(qǐng)求隊(duì)列的$ echo 4096 > /sys/block/sdX/queue/nr_requests
性能相關(guān)
#查看當(dāng)前系統(tǒng)loaduptime#查看系統(tǒng)狀態(tài)和每個(gè)進(jìn)程的系統(tǒng)資源使用狀況top#可視化顯示CPU的使用狀況htop#查看每個(gè)CPU的負(fù)載信息mpstat -P ALL 1#每隔1秒查看磁盤IO的統(tǒng)計(jì)信息iostat -xkdz 1#每隔一秒查看虛擬內(nèi)存的使用信息vmstat 1#查看內(nèi)存使用統(tǒng)計(jì)信息free#查看網(wǎng)絡(luò)使用信息nicstat -z 1#類似vmstat的顯示優(yōu)化的工具dstat 1#查看系統(tǒng)活動(dòng)狀態(tài),比如系統(tǒng)分頁統(tǒng)計(jì),塊設(shè)備IO統(tǒng)計(jì)等sar#網(wǎng)絡(luò)連接狀態(tài)查看netstat -s#進(jìn)程資源使用信息查看pidstat 1pidstat -d 1#查看某個(gè)進(jìn)程的系統(tǒng)調(diào)用信息 -p后面是進(jìn)程id,-tttT 進(jìn)程系統(tǒng)后的系統(tǒng)調(diào)用時(shí)間strace -tttT -p 12670#統(tǒng)計(jì)IO設(shè)備輸入輸出的系統(tǒng)調(diào)用信息strace -c dd if=/dev/zero of=/dev/null bs=512 count=1024k#tcpdump 查看網(wǎng)絡(luò)數(shù)據(jù)包tcpdump -nr /tmp/out.tcpdump#塊設(shè)備的讀寫事件信息統(tǒng)計(jì)btrace /dev/sdb #iotop查看某個(gè)進(jìn)程的IO操作統(tǒng)計(jì)信息iotop -bod5#slabtop 查看內(nèi)核 slab內(nèi)存分配器的使用信息slabtop -sc#系統(tǒng)參數(shù)設(shè)置sysctl -a#系統(tǒng)性能指標(biāo)統(tǒng)計(jì)信息perf stat gzip file1#系統(tǒng)cpu活動(dòng)狀態(tài)查看perf record -a -g -F 997 sleep 10
進(jìn)程相關(guān)
## processes 進(jìn)程管理##ps查看當(dāng)前系統(tǒng)執(zhí)行的線程列表,進(jìn)行瞬間狀態(tài),不是連續(xù)狀態(tài),連續(xù)狀態(tài)需要使用top名稱查看 更多常用參數(shù)請(qǐng)使用 man ps查看ps##顯示所有進(jìn)程詳細(xì)信息ps aux##-u 顯示某個(gè)用戶的進(jìn)程列表ps -f -u www-data ## -C 通過名字或者命令搜索進(jìn)程ps -C apache2## –sort 根據(jù)進(jìn)程cpu使用率降序排列,查看前5個(gè)進(jìn)程 -pcpu表示降序 pcpu升序ps aux –sort=-pcpu | head -5 ##-f 用樹結(jié)構(gòu)顯示進(jìn)程的層次關(guān)系,父子進(jìn)程情況下ps -f –forest -C apache2 ##顯示一個(gè)父進(jìn)程的所有子進(jìn)程ps -o pid,uname,comm -C apache2ps –ppid 2359 ##顯示一個(gè)進(jìn)程的所有線程 -L 參數(shù)ps -p 3150 -L ##顯示進(jìn)程的執(zhí)行時(shí)間 -o參數(shù)ps -e -o pid,comm,etime ##watch命令可以用來實(shí)時(shí)捕捉ps顯示進(jìn)程watch -n 1 ‘ps -e -o pid,uname,cmd,pmem,pcpu –sort=-pmem,-pcpu | head -15’ ##jobs 查看后臺(tái)運(yùn)行的進(jìn)程 jobs命令執(zhí)行的結(jié)果, 表示是一個(gè)當(dāng)前的作業(yè),減號(hào)表是是一個(gè)當(dāng)前作業(yè)之后的一個(gè)作業(yè),jobs -l選項(xiàng)可顯示所有任務(wù)的PID,jobs的狀態(tài)可以是running, stopped, Terminated,但是如果任務(wù)被終止了(kill),shell 從當(dāng)前的shell環(huán)境已知的列表中刪除任務(wù)的進(jìn)程標(biāo)識(shí);也就是說,jobs命令顯示的是當(dāng)前shell環(huán)境中所起的后臺(tái)正在運(yùn)行或者被掛起的任務(wù)信息jobs##查看后臺(tái)運(yùn)營的進(jìn)程號(hào)jobs -p##查看現(xiàn)在被終止或者退出的進(jìn)程號(hào)jobs -n##kill命令 終止一個(gè)前臺(tái)進(jìn)程可以使用Ctrl+C鍵 kill 通過top或者ps獲取進(jìn)程id號(hào) kill [-s 信號(hào) | -p ] [ -a ] 進(jìn)程號(hào) …##發(fā)送指定的信號(hào)到相應(yīng)進(jìn)程。不指定型號(hào)將發(fā)送SIGTERM(15)終止指定進(jìn)程。關(guān)閉進(jìn)程號(hào)12的進(jìn)程kill 12##等同于在前臺(tái)運(yùn)行PID為123的進(jìn)程時(shí)按下Ctrl+C鍵kill -2 123##如果任無法終止該程序可用“-KILL” 參數(shù),其發(fā)送的信號(hào)為SIGKILL(9) ,將強(qiáng)制結(jié)束進(jìn)程 kill -9 123##列出所有信號(hào)名稱##HUP 1 終端斷線##INT 2 中斷(同 Ctrl + C)##QUIT 3 退出(同 Ctrl + )##TERM 15 終止##KILL 9 強(qiáng)制終止##CONT 18 繼續(xù)(與STOP相反, fg/bg命令)##STOP 19 暫停(同 Ctrl + Z)kill -l##得到指定信號(hào)的數(shù)值kill -l KILL##殺死指定用戶所有進(jìn)程kill -u peidalinuxkill -9 $(ps -ef | grep peidalinux) ##將后臺(tái)中的命令調(diào)至前臺(tái)繼續(xù)運(yùn)行 將進(jìn)程123調(diào)至前臺(tái)執(zhí)行fg 123##將一個(gè)在后臺(tái)暫停的命令,變成繼續(xù)執(zhí)行bg 123##該命令可以在你退出帳戶/關(guān)閉終端之后繼續(xù)運(yùn)行相應(yīng)的進(jìn)程。nohup就是不掛起的意思 下面輸出被重定向到myout.file文件中nohup command > myout.file 2>&1 &##at:計(jì)劃任務(wù),在特定的時(shí)間執(zhí)行某項(xiàng)工作,在特定的時(shí)間執(zhí)行一次。## 格式:at HH:MM YYYY-MM-DD //HH(小時(shí)):MM(分鐘) YYYY(年)-MM(月份)-DD(日)##HH[am pm]+D(天) days //HH(小時(shí))[am(上午)pm(下午)]+days(天)at 12:00(時(shí)間) //at命令設(shè)定12:00執(zhí)行一項(xiàng)操作#at>useradd aaa //在at命令里設(shè)定添加用戶aaa#ctrl+d //退出at命令#tail -f /etc/passwd //查看/etc/passwd文件后十行是否增加了一個(gè)用戶aaa##計(jì)劃任務(wù)設(shè)定后,在沒有執(zhí)行之前我們可以用atq命令來查看系統(tǒng)沒有執(zhí)行工作任務(wù)。atq##啟動(dòng)計(jì)劃任務(wù)后,如果不想啟動(dòng)設(shè)定好的計(jì)劃任務(wù)可以使用atrm命令刪除。atrm 1 //刪除計(jì)劃任務(wù)1##pstree命令:列出當(dāng)前的進(jìn)程,以及它們的樹狀結(jié)構(gòu) 格式:pstree [選項(xiàng)] [pid|user]pstree##nice命令:改變程序執(zhí)行的優(yōu)先權(quán)等級(jí) 應(yīng)用程序優(yōu)先權(quán)值的范圍從-20 19,數(shù)字越小,優(yōu)先權(quán)就越高。一般情況下,普通應(yīng)用程序的優(yōu)先權(quán)值(CPU使用權(quán)值)都是0,如果讓常用程序擁有較高的優(yōu)先權(quán)等級(jí),自然啟動(dòng)和運(yùn)行速度都會(huì)快些。需要注意的是普通用戶只能在0 19之間調(diào)整應(yīng)用程序的優(yōu)先權(quán)值,只有超級(jí)用戶有權(quán)調(diào)整更高的優(yōu)先權(quán)值(從-20 19)。nice [-n ][–help][–version][命令]nice -n 5 ls##sleep命令:使進(jìn)程暫停執(zhí)行一段時(shí)間date;sleep 1m;date##renice命令 renice命令允許用戶修改一個(gè)正在運(yùn)行進(jìn)程的優(yōu)先權(quán)。利用renice命令可以在命令執(zhí)行時(shí)調(diào)整其優(yōu)先權(quán)。##其中,參數(shù)number與nice命令的number意義相同。(1) 用戶只能對(duì)自己所有的進(jìn)程使用renice命令。(2) root用戶可以在任何進(jìn)程上使用renice命令。(3) 只有root用戶才能提高進(jìn)程的優(yōu)先權(quán)renice -5 -p 5200 #PID為5200的進(jìn)程nice設(shè)為-5 ##pmap命令用于顯示一個(gè)或多個(gè)進(jìn)程的內(nèi)存狀態(tài)。其報(bào)告進(jìn)程的地址空間和內(nèi)存狀態(tài)信息 #pmap PID pmap 20367
javadump.sh
#!/bin/shDUMP_PIDS=`ps –no-heading -C java -f –width 1000 |awk ‘{print $2}’`if [ -z “$DUMP_PIDS” ]; then echo “The server $HOST_NAME is not started!” exit 1;fiDUMP_ROOT=~/dumpif [ ! -d $DUMP_ROOT ]; then mkdir $DUMP_ROOTfiDUMP_DATE=`date +%Y%m%d%H%M%S`DUMP_DIR=$DUMP_ROOT/dump-$DUMP_DATEif [ ! -d $DUMP_DIR ]; then mkdir $DUMP_DIRfifor PID in $DUMP_PIDS ; do#Full thread dump 用來查線程占用,死鎖等問題 $JAVA_HOME/bin/jstack $PID > $DUMP_DIR/jstack-$PID.dump 2>&1 echo -e “.c”#打印出一個(gè)給定的Java進(jìn)程、Java core文件或遠(yuǎn)程Debug服務(wù)器的Java配置信息,具體包括Java系統(tǒng)屬性和JVM命令行參數(shù)。 $JAVA_HOME/bin/jinfo $PID > $DUMP_DIR/jinfo-$PID.dump 2>&1 echo -e “.c”#jstat能夠動(dòng)態(tài)打印jvm(Java Virtual Machine Statistics Monitoring Tool)的相關(guān)統(tǒng)計(jì)信息。如young gc執(zhí)行的次數(shù)、full gc執(zhí)行的次數(shù),各個(gè)內(nèi)存分區(qū)的空間大小和可使用量等信息。 $JAVA_HOME/bin/jstat -gcutil $PID > $DUMP_DIR/jstat-gcutil-$PID.dump 2>&1 echo -e “.c” $JAVA_HOME/bin/jstat -gccapacity $PID > $DUMP_DIR/jstat-gccapacity-$PID.dump 2>&1 echo -e “.c”#未指定選項(xiàng)時(shí),jmap打印共享對(duì)象的映射。對(duì)每個(gè)目標(biāo)VM加載的共享對(duì)象,其起始地址、映射大小及共享對(duì)象文件的完整路徑將被打印出來, $JAVA_HOME/bin/jmap $PID > $DUMP_DIR/jmap-$PID.dump 2>&1 echo -e “.c”#-heap打印堆情況的概要信息,包括堆配置,各堆空間的容量、已使用和空閑情況 $JAVA_HOME/bin/jmap -heap $PID > $DUMP_DIR/jmap-heap-$PID.dump 2>&1 echo -e “.c”#-dump將jvm的堆中內(nèi)存信息輸出到一個(gè)文件中,然后可以通過eclipse memory analyzer進(jìn)行分析#注意:這個(gè)jmap使用的時(shí)候jvm是處在假死狀態(tài)的,只能在服務(wù)癱瘓的時(shí)候?yàn)榱私鉀Q問題來使用,否則會(huì)造成服務(wù)中斷。 $JAVA_HOME/bin/jmap -dump:format=b,file=$DUMP_DIR/jmap-dump-$PID.dump $PID 2>&1 echo -e “.c”#顯示被進(jìn)程打開的文件信息if [ -r /usr/sbin/lsof ]; then /usr/sbin/lsof -p $PID > $DUMP_DIR/lsof-$PID.dump echo -e “.c” fidone#主要負(fù)責(zé)收集、匯報(bào)與存儲(chǔ)系統(tǒng)運(yùn)行信息的。if [ -r /usr/bin/sar ]; then /usr/bin/sar > $DUMP_DIR/sar.dumpecho -e “.c”fi#主要負(fù)責(zé)收集、匯報(bào)與存儲(chǔ)系統(tǒng)運(yùn)行信息的。if [ -r /usr/bin/uptime ]; then /usr/bin/uptime > $DUMP_DIR/uptime.dumpecho -e “.c”fi#內(nèi)存查看if [ -r /usr/bin/free ]; then /usr/bin/free -t > $DUMP_DIR/free.dumpecho -e “.c”fi#可以得到關(guān)于進(jìn)程、內(nèi)存、內(nèi)存分頁、堵塞IO、traps及CPU活動(dòng)的信息。if [ -r /usr/bin/vmstat ]; then /usr/bin/vmstat > $DUMP_DIR/vmstat.dumpecho -e “.c”fi#報(bào)告與CPU相關(guān)的一些統(tǒng)計(jì)信息if [ -r /usr/bin/mpstat ]; then /usr/bin/mpstat > $DUMP_DIR/mpstat.dumpecho -e “.c”fi#報(bào)告與IO相關(guān)的一些統(tǒng)計(jì)信息if [ -r /usr/bin/iostat ]; then /usr/bin/iostat > $DUMP_DIR/iostat.dumpecho -e “.c”fi#報(bào)告與網(wǎng)絡(luò)相關(guān)的一些統(tǒng)計(jì)信息if [ -r /bin/netstat ]; then /bin/netstat > $DUMP_DIR/netstat.dumpecho -e “.c”fiecho “OK!”
常用工具安裝
#!/usr/bin/env bash# ———————————————————————————# 控制臺(tái)顏色BLACK=”33[1;30m”RED=”33[1;31m”GREEN=”33[1;32m”YELLOW=”33[1;33m”BLUE=”33[1;34m”PURPLE=”33[1;35m”CYAN=”33[1;36m”RESET=”$(tput sgr0)”# ———————————————————————————printf “${BLUE}”cat >>>>>>> 安裝常用命令工具開始${RESET}”# 核心工具printf “${CYAN}>>>> install coreutils(df、du)${RESET}”yum install -y coreutilsprintf “${CYAN}>>>> install chkconfig${RESET}”yum install -y chkconfig# 網(wǎng)絡(luò)工具printf “${CYAN}>>>> install net-tools(ifconfig、netstat、route)${RESET}”yum install -y net-toolsprintf “${CYAN}>>>> install iptables${RESET}”yum install -y iptables# IP工具printf “${CYAN}>>>> install iputils(ping、tracepath)${RESET}”yum install -y iputilsprintf “${CYAN}>>>> install traceroute${RESET}”yum install -y tracerouteprintf “${CYAN}>>>> install iproute(ip、ss)${RESET}”yum install -y iproute# 端口工具printf “${CYAN}>>>> install lsof${RESET}”yum install -y lsofprintf “${CYAN}>>>> install nc${RESET}”yum install -y ncprintf “${CYAN}>>>> install netstat${RESET}”yum install -y netstat# DNS工具printf “${CYAN}>>>> install bind-utils(dig、host、nslookup)${RESET}”yum install -y bind-utilsprintf “${CYAN}>>>> install whois${RESET}”yum install -y whois# 下載工具printf “${CYAN}>>>> install curl${RESET}”yum install -y curlprintf “${CYAN}>>>> install wget${RESET}”yum install -y wget# 編輯工具printf “${CYAN}>>>> install emacs${RESET}”yum install -y emacsprintf “${CYAN}>>>> install vim${RESET}”yum install -y vim# 流量工具printf “${CYAN}>>>> install iftop${RESET}”yum install -y iftopprintf “${CYAN}>>>> install nethogs${RESET}”yum install -y nethogs# 抓包工具printf “${CYAN}>>>> install tcpdump${RESET}”yum install -y tcpdump# 壓縮工具printf “${CYAN}>>>> install unzip${RESET}”yum install -y unzip# 版本控制工具printf “${CYAN}>>>> install git${RESET}”yum install -y gitprintf “${CYAN}>>>> install subversion${RESET}”yum install -y subversionprintf “${GREEN}<<<<<<<< 安裝常用命令工具結(jié)束${RESET}"
常用lib庫安裝
#!/usr/bin/env bash# ———————————————————————————# 控制臺(tái)顏色BLACK=”33[1;30m”RED=”33[1;31m”GREEN=”33[1;32m”YELLOW=”33[1;33m”BLUE=”33[1;34m”PURPLE=”33[1;35m”CYAN=”33[1;36m”RESET=”$(tput sgr0)”# ———————————————————————————printf “${BLUE}”cat >>>>>>> 安裝常見 lib 開始${RESET}”printf “${CYAN}>>>> install gcc gcc-c++ kernel-devel libtool${RESET}”yum -y install make gcc gcc-c++ kernel-devel libtoolprintf “${CYAN}>>>> install openssl openssl-devel${RESET}”yum -y install make openssl openssl-develprintf “${CYAN}>>>> install zlib zlib-devel${RESET}”yum -y install make zlib zlib-develprintf “${CYAN}>>>> install pcre${RESET}”yum -y install pcreprintf “${GREEN}<<<<<<<< 安裝常見 lib 結(jié)束${RESET}"
系統(tǒng)檢查腳本
#!/usr/bin/env bash############################################################################### console colorC_RESET=”$(tput sgr0)”C_BLACK=”33[1;30m”C_RED=”33[1;31m”C_GREEN=”33[1;32m”C_YELLOW=”33[1;33m”C_BLUE=”33[1;34m”C_PURPLE=”33[1;35m”C_CYAN=”33[1;36m”C_WHITE=”33[1;37m”##############################################################################printf “${C_PURPLE}”cat << EOF#################################################################################### 系統(tǒng)信息檢查腳本###################################################################################EOFprintf "${C_RESET}"[[ $(id -u) -gt 0 ]] && echo "請(qǐng)用root用戶執(zhí)行此腳本!" && exit 1sysversion=$(rpm -q centos-release | cut -d- -f3)double_line="==============================================================="line="———————————————-"# 打印頭部信息printHeadInfo() { cat << EOF+———————————————————————————+| 歡迎使用 【系統(tǒng)信息檢查腳本】 |+———————————————————————————+EOF}# 打印尾部信息printFootInfo() { cat << EOF+———————————————————————————+| 腳本執(zhí)行結(jié)束,感謝使用!|+———————————————————————————+EOF}options=( "獲取系統(tǒng)信息" "獲取服務(wù)信息" "獲取CPU信息" "獲取系統(tǒng)網(wǎng)絡(luò)信息" "獲取系統(tǒng)內(nèi)存信息" "獲取系統(tǒng)磁盤信息" "獲取CPU/內(nèi)存占用TOP10" "獲取系統(tǒng)用戶信息" "輸出所有信息" "退出" )printMenu() { printf "${C_BLUE}" printf "主菜單:" for i in "${!options[@]}"; do index=`expr ${i} + 1` val=`expr ${index} % 2` printf "(%02d) %-30s" "${index}" "${options[$i]}" if [[ ${val} -eq 0 ]]; then printf "" fi done printf "${C_BLUE}請(qǐng)輸入需要執(zhí)行的指令:" printf "${C_RESET}"}# 獲取系統(tǒng)信息get_systatus_info() { sys_os=$(uname -o) sys_release=$(cat /etc/redhat-release) sys_kernel=$(uname -r) sys_hostname=$(hostname) sys_selinux=$(getenforce) sys_lang=$(echo $LANG) sys_lastreboot=$(who -b | awk '{print $3,$4}') sys_runtime=$(uptime | awk '{print $3,$4}' | cut -d, -f1) sys_time=$(date) sys_load=$(uptime | cut -d: -f5) cat << EOF【系統(tǒng)信息】系統(tǒng): ${sys_os}發(fā)行版本: ${sys_release}系統(tǒng)內(nèi)核: ${sys_kernel}主機(jī)名: ${sys_hostname}selinux狀態(tài): ${sys_selinux}系統(tǒng)語言: ${sys_lang}系統(tǒng)當(dāng)前時(shí)間: ${sys_time}系統(tǒng)最后重啟時(shí)間: ${sys_lastreboot}系統(tǒng)運(yùn)行時(shí)間: ${sys_runtime}系統(tǒng)負(fù)載: ${sys_load}EOF}# 獲取CPU信息get_cpu_info() { Physical_CPUs=$(grep "physical id" /proc/cpuinfo | sort | uniq | wc -l) Virt_CPUs=$(grep "processor" /proc/cpuinfo | wc -l) CPU_Kernels=$(grep "cores" /proc/cpuinfo | uniq | awk -F ': ' '{print $2}') CPU_Type=$(grep "model name" /proc/cpuinfo | awk -F ': ' '{print $2}' | sort | uniq) CPU_Arch=$(uname -m) cat < /dev/null) if [[ ${sysversion} -gt 6 ]]; then service_config=$(systemctl list-unit-files –type=service –state=enabled | grep "enabled") run_service=$(systemctl list-units –type=service –state=running | grep ".service") else service_config=$(/sbin/chkconfig | grep -E ":on|:啟用" | column -t) run_service=$(/sbin/service –status-all | grep -E "running") fi cat << EOF【服務(wù)信息】${service_config} ${line}運(yùn)行的服務(wù):${run_service} ${line}監(jiān)聽端口:${port_listen} ${line}內(nèi)核參考配置:${kernel_config}EOF}# 獲取系統(tǒng)內(nèi)存信息get_mem_info() { check_mem=$(free -m) MemTotal=$(grep MemTotal /proc/meminfo | awk '{print $2}') #KB MemFree=$(grep MemFree /proc/meminfo | awk '{print $2}') #KB let MemUsed=MemTotal-MemFree MemPercent=$(awk "BEGIN {if($MemTotal==0){printf 100}else{printf "%.2f",$MemUsed*100/$MemTotal}}") report_MemTotal="$((MemTotal/1024))" "MB" #內(nèi)存總?cè)萘?MB) report_MemFree="$((MemFree/1024))" "MB" #內(nèi)存剩余(MB) report_MemUsedPercent=$(free | sed -n '2p' | gawk 'x = int(( $3 / $2 ) * 100) {print x}' | sed 's/$/%/') cat << EOF【內(nèi)存信息】內(nèi)存總?cè)萘?MB): ${report_MemTotal}內(nèi)存剩余量(MB):${report_MemFree}內(nèi)存使用率: ${report_MemUsedPercent}EOF}# 獲取系統(tǒng)網(wǎng)絡(luò)信息get_net_info() { pri_ipadd=$(ip addr | awk '/^[0-9]+: / {}; /inet.*global/ {print gensub(/(.*)/(.*)/, "1", "g", $2)}') pub_ipadd=$(curl ifconfig.me -s) gateway=$(ip route | grep default | awk '{print $3}') mac_info=$(ip link | egrep -v "lo" | grep link | awk '{print $2}') dns_config=$(egrep -v "^$|^#" /etc/resolv.conf) route_info=$(route -n) cat << EOF【網(wǎng)絡(luò)信息】系統(tǒng)公網(wǎng)地址:${pub_ipadd}系統(tǒng)私網(wǎng)地址:${pri_ipadd}網(wǎng)關(guān)地址:${gateway}MAC地址:${mac_info}路由信息:${route_info}DNS 信息:${dns_config}EOF}# 獲取系統(tǒng)磁盤信息get_disk_info() { disk_info=$(fdisk -l | grep "Disk /dev" | cut -d, -f1) disk_use=$(df -hTP | awk '$2!="tmpfs"{print}') disk_percent=$(free | sed -n '2p' | gawk 'x = int(( $3 / $2 ) * 100) {print x}' | sed 's/$/%/') disk_inode=$(df -hiP | awk '$1!="tmpfs"{print}') cat /dev/null; echo “”; done) cat << EOF【用戶信息】系統(tǒng)登錄用戶:${login_user} ${line}ssh 配置信息:${ssh_config} ${line}sudo 配置用戶:${sudo_config} ${line}定時(shí)任務(wù)配置:${crond_config} ${line}hosts 信息:${host_config}EOF}# 獲取CPU/內(nèi)存占用TOP10get_process_top_info() { top_title=$(top -b n1 | head -7 | tail -1) cpu_top10=$(top -b n1 | head -17 | tail -11) mem_top10=$(top -b n1 | head -17 | tail -10 | sort -k10 -r) cat < sys.log printf "${C_GREEN}信息已經(jīng)輸出到 sys.log 中。${C_RESET}" ;; "退出") exit ;; *) clear echo "抱歉,不支持此選項(xiàng)" ;; esac done}######################################## MAIN ########################################printHeadInfomainprintFootInfoprintf "${C_RESET}"
sed進(jìn)階
#!/bin/bash#多個(gè)空格只保留一個(gè)#sed ‘/./,/^$/!d’ test#刪除開頭的空白行#sed ‘/./,$!d’ test#刪除結(jié)尾的空白行sed ‘{:start /^*$/{$d; N; b start}}’ test#刪除html標(biāo)簽#有問題#s///g#sed ‘s/]*>//g’ test1#sed ‘s/]*>//g;/^$/d’ test1#and符號(hào),代表替換命令中的匹配模式,不管預(yù)定義模式是什么文本,都可以用and符號(hào)替換,and符號(hào)會(huì)提取匹配替換命令中指定替換模式中的所有字符串echo “The cat sleeps in his hat” | sed ‘s/.at/”&”/g’#替換單獨(dú)的單詞echo “The System Administrator manual” | sed ‘s/(System) Administrator/1 user/’#在長數(shù)字中插入逗號(hào)echo “1234567” | sed ‘{:start; s/(.*[0-9])([0-9]{3})/1,2/; t start}’#給文件中的行編號(hào)sed ‘=’ test | sed ‘N; s// /’
Linux CPU的上下文切換
我們都知道 Linux 是一個(gè)多任務(wù)操作系統(tǒng),它支持的任務(wù)同時(shí)運(yùn)行的數(shù)量遠(yuǎn)遠(yuǎn)大于 CPU 的數(shù)量。當(dāng)然,這些任務(wù)實(shí)際上并不是同時(shí)運(yùn)行的(Single CPU),而是因?yàn)橄到y(tǒng)在短時(shí)間內(nèi)將 CPU 輪流分配給任務(wù),造成了多個(gè)任務(wù)同時(shí)運(yùn)行的假象。
CPU 上下文(CPU Context)
在每個(gè)任務(wù)運(yùn)行之前,CPU 需要知道在哪里加載和啟動(dòng)任務(wù)。這意味著系統(tǒng)需要提前幫助設(shè)置 CPU 寄存器和程序計(jì)數(shù)器。
CPU 寄存器是內(nèi)置于 CPU 中的小型但速度極快的內(nèi)存。程序計(jì)數(shù)器用于存儲(chǔ) CPU 正在執(zhí)行的或下一條要執(zhí)行指令的位置。
它們都是 CPU 在運(yùn)行任何任務(wù)之前必須依賴的依賴環(huán)境,因此也被稱為 “CPU 上下文”。如下圖所示:
圖片
知道了 CPU 上下文是什么,我想你理解 CPU 上下文切換就很容易了。“CPU上下文切換”指的是先保存上一個(gè)任務(wù)的 CPU 上下文(CPU寄存器和程序計(jì)數(shù)器),然后將新任務(wù)的上下文加載到這些寄存器和程序計(jì)數(shù)器中,最后跳轉(zhuǎn)到程序計(jì)數(shù)器。
這些保存的上下文存儲(chǔ)在系統(tǒng)內(nèi)核中,并在重新安排任務(wù)執(zhí)行時(shí)再次加載。這確保了任務(wù)的原始狀態(tài)不受影響,并且任務(wù)似乎在持續(xù)運(yùn)行。
CPU 上下文切換的類型
你可能會(huì)說 CPU 上下文切換無非就是更新 CPU 寄存器和程序計(jì)數(shù)器值,而這些寄存器是為了快速運(yùn)行任務(wù)而設(shè)計(jì)的,那為什么會(huì)影響 CPU 性能呢?
在回答這個(gè)問題之前,請(qǐng)問,你有沒有想過這些“任務(wù)”是什么?你可能會(huì)說一個(gè)任務(wù)就是一個(gè)進(jìn)程或者一個(gè)線程。是的,進(jìn)程和線程正是最常見的任務(wù),但除此之外,還有其他類型的任務(wù)。
別忘了硬件中斷也是一個(gè)常見的任務(wù),硬件觸發(fā)信號(hào),會(huì)引起中斷處理程序的調(diào)用。
因此,CPU 上下文切換至少有三種不同的類型:
- 進(jìn)程上下文切換
- 線程上下文切換
- 中斷上下文切換
讓我們一一來看看。
進(jìn)程上下文切換
Linux 按照特權(quán)級(jí)別將進(jìn)程的運(yùn)行空間劃分為內(nèi)核空間和用戶空間,分別對(duì)應(yīng)下圖中 Ring 0 和 Ring 3 的 CPU 特權(quán)級(jí)別的 。
- 內(nèi)核空間(Ring 0)擁有最高權(quán)限,可以直接訪問所有資源
- 用戶空間(Ring 3)只能訪問受限資源,不能直接訪問內(nèi)存等硬件設(shè)備。它必須通過系統(tǒng)調(diào)用被陷入(trapped)內(nèi)核中才能訪問這些特權(quán)資源。
圖片
從另一個(gè)角度看,一個(gè)進(jìn)程既可以在用戶空間也可以在內(nèi)核空間運(yùn)行。當(dāng)一個(gè)進(jìn)程在用戶空間運(yùn)行時(shí),稱為該進(jìn)程的用戶態(tài),當(dāng)它落入內(nèi)核空間時(shí),稱為該進(jìn)程的內(nèi)核態(tài)。
從用戶態(tài)到內(nèi)核態(tài)的轉(zhuǎn)換需要通過系統(tǒng)調(diào)用來完成。例如,當(dāng)我們查看一個(gè)文件的內(nèi)容時(shí),我們需要以下系統(tǒng)調(diào)用:
- open():打開文件
- read():讀取文件的內(nèi)容
- write():將文件的內(nèi)容寫入到輸出文件(包括標(biāo)準(zhǔn)輸出)
- close():關(guān)閉文件
那么在上述系統(tǒng)調(diào)用過程中是否會(huì)發(fā)生 CPU 上下文切換呢?當(dāng)然是的。
這需要先保存 CPU 寄存器中原來的用戶態(tài)指令的位置。接下來,為了執(zhí)行內(nèi)核態(tài)的代碼,需要將 CPU 寄存器更新到內(nèi)核態(tài)指令的新位置。最后是跳轉(zhuǎn)到內(nèi)核態(tài)運(yùn)行內(nèi)核任務(wù)。
那么系統(tǒng)調(diào)用結(jié)束后,CPU 寄存器需要恢復(fù)原來保存的用戶狀態(tài),然后切換到用戶空間繼續(xù)運(yùn)行進(jìn)程。
因此,在一次系統(tǒng)調(diào)用的過程中,實(shí)際上有兩次 CPU 上下文切換。
但需要指出的是,系統(tǒng)調(diào)用進(jìn)程不會(huì)涉及進(jìn)程切換,也不會(huì)涉及虛擬內(nèi)存等系統(tǒng)資源切換。這與我們通常所說的“進(jìn)程上下文切換”不同。進(jìn)程上下文切換是指從一個(gè)進(jìn)程切換到另一個(gè)進(jìn)程,而系統(tǒng)調(diào)用期間始終運(yùn)行同一個(gè)進(jìn)程
系統(tǒng)調(diào)用過程通常被稱為特權(quán)模式切換,而不是上下文切換。但實(shí)際上,在系統(tǒng)調(diào)用過程中,CPU 的上下文切換也是不可避免的。
進(jìn)程上下文切換 vs 系統(tǒng)調(diào)用
那么進(jìn)程上下文切換和系統(tǒng)調(diào)用有什么區(qū)別呢?首先,進(jìn)程是由內(nèi)核管理的,進(jìn)程切換只能發(fā)生在內(nèi)核態(tài)。因此,進(jìn)程上下文不僅包括虛擬內(nèi)存、棧和全局變量等用戶空間資源,還包括內(nèi)核棧和寄存器等內(nèi)核空間的狀態(tài)。
所以進(jìn)程上下文切換比系統(tǒng)調(diào)用要多出一步:
在保存當(dāng)前進(jìn)程的內(nèi)核狀態(tài)和 CPU 寄存器之前,需要保存進(jìn)程的虛擬內(nèi)存、棧等;并加載下一個(gè)進(jìn)程的內(nèi)核狀態(tài)。
根據(jù) Tsuna 的測試報(bào)告,每次上下文切換需要幾十納秒至微秒的 CPU 時(shí)間。這個(gè)時(shí)間是相當(dāng)可觀的,尤其是在大量進(jìn)程上下文切換的情況下,很容易導(dǎo)致 CPU 花費(fèi)大量時(shí)間來保存和恢復(fù)寄存器、內(nèi)核棧、虛擬內(nèi)存等資源。這正是我們?cè)谏弦黄恼轮姓劦降模粋€(gè)導(dǎo)致平均負(fù)載上升的重要因素。
那么,該進(jìn)程何時(shí)會(huì)被調(diào)度/切換到在 CPU 上運(yùn)行?其實(shí)有很多場景,下面我為大家總結(jié)一下:
- 當(dāng)一個(gè)進(jìn)程的 CPU 時(shí)間片用完時(shí),它會(huì)被系統(tǒng)掛起,并切換到其他等待 CPU 運(yùn)行的進(jìn)程。
- 當(dāng)系統(tǒng)資源不足(如內(nèi)存不足)時(shí),直到資源充足之前,進(jìn)程無法運(yùn)行。此時(shí)進(jìn)程也會(huì)被掛起,系統(tǒng)會(huì)調(diào)度其他進(jìn)程運(yùn)行。
- 當(dāng)一個(gè)進(jìn)程通過 sleep 函數(shù)自動(dòng)掛起自己時(shí),自然會(huì)被重新調(diào)度。
- 當(dāng)優(yōu)先級(jí)較高的進(jìn)程運(yùn)行時(shí),為了保證高優(yōu)先級(jí)進(jìn)程的運(yùn)行,當(dāng)前進(jìn)程會(huì)被高優(yōu)先級(jí)進(jìn)程掛起運(yùn)行。
- 當(dāng)發(fā)生硬件中斷時(shí),CPU 上的進(jìn)程會(huì)被中斷掛起,轉(zhuǎn)而執(zhí)行內(nèi)核中的中斷服務(wù)程序。
了解這些場景是非常有必要的,因?yàn)橐坏┥舷挛那袚Q出現(xiàn)性能問題,它們就是幕后殺手。
線程上下文切換
線程和進(jìn)程最大的區(qū)別在于,線程是任務(wù)調(diào)度的基本單位,而進(jìn)程是資源獲取的基本單位。
說白了,內(nèi)核中所謂的任務(wù)調(diào)度,實(shí)際的調(diào)度對(duì)象是線程;而進(jìn)程只為線程提供虛擬內(nèi)存和全局變量等資源。所以,對(duì)于線程和進(jìn)程,我們可以這樣理解:
- 當(dāng)一個(gè)進(jìn)程只有一個(gè)線程時(shí),可以認(rèn)為一個(gè)進(jìn)程等于一個(gè)線程
- 當(dāng)一個(gè)進(jìn)程有多個(gè)線程時(shí),這些線程共享相同的資源,例如虛擬內(nèi)存和全局變量。
- 此外,線程也有自己的私有數(shù)據(jù),比如棧和寄存器,在上下文切換時(shí)也需要保存。
這樣,線程的上下文切換其實(shí)可以分為兩種情況:
- 首先,前后兩個(gè)線程屬于不同的進(jìn)程。此時(shí),由于資源不共享,切換過程與進(jìn)程上下文切換相同。
- 其次,前后兩個(gè)線程屬于同一個(gè)進(jìn)程。此時(shí),由于虛擬內(nèi)存是共享的,所以切換時(shí)虛擬內(nèi)存的資源保持不變,只需要切換線程的私有數(shù)據(jù)、寄存器等未共享的數(shù)據(jù)。
顯然,同一個(gè)進(jìn)程內(nèi)的線程切換比切換多個(gè)進(jìn)程消耗的資源要少。這也是多線程替代多進(jìn)程的優(yōu)勢。
中斷上下文切換
除了前面兩種上下文切換之外,還有另外一種場景也輸出 CPU 上下文切換的,那就是中斷。
為了快速響應(yīng)事件,硬件中斷會(huì)中斷正常的調(diào)度和執(zhí)行過程,進(jìn)而調(diào)用中斷處理程序。
在中斷其他進(jìn)程時(shí),需要保存進(jìn)程的當(dāng)前狀態(tài),以便中斷后進(jìn)程仍能從原始狀態(tài)恢復(fù)。
與進(jìn)程上下文不同,中斷上下文切換不涉及進(jìn)程的用戶態(tài)。因此,即使中斷進(jìn)程中斷了處于用戶態(tài)的進(jìn)程,也不需要保存和恢復(fù)進(jìn)程的虛擬內(nèi)存、全局變量等用戶態(tài)資源。
另外,和進(jìn)程上下文切換一樣,中斷上下文切換也會(huì)消耗 CPU。過多的切換次數(shù)會(huì)消耗大量的 CPU 資源,甚至嚴(yán)重降低系統(tǒng)的整體性能。因此,當(dāng)您發(fā)現(xiàn)中斷過多時(shí),需要注意排查它是否會(huì)對(duì)您的系統(tǒng)造成嚴(yán)重的性能問題。
結(jié)論
綜上所述,無論哪種場景導(dǎo)致上下文切換,你都應(yīng)該知道:
CPU 上下文切換是保證 Linux 系統(tǒng)正常運(yùn)行的核心功能之一,一般不需要我們特別關(guān)注。
但是過多的上下文切換會(huì)消耗 CPU 的時(shí)間來保存和恢復(fù)寄存器、內(nèi)核棧、虛擬內(nèi)存等數(shù)據(jù),從而縮短進(jìn)程的實(shí)際運(yùn)行時(shí)間,導(dǎo)致系統(tǒng)整體性能顯著下降。