在Redis中我們經(jīng)常用到set,get等命令,細(xì)心的你有沒有發(fā)現(xiàn),還有幾個(gè)相似的命令叫setbit,getbit,它們是用來干嘛的?
BitMap是什么
就是通過一個(gè)bit位來表示某個(gè)元素對(duì)應(yīng)的值或者狀態(tài),其中的key就是對(duì)應(yīng)元素本身。我們知道8個(gè)bit可以組成一個(gè)Byte,所以bitmap本身會(huì)極大的節(jié)省儲(chǔ)存空間。
Redis中的BitMap
Redis從2.2.0版本開始新增了setbit,getbit,bitcount等幾個(gè)bitmap相關(guān)命令。雖然是新命令,但是并沒有新增新的數(shù)據(jù)類型,因?yàn)閟etbit等命令只不過是在set上的擴(kuò)展。
setbit命令介紹
指令 SETBIT key offset value復(fù)雜度 O(1)設(shè)置或者清空key的value(字符串)在offset處的bit值(只能只0或者1)。
空間占用、以及第一次分配空間需要的時(shí)間
在一臺(tái)2010MacBook Pro上,offset為2^32-1(分配512MB)需要 300ms,offset為2^30-1(分配128MB)需要 80ms,offset為2^28-1(分配32MB)需要 30ms,offset為2^26-1(分配8MB)需要8ms。大概的空間占用計(jì)算公式是:($offset/8/1024/1024)MB
使用場景一:用戶簽到
很多網(wǎng)站都提供了簽到功能(這里不考慮數(shù)據(jù)落地事宜),并且需要展示最近一個(gè)月的簽到情況,如果使用bitmap我們?cè)趺醋觯恳谎圆缓狭链a!
connect(‘127.0.0.1’);//用戶uid$uid = 1;//記錄有uid的key$cacheKey = sprintf(“sign_%d”, $uid);//開始有簽到功能的日期$startDate = ‘2017-01-01’;//今天的日期$todayDate = ‘2017-01-21’;//計(jì)算offset$startTime = strtotime($startDate);$todayTime = strtotime($todayDate);$offset = floor(($todayTime – $startTime) / 86400);echo “今天是第{$offset}天” . PHP_EOL;//簽到//一年一個(gè)用戶會(huì)占用多少空間呢?大約365/8=45.625個(gè)字節(jié),好小,有木有被驚呆?$redis->setBit($cacheKey, $offset, 1);//查詢簽到情況$bitStatus = $redis->getBit($cacheKey, $offset);echo 1 == $bitStatus ? ‘今天已經(jīng)簽到啦’ : ‘還沒有簽到呢’;echo PHP_EOL;//計(jì)算總簽到次數(shù)echo $redis->bitCount($cacheKey) . PHP_EOL;/*** 計(jì)算某段時(shí)間內(nèi)的簽到次數(shù)* 很不幸啊,bitCount雖然提供了start和end參數(shù),但是這個(gè)說的是字符串的位置,而不是對(duì)應(yīng)”位”的位置* 幸運(yùn)的是我們可以通過get命令將value取出來,自己解析。并且這個(gè)value不會(huì)太大,上面計(jì)算過一年一個(gè)用戶只需要45個(gè)字節(jié)* 給我們的網(wǎng)站定一個(gè)小目標(biāo),運(yùn)行30年,那么一共需要1.31KB(就問你屌不屌?)*///這是個(gè)錯(cuò)誤的計(jì)算方式echo $redis->bitCount($cacheKey, 0, 20) . PHP_EOL;
使用場景二:統(tǒng)計(jì)活躍用戶
使用時(shí)間作為cacheKey,然后用戶ID為offset,如果當(dāng)日活躍過就設(shè)置為1那么我該如果計(jì)算某幾天/月/年的活躍用戶呢(暫且約定,統(tǒng)計(jì)時(shí)間內(nèi)只有有一天在線就稱為活躍),有請(qǐng)下一個(gè)redis的命令命令 BITOP operation destkey key [key …]說明:對(duì)一個(gè)或多個(gè)保存二進(jìn)制位的字符串 key 進(jìn)行位元操作,并將結(jié)果保存到 destkey 上。說明:BITOP 命令支持 AND 、 OR 、 NOT 、 XOR 這四種操作中的任意一種參數(shù)
//日期對(duì)應(yīng)的活躍用戶$data = array(‘2017-01-10′ => array(1,2,3,4,5,6,7,8,9,10),’2017-01-11′ => array(1,2,3,4,5,6,7,8),’2017-01-12′ => array(1,2,3,4,5,6),’2017-01-13′ => array(1,2,3,4),’2017-01-14’ => array(1,2));//批量設(shè)置活躍狀態(tài)foreach($data as $date=>$uids) {$cacheKey = sprintf(“stat_%s”, $date);foreach($uids as $uid) {$redis->setBit($cacheKey, $uid, 1);}}$redis->bitOp(‘AND’, ‘stat’, ‘stat_2017-01-10’, ‘stat_2017-01-11’, ‘stat_2017-01-12’) . PHP_EOL;//總活躍用戶:6echo “總活躍用戶:” . $redis->bitCount(‘stat’) . PHP_EOL;$redis->bitOp(‘AND’, ‘stat1’, ‘stat_2017-01-10’, ‘stat_2017-01-11’, ‘stat_2017-01-14’) . PHP_EOL;//總活躍用戶:2echo “總活躍用戶:” . $redis->bitCount(‘stat1’) . PHP_EOL;$redis->bitOp(‘AND’, ‘stat2’, ‘stat_2017-01-10’, ‘stat_2017-01-11’) . PHP_EOL;//總活躍用戶:8echo “總活躍用戶:” . $redis->bitCount(‘stat2’) . PHP_EOL;
假設(shè)當(dāng)前站點(diǎn)有5000W用戶,那么一天的數(shù)據(jù)大約為50000000/8/1024/1024=6MB
使用場景三:用戶在線狀態(tài)
前段時(shí)間開發(fā)一個(gè)項(xiàng)目,對(duì)方給我提供了一個(gè)查詢當(dāng)前用戶是否在線的接口。不了解對(duì)方是怎么做的,自己考慮了一下,使用bitmap是一個(gè)節(jié)約空間效率又高的一種方法,只需要一個(gè)key,然后用戶ID為offset,如果在線就設(shè)置為1,不在線就設(shè)置為0,和上面的場景一樣,5000W用戶只需要6MB的空間。
//批量設(shè)置在線狀態(tài)$uids = range(1, 500000);foreach($uids as $uid) {$redis->setBit(‘online’, $uid, $uid % 2);}//一個(gè)一個(gè)獲取狀態(tài)$uids = range(1, 500000);$startTime = microtime(true);foreach($uids as $uid) {echo $redis->getBit(‘online’, $uid) . PHP_EOL;}$endTime = microtime(true);//在我的電腦上,獲取50W個(gè)用戶的狀態(tài)需要25秒echo “total:” . ($endTime – $startTime) . “s”;/*** 對(duì)于批量的獲取,上面是一種效率低的辦法,實(shí)際可以通過get獲取到value,然后自己計(jì)算* 具體計(jì)算方法改天再寫吧,之前寫的代碼找不見了。。。*/
其實(shí)BitMap可以運(yùn)用的場景很多很多(當(dāng)然也會(huì)受到一些限制),思維可以繼續(xù)擴(kuò)散~歡迎小伙伴給我留言探討~