亚洲国产日韩人妖另类,久久只有这里有精品热久久,依依成人精品视频在线观看,免费国产午夜视频在线

ffmpeg + cuda(cuvid) 硬解碼+像素格式轉換(cpu主導)實戰(zhàn)

2022年6月23日 06:13 ? 社會

注意:

VAAPI 是inter gpu 提供的硬編解碼接口VDPAU 是 video decode present api for unixnvdec / ncvid 都是nivida產(chǎn)出的硬解接口，區(qū)別在于解碼方式，和數(shù)據(jù)傳輸方式不同nvenc nivida 硬編接口

編譯 & 運行

linux: gcc -g video_decode_gpu.c `pkg-config –libs libavformat libavcodec libswresample libswscale libavutil` -o video_decode_gpurun cmd: ./video_decode_gpu data/left.mp4 ./bmp

gpu解碼原理

問題1? gpu 解碼是把內存中AVPacket 拷貝到gp顯存中進行處理的嗎？看來是的,代碼中通過 av_read_frame(input_ctx, &packet) 讀取數(shù)據(jù)包，其數(shù)據(jù)操作流向應該是 video file -> memory問題2? gpu 解碼的數(shù)據(jù)流向? videofile-> avpacket ->decoding frame’s in gpu-> transfer rame in gpu into host memory問題3? gpu 解碼數(shù)據(jù) cuvid 解碼器，也是api，對應的數(shù)據(jù)操作流向? videofile-> avpacket ->decoding frame’s in gpu-> transfer rame in gpu into host memory

VDPAU 簡介

Developed by NVIDIA for Unix/Linux systems. To enable this you typically need the libvdpau development package in your distribution, and a compatible graphics card. Note that VDPAU cannot be used to decode frames in memory, the compressed frames are sent by libavcodec to the GPU device supported by VDPAU and then the decoded image can be accessed using the VDPAU API. This is not done automatically by FFmpeg, but must be done at the application level (check for example the ffmpeg_vdpau.c file used by ffmpeg.c). Also, note that with this API it is not possible to move the decoded frame back to RAM, for example in case you need to encode again the decoded frame (e.g. when doing transcoding on a server). Several decoders are currently supported through VDPAU in libavcodec, in particular H.264, MPEG-1/2/4, and VC-1. 翻譯: 由NVIDIA開發(fā)的Unix / Linux系統(tǒng)。要啟用此功能，您通常需要分發(fā)中的libvdpau開發(fā)包和兼容的圖形卡。注意，VDPAU不能用于解碼內存中的幀，壓縮幀由libavcodec發(fā)送到VDPAU支持的GPU設備，然后可以使用VDPAU API訪問解碼圖像。這不是由FFmpeg自動完成的，但必須在應用程序級別完成(例如檢查ffmpeg.c使用的ffmpeg_vdpau.c文件)。此外，請注意，使用此API時，無法將解碼后的幀移回RAM，例如，如果您需要再次對解碼幀進行編碼(例如，在服務器上進行轉碼時)。目前通過libavcodec中的VDPAU支持幾個解碼器，特別是H.264，MPEG-1/2/4和VC-1。

VDPAU 學習:

VdpDecoder -> 解碼壓縮包數(shù)據(jù)VdpVideoSurface -> 解碼完數(shù)據(jù)放置的空間VdpVideoMixer -> 對解碼完的數(shù)據(jù)做后置處理VdpOutputSurface -> 處理完數(shù)據(jù)放置的位置

cuvid 與 VDPAU 是平級的東西，不能拿來直接使用,使用成本太大

cuvid 學習

cuvid nvidia 提供的gpu 視頻硬解碼庫，底層依賴cuda并行計算框架將cpu 解碼轉化到gpu 解碼上，減少cpu壓力，提升解碼速度

CUVID 硬解碼

note:

cuvid nvdec 兩者都是解碼api,不同點在于解碼方式 & 數(shù)據(jù)傳輸nvenc vaapi cdpau 都是硬件編解碼api

CUVID解碼rtsp視頻流

note

OpenCV中VideoReader_GPU可以方便地利用GPU讀取視頻文件，加速解碼過程，但OpenCV中VideoReader_GPU無法讀取rtsp視頻流數(shù)據(jù)。

這是因為CUVID中CuvideoSource不支持rtsp視頻流數(shù)據(jù)，不能由rtsp地址創(chuàng)建VideoSource。

但是videoSource 支持視頻文件

查看nvidia 驅動 & nvcc 版本

cat /proc/driver/nvidia/version nvcc編譯器的版本nvcc -V

Note: For Video Codec SDK 7.0 and later, NVCUVID has been renamed to NVDECODE API.

編譯 & 運行

領取C++音視頻開發(fā)學習資料：點擊音視頻開發(fā)（資料文檔+視頻教程+面試題）（FFmpeg+WebRTC+RTMP+RTSP+HLS+RTP）

編譯

linux: gcc -g hw_decode_cuvid.c `pkg-config –libs libavformat libavcodec libswresample libswscale libavutil` -o hw_decode_cuvid

運行

./hw_decode_cuvid cuda input_data/left.mp4 ./output_data/raw.out

運行結果

raw.out 文件生成

raw.out 文件生成

cpu 軟解碼 cpu 占用率

cpu 軟解碼 cpu使用率g

gpu cuvid 硬解碼 cpu 占用率

gpu 硬解碼 cpu使用率

gpu 硬解碼 gpu 使用情況

gpu 硬解碼 gpu 使用情況

問題：

1、為什么 gpu 硬解碼顯卡使用率那么低?需要排查下問題。

2、將 gpu 中frame 直接做 AV_PIX_FMT_CUDA-> AV_PIX_FMT_BGR24 轉化不能直接用 sws_getContext ，如何才能實現(xiàn)

3、ffmpeg 將 gpu解碼數(shù)據(jù)的像素格式進行 yuv-rgb 格式轉換，是否直接支持，是否需要自己寫函數(shù)

4、將 gpu 中數(shù)據(jù)直接存儲在磁盤上? 如果不可以的話，則進行 device data ->host memory data ->file

5、數(shù)據(jù)拷貝方式 transfer_data_from 源碼

gpu decoded frame pix format AV_PIX_FMT_CUDA 直接在顯存中轉化為 AV_PIX_FMT_BGR24

可行路徑，試了三種:

兩種cpu層面轉換像素格式的方法(1種失敗，1種成功);直接使用ffmpeg api 在gpu層面進行像素格式轉換(失敗)

CPU 主導像素轉換

1. 使用 sws_scale 實現(xiàn) AV_PIX_FMT_CUDA-> AV_PIX_FMT_BGR24 的直接轉換(cpu 層面)

這是我第一次使用的方式，模仿 cpu 上軟解碼(獲取視頻幀，并存儲為bmp格式，經(jīng)驗原則，這種方式最容易想到)運行結果:失敗，bad src img pointers運行結果如下圖所示:

問題原因:

如代碼 hw_decode_cuvid_origin.c 中所示, 直接通過transfer_data 將gpu 中解碼后的frame download到系統(tǒng)內存，則系統(tǒng)內存中的frames piex->format 仍為 AV_PIX_FMT_CUDA ,而 AV_PIX_FMT_CUDA 是gpu 顯存中存儲的解碼后的幀像素格式所以通過 sws_scale 是不能直接change的

GPU 主導像素轉換

gpu 不支持 sws_scale + AV_PIX_FMT_CUDA-> AV_PIX_FMT_BGR24 的直接像素轉換方式，那么能否直接在gpu中直接轉化 AV_PIX_FMT_CUDA 為 AV_PIX_FMT_BGR24呢?如果可以直接實現(xiàn)，性能會有很大提升，因為減少了device->host 的數(shù)據(jù)傳輸，且gpu多核心并行處理，肯定比cpu處理性能要強悍。

av_hwframe_transfer_data() 執(zhí)行操作前設置內存中目標frame的像素格式為 AV_PIX_FMT_BGR24,gpu 黑盒操作實現(xiàn)在gpu上直接將像素格式轉化為目標bgr24格式

運行結果:失敗，像素沒對齊，只有亮度運行結果如下圖所示:![預先設置內存中frame目標像素格式為 AV_PIX_FMT_BGR24]

問題原因:如下圖所示:

問題原因-transfer_data_pix_format_limit

紅框表示的意思為:src->frame->format 轉換為 dst->frame->format 是受限制的，主要是受av_hwframe_transfer_get_formats() 函數(shù)返回的formats 列表限制

所以gdb了下源碼，發(fā)現(xiàn)src->frame->format 轉換為 dst->frame->format 的受限范圍很小,然后找出了 av_hwframe_transfer_get_formats 支持的formats,調試過程如下所示:gdb -tui hw_decode_cuvid (-tui 支持查看源碼)

gdb_tui.png

在調用 av_hwframe_transfer_data() 函數(shù)處打上斷點,且設置程序運行所需參數(shù)

enter_break_point.png

run 程序，step 進入函數(shù)調用棧

run & step-run_enter_func_call_stack

n 單步運行，函數(shù)調用至 transfer_data_alloc()

enter_transfer_data_alloc.png

領取C++音視頻開發(fā)學習資料：點擊音視頻開發(fā)（資料文檔+視頻教程+面試題）（FFmpeg+WebRTC+RTMP+RTSP+HLS+RTP）

發(fā)現(xiàn) av_hwframe_transfer_get_formats()函數(shù)

find_func_call_av_hwframe_transfer_get_formats.png

更改 dst->format 的值為<0的值,并打印支持的像素轉換列表

get_can_changed_pix_formats.png

可以看到只支持 gpu 硬件像素編碼格式->AV_PIX_FMT_NV12 的轉換

CPU 主導像素轉換

經(jīng)過前兩次的試驗，可以明確當前最新版本的ffmpeg還不支持硬解完成之后直接將像素格式轉換為目標rgb24數(shù)據(jù)，還是回歸到 cpu + sws_scale 上,經(jīng)過第二步，可以知道AV_PIX_FMT_CUDA->AV_PIX_FMT_NV12這條路行的通，AV_PIX_FMT_NV12 其實是 YUV 格式的數(shù)據(jù)，yuv 數(shù)據(jù)到 rgb 的像素轉換是完全支持的，所以就自然編寫了 AV_PIX_FMT_CUDA->AV_PIX_FMT_NV12->AV_PIX_FMT_BGR24 的代碼，經(jīng)測試沒問題。當然，不可否認:實現(xiàn) AV_PIX_FMT_CUDA-> AV_PIX_FMT_NV12->AV_PIX_FMT_BGR24 格式轉換 (cpu 實現(xiàn) pix format 轉換，這種cpu層面上的像素格式轉換方式比較弱)

運行結果:成功，如下圖所示:

鄭重聲明：本文內容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權歸原作者所有，如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。

主導使用率像素內存函數(shù)實戰(zhàn)數(shù)據(jù)數(shù)據(jù)傳輸方式顯存格式流向

復工復產(chǎn)進行時 – 訂單量快速增加北京快遞物流運輸逐步恢復向好

上一篇 2022年6月23日 06:13

抄代碼的時候總是遇到原始數(shù)據(jù)應該長什么樣的問題?

下一篇 2022年6月23日 06:13

社會
四季沐歌榮膺「金致獎2024年度家居消費者信賴安心交付品牌」
守正創(chuàng)新是家居行業(yè)的靈魂,也是推動行業(yè)高質量發(fā)展的不竭動力。2024年,中國家居產(chǎn)業(yè)發(fā)展經(jīng)歷了深刻變革,眾多杰出品牌和行業(yè)精英堅定不移地邁向高質量發(fā)展之路,在面對產(chǎn)業(yè)變革與不確定的…
社會 2025年1月11日
74
社會
歡樂冰雪共創(chuàng)未來——第十一屆全國大眾冰雪季啟動暨四季沐歌空氣能松花江冰雪嘉年華溫暖驛站正式開館
1月7日上午,第十一屆全國大眾冰雪季啟動儀式暨四季沐歌空氣能松花江冰雪嘉年華溫暖驛站開館儀式在哈爾濱松花江冰雪嘉年華隆重舉行。哈爾濱文化旅游規(guī)劃設計院有限公司董事長黃訓軍、市場部部…
社會 2025年1月9日
88
社會
空氣能十大品牌四季沐歌空氣能備受贊賞，推動集中供暖舒適化變革
在山東省濰坊市泰和華府小區(qū),身為空氣能十大品牌的四季沐歌空氣能熱泵以其高效、環(huán)保、節(jié)能的特點和舒適溫暖效果,受到了小區(qū)業(yè)主們的喜愛與好評。這不僅是對整個小區(qū)業(yè)主冬季采暖需求的滿足,…
社會 2025年1月3日
106
社會
他們的愛情故事 | 遇見她就是愛情最好的模樣！
“沒想到竟然真的能去參加哈爾濱冰雪集體婚禮,本來是抱著試試看的態(tài)度報名,想要給我們的愛情一份浪漫儀式感,因為她一直很向往哈爾濱的冰雪?！笨吹剿募俱甯杩諝饽芄镜墓枮I公益冰雪集體婚…
社會 2024年12月30日
54
社會
【用戶告白】第二十八期|四季沐歌空氣能收獲感謝信！為道孚縣各級師生送去溫暖與舒適
在青藏高原東南緣的鮮水河斷裂帶,有一個被群山環(huán)抱的縣城——甘孜藏族自治州道孚縣。這里地形復雜,最高海拔達5820米,平均海拔為3245米,氣候以寒冷干燥、冬長夏短著稱。在這片高寒之…
社會 2024年12月26日
472
社會
勇闖極境 | 四季沐歌空氣能登上世界屋脊，征服西藏高寒
勇征極寒,強勁供暖。12月,四季沐歌空氣能極境之旅走進神秘的“第三極”——西藏。巍峨的雪山、蔚藍的天空、鏡面般的圣湖、陡峭的懸崖、無盡的戈壁和沙漠,看過央視經(jīng)典紀錄片《第三極》的觀…
社會 2024年12月23日
150
社會
來自空氣能十大品牌四季沐歌的最新杰作，“真省”系列新品采暖熱水一體機驚艷亮相哈爾濱
12月16日,四季沐歌空氣能索菲亞教堂游客溫暖驛站·零碳小屋正式開館,尤為閃耀“爾濱”的是重磅發(fā)布的四季沐歌空氣能“真省”系列采暖熱水一體機新品,可以滿足用戶不同場景下的采暖熱水需…
社會 2024年12月18日
108
社會
1.88萬平方公里、近5萬戶家庭，四季沐歌空氣能和工程服務團隊守護居民溫暖過冬
蒼茫遼闊的內蒙古自治區(qū),平均風力達6級以上的大風呼嘯著,帶來陣陣寒意,冰雪中的極寒天氣凍得行人“瑟瑟發(fā)抖”。然而走進內蒙古呼和浩特中燃煤改電項目覆蓋的居民家庭,屋子里是四季沐歌空氣…
社會 2024年11月28日
415
社會
哈爾濱第四十一屆“四季沐歌”公益冰雪集體婚禮冠名簽約暨征集啟動儀式隆重舉行
11月20日,哈爾濱第四十一屆“四季沐歌”公益冰雪集體婚禮冠名簽約暨新人征集啟動儀式在哈爾濱隆重舉行。本次活動由中共哈爾濱市委宣傳部、共青團哈爾濱市委員會、哈爾濱市文化廣電和旅游局…
社會 2024年11月22日
522
社會
【暖冬大巡動】第二期|從白天到黑夜，四季沐歌空氣能全國冬檢服務不停歇
11月的新疆,隨著強冷空氣入侵,天空飄落雪花,冷風直吹、寒意逼人,氣溫早已跌至零下,新疆各地氣象部門已接連發(fā)布寒潮、暴雪、大風、大霧、道路結冰等預警信號。在如此寒冷、交通又不便的…
社會 2024年11月18日
636

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息

<progress id="0lz7c"><pre id="0lz7c"><blockquote id="0lz7c"></blockquote></pre></progress>

<span id="0lz7c"><object id="0lz7c"><label id="0lz7c"></label></object></span>