程序员求职经验分享与学习资料整理平台

网站首页 > 文章精选 正文

python opencv gpu加速 cuda编译问题和设置

balukai 2024-12-23 16:51:45 文章精选 88 ℃


问题1.找不到BUILD_opencv_python3

当用vs2022 编译opencv4.10时,cmake里面找不到BUILD_opencv_python3这个选项,后来换成vs2019后就出现了,这个编译的麻烦就在于各个库和工具之间的版本匹配。


问题2:nvcuvid功能选择了的话,需要下载Video_Codec_SDK,并把文件复制到CUDA对应的目录

Video_Codec_SDK下载地址:https://developer.nvidia.com/video-codec-sdk-archive


以下是一些设置参考

文件路径信息



python相关目录的设置,可以是anaconda中的虚拟环境,位置对应即可

CUDA_ARCH_BIN算力设置中把小于自己显卡算力的数字删除

显卡算力官方查询地址:https://developer.nvidia.com/cuda-gpus

CUDA相关选择



contrib功能设置OPENCV_EXTRA_MODULES_PATH设置对应路径

OPENCV_ENABLE_NONFREE选择ON

BUILD_opencv_world:如果选择会只生成一个dll文件,比较好引用 ,使用功能上不影响,但有时选择后可能会有莫名错误


CMAKE_CONFIGURATION_TYPES后面如果用命令行编译可设置成Release,vs2019中编译是可以切换Debug或release的

可以不用选择的一些功能参考:test,java,js


如果Configure和Generate都没有问题,就可以开始编译

编译方法1:命令行编译

cmake --build "G:/PthonCuda/build2" --target INSTALL --config Release

估计得几个小时,看电脑性能,编译如果完成了并没有错误,就可以在命令窗口测试成功与否

或者在pycharm中测试


以下目录会生成相应文件

install目录如果移动,改一下第四行代码即可

import os

BINARIES_PATHS = [
    os.path.join('G:/PthonCuda/build2/install', 'x64/vc16/bin'),
    os.path.join(os.getenv('CUDA_PATH', 'C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4'), 'bin')
] + BINARIES_PATHS

编译方法2:vs2019编译

模式选择Releasex64(根据需要)生成,完成之后没有报错,再右键INSTALL点生成

生成INSTALL后,D:\anaconda32024\envs\t39\Lib\site-packages\cv2目录下面会有文件产生

这虽然是为了python opencv编译,其实c++中也可以使用的,因为网上很少有python版本的opencv gpu加速代码,以下用c++代码测试下



如果有python版本的代码可留言分享下


使用方面遇到的错误

读取视频时出错 You should explicitly call download method for cuda::GpuMat object in function 'cv::_InputArray::getMat_'

尝试以下方法读取视频

import cv2

# 检查是否成功安装了CUDA支持的OpenCV
if not cv2.cuda.getCudaEnabledDeviceCount():
    raise Exception("CUDA-enabled GPU not found or CUDA support is not available in your OpenCV build.")

# 打开视频文件
video_path = "your video.mp4"  # 替换为你的视频文件路径
cap = cv2.VideoCapture(video_path)

if not cap.isOpened():
    print("Error: Could not open video.")
    exit()

# 获取视频的宽度、高度和总帧数
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))

while True:
    ret, frame = cap.read()

    if not ret:
        break

    # 上传帧到GPU并直接显示
    gpu_frame = cv2.cuda_GpuMat()
    gpu_frame.upload(frame)

    # 将帧下载回CPU内存并显示
    result = gpu_frame.download()
    cv2.imshow("GPU Video", result)

    # 更新进度条(可以在实际应用中实现)
    current_frame = int(cap.get(cv2.CAP_PROP_POS_FRAMES))
    print(f"Progress: {current_frame}/{total_frames} frames")

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

本机信息

cuda和cudnn的版本组合并非唯一,值得研究


最近发表
标签列表