网站首页 > 文章精选正文

python opencv gpu加速 cuda编译问题和设置

balukai 2024-12-23 16:51:45 文章精选 88 ℃

问题1.找不到BUILD_opencv_python3

当用vs2022 编译opencv4.10时，cmake里面找不到BUILD_opencv_python3这个选项，后来换成vs2019后就出现了，这个编译的麻烦就在于各个库和工具之间的版本匹配。

问题2：nvcuvid功能选择了的话，需要下载Video_Codec_SDK,并把文件复制到CUDA对应的目录

Video_Codec_SDK下载地址：https://developer.nvidia.com/video-codec-sdk-archive

以下是一些设置参考

文件路径信息

python相关目录的设置，可以是anaconda中的虚拟环境，位置对应即可

CUDA_ARCH_BIN算力设置中把小于自己显卡算力的数字删除

显卡算力官方查询地址：https://developer.nvidia.com/cuda-gpus

CUDA相关选择

contrib功能设置OPENCV_EXTRA_MODULES_PATH设置对应路径

OPENCV_ENABLE_NONFREE选择ON

BUILD_opencv_world：如果选择会只生成一个dll文件，比较好引用，使用功能上不影响，但有时选择后可能会有莫名错误

CMAKE_CONFIGURATION_TYPES后面如果用命令行编译可设置成Release,vs2019中编译是可以切换Debug或release的

可以不用选择的一些功能参考：test,java,js

如果Configure和Generate都没有问题，就可以开始编译

编译方法1：命令行编译

cmake --build "G:/PthonCuda/build2" --target INSTALL --config Release

估计得几个小时，看电脑性能，编译如果完成了并没有错误，就可以在命令窗口测试成功与否

或者在pycharm中测试

以下目录会生成相应文件

install目录如果移动，改一下第四行代码即可

import os

BINARIES_PATHS = [
    os.path.join('G:/PthonCuda/build2/install', 'x64/vc16/bin'),
    os.path.join(os.getenv('CUDA_PATH', 'C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4'), 'bin')
] + BINARIES_PATHS

编译方法2：vs2019编译

模式选择Releasex64(根据需要)生成，完成之后没有报错，再右键INSTALL点生成

生成INSTALL后，D:\anaconda32024\envs\t39\Lib\site-packages\cv2目录下面会有文件产生

这虽然是为了python opencv编译，其实c++中也可以使用的，因为网上很少有python版本的opencv gpu加速代码，以下用c++代码测试下

如果有python版本的代码可留言分享下

使用方面遇到的错误

读取视频时出错 You should explicitly call download method for cuda::GpuMat object in function 'cv::_InputArray::getMat_'

尝试以下方法读取视频

import cv2

# 检查是否成功安装了CUDA支持的OpenCV
if not cv2.cuda.getCudaEnabledDeviceCount():
    raise Exception("CUDA-enabled GPU not found or CUDA support is not available in your OpenCV build.")

# 打开视频文件
video_path = "your video.mp4"  # 替换为你的视频文件路径
cap = cv2.VideoCapture(video_path)

if not cap.isOpened():
    print("Error: Could not open video.")
    exit()

# 获取视频的宽度、高度和总帧数
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))

while True:
    ret, frame = cap.read()

    if not ret:
        break

    # 上传帧到GPU并直接显示
    gpu_frame = cv2.cuda_GpuMat()
    gpu_frame.upload(frame)

    # 将帧下载回CPU内存并显示
    result = gpu_frame.download()
    cv2.imshow("GPU Video", result)

    # 更新进度条（可以在实际应用中实现）
    current_frame = int(cap.get(cv2.CAP_PROP_POS_FRAMES))
    print(f"Progress: {current_frame}/{total_frames} frames")

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

本机信息

cuda和cudnn的版本组合并非唯一，值得研究

上一篇： python调用 stable diffusion批量生成图片代码解析
下一篇： python定时任务框架APScheduler详解

网站首页 > 文章精选 正文

python opencv gpu加速 cuda编译问题和设置

CUDA_ARCH_BIN算力设置中把小于自己显卡算力的数字删除

猜你喜欢

网站首页 > 文章精选正文