收起左侧

更新最新版V0.8.41后,docker中调用nvidia失效的一些分享

0
回复
204
查看
[ 复制链接 ]

1

主题

12

回帖

0

牛值

江湖小虾

2025-3-21 17:21:32 显示全部楼层 阅读模式

[i=s] 本帖最后由 老谈仙森 于 2025-3-21 17:36 编辑 [/i]<br /> <br /> [i=s] 本帖最后由 老谈仙森 于 2025-3-21 17:35 编辑 <br /> <br />

系统背景

首先根据《在飞牛OS使用libnvidia-container让docker容器支持NVIDIA GPU加速》文章中 https://club.fnnas.com/forum.php?mod=viewthread&tid=14106描述的方式成功运行nvidia-container,如果没有完成,请尝试按照教程中的方法执行命令,有一些问题,会在后面提到。

你可能遇到的问题

  1. 安装nvidia-container-toolkit时,出现了这样类似的输出

    ldconfig: /lib/x86_64-linux-gnu/libnvidia-fbc.so.1 is not a symbolic link

    ldconfig: /lib/x86_64-linux-gnu/libnvidia-opticalflow.so.1 is not a symbolic link

    ldconfig: /lib/x86_64-linux-gnu/libGLESv1_CM_nvidia.so.1 is not a symbolic link

    ldconfig: /lib/x86_64-linux-gnu/libnvidia-egl-gbm.so.1 is not a symbolic link

    先不要慌,请把这些打印出来的信息复制到一个文本文件中

  2. 运行命令

    docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

    时,会出现错误,类似这样的错误 docker: Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy' nvidia-container-cli: initialization error: load library failed: libnvidia-ml.so.1: cannot open shared object file: no such file or directory: unknown.


    还有这样的错误 docker: Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy' nvidia-container-cli: detection error: open failed: /usr/lib/x86_64-linux-gnu/libvdpau_nvidia.so: permission denied: unknown.

你需要做的事情

收藏
送赞
分享
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则