- 博客(2)
- 资源 (4)
- 收藏
- 关注
原创 CUDA核函数的实现——矩阵卷积
实现二维矩阵卷积操作,初学者水平,欢迎批评指正# -*- coding: utf-8 -*-"""Created on Sun Feb 20 15:50:20 2022@author: xuning"""import pycuda.autoinitfrom pycuda.compiler import SourceModuleimport pycuda.gpuarray as gpuarrayimport numpy as npimport cv2import torchim
2022-02-20 17:36:06 2380
原创 实现CUDA核函数——二维矩阵相乘
初学CUDA,自己练手实现二维矩阵乘法,且并发线程数与矩阵计算数据量自适应。计算结果,与调用numpy、torch库的计算方法进行比较验证通过。环境:win10,PyCUDA: (2021, 1),Python: 3.9.7说明:调用时传入的grid、block参数,不能超过GPU的限制,所以需要先调用pycuda.driver库进行相关操作获取,网上有很多资料。代码如下:# -*- coding: utf-8 -*-"""Created on Wed Feb 19 21:33:17
2022-02-19 23:55:29 902 2
蓝牙核心技术
2017-02-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人