【CUDA编程】最常用的Bug Fixing方法

今天，西安下雪了，2020年的第一场雪，比往年来的早些。依稀记得，2010年刚来西安上学时，第一场雪是12月24日，由于是在平安夜，所以还能记得，一晃都十年了……

在CUDA编程过程中，最易出错的部分就是内存的相关操作。时常出现的问题是：程序能够运行，但是其中的Kernel函数未能成功运行。这使得排错相对传统的C语言编程复杂。好在我们依旧可以使用最传统的方法：使用printf函数打印输出进行排查Bug。但是，printf函数在CUDA编程过程中，存在局限性。具体地说，运行在CPU上的代码和运行在GPU上的代码是异步的，运行在GPU核函数中的每个线程也是异步的。这使得printf函数的显示上比较复杂，不是那么直观。

这时，我们可以使用专门的错误检查库函数checkCudaError()，注意需要包含头文件#include <helper_functions.h>,#include <helper_cuda.h>。在CUDA编程中，最容易出错的是就是内存分配cudaMalloc()和cudaMemcpy()。为了防止内存溢出，我们可以首先检查电脑中关于GPU的一些信息。这时，我们可以直接使用安装CUDA后自带的样例，具体位置在C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\1_Utilities\deviceQuery中。我的个人电脑配置如图1：

在图1中，主要需要注意的有四点：

Total amount of shared memory per block
Total number of registers available per block
Maximum number of threads per multiprocessor
Maximum number of threads per block

在我们进行核函数配置和变量定义时需要注意上述四点。当然，我们还可以使用上述的checkCudaError来检查内存操作是否正常。

当我们包含头文件#include <helper_functions.h>,#include <helper_cuda.h>可能会出现错误：无法打开包括文件 helper_cuda.h。这时我们需要在项目中添加目录，具体操作为：右键项目-> 属性->配置属性->C/C++->常规->附加包含目录：

这里在目录中添加上述.h文件所在目录，默认目录为C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\common\inc。这样我们就可以正常使用checkCudaError()函数了，关于checkCudaError()函数的使用，可以自行搜索官方文档。由于我只是最简单地使用，我主要参考了CUDA自带的例子，就足够了。