cuda 编程（9）Error checking in CUDA programs demo

最新推荐文章于 2023-06-26 16:38:50 发布

luoganttcc

最新推荐文章于 2023-06-26 16:38:50 发布

阅读量568

点赞数

CC 4.0 BY-SA版权

分类专栏： cuda 文章标签： c语言 c++ cuda

本文链接：https://blog.csdn.net/luoganttcc/article/details/123431278

cuda 专栏收录该内容

36 篇文章

订阅专栏

该博客主要展示了CUDA编程中如何进行设备内存的分配、复制以及错误检查。通过`cudaMalloc`、`cudaMemcpy`等函数进行GPU内存操作，并使用自定义的错误检查宏`CHECK`确保CUDA API调用的正确性。在计算过程中，定义了一个简单的加法运算并在全局内存上执行。最后，检查结果是否符合预期，验证了CUDA程序的正确运行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

error.cuh

#pragma once
#include <stdio.h>

#define CHECK(call)                                   \
do                                                    \
{                                                     \
    const cudaError_t error_code = call;              \
    if (error_code != cudaSuccess)                    \
    {                                                 \
        printf("CUDA Error:\n");                      \
        printf("    File:       %s\n", __FILE__);     \
        printf("    Line:       %d\n", __LINE__);     \
        printf("    Error code: %d\n", error_code);   \
        printf("    Error text: %s\n",                \
            cudaGetErrorString(error_code));          \
        exit(1);                                      \
    }                                                 \
} while (0)

check1api.cu

#include "error.cuh"
#include <math.h>
#include <stdio.h>

const double EPSILON = 1.0e-15;
const double a = 1.23;
const double b = 2.34;
const double c = 3.57;
void __global__ add(const double *x, const double *y, double *z, const int N);
void check(const double *z, const int N);

int main(void)
{
    const int N = 100000000;
    const int M = sizeof(double) * N;
    double *h_x = (double*) malloc(M);
    double *h_y = (double*) malloc(M);
    double *h_z = (double*) malloc(M);

    for (int n = 0; n < N; ++n)
    {
        h_x[n] = a;
        h_y[n] = b;
    }

    double *d_x, *d_y, *d_z;
    CHECK(cudaMalloc((void **)&d_x, M));
    CHECK(cudaMalloc((void **)&d_y, M));
    CHECK(cudaMalloc((void **)&d_z, M));
    CHECK(cudaMemcpy(d_x, h_x, M, cudaMemcpyDeviceToHost));
    CHECK(cudaMemcpy(d_y, h_y, M, cudaMemcpyDeviceToHost));

    const int block_size = 128;
    const int grid_size = (N + block_size - 1) / block_size;
    add<<<grid_size, block_size>>>(d_x, d_y, d_z, N);

    CHECK(cudaMemcpy(h_z, d_z, M, cudaMemcpyDeviceToHost));
    check(h_z, N);

    free(h_x);
    free(h_y);
    free(h_z);
    CHECK(cudaFree(d_x));
    CHECK(cudaFree(d_y));
    CHECK(cudaFree(d_z));
    return 0;
}

void __global__ add(const double *x, const double *y, double *z, const int N)
{
    const int n = blockDim.x * blockIdx.x + threadIdx.x;
    if (n < N)
    {
        z[n] = x[n] + y[n];
    }
}

void check(const double *z, const int N)
{
    bool has_error = false;
    for (int n = 0; n < N; ++n)
    {
        if (fabs(z[n] - c) > EPSILON)
        {
            has_error = true;
        }
    }
    printf("%s\n", has_error ? "Has errors" : "No errors");
}

nvcc check1api.cu -o check
./check

CUDA Error:
    File:       check1api.cu
    Line:       30
    Error code: 1
    Error text: invalid argument

cuda 编 程（9）Error checking in CUDA programs demo

error.cuh

check1api.cu

cuda 编程（9）Error checking in CUDA programs demo