CUDA用メモリクラス(素体)：晶紀の館第2別館：SSブログ

	ブログをはじめるログイン

Irvine用コンテキストメニュー拡張、..｜group byとdistinct ブログトップ

CUDA用メモリクラス(素体)　[プログラミング] [編集]

CUDAのプログラムは、思い切りシンプルにすると、こんな感じになります。

const int N = 256;

float* h_A = (float*)malloc(sizeof(float)*N);
float* d_A;
cudaMalloc((void**)&d_A, sizeof(float)*N);

for (int i = 0; i < N; i++)
    h_A[i] = i;

cudaMemcpy(d_A, h_A, sizeof(float)*N, cudaMemcpyHostToDevice);

func<<<1, N>>>(d_A);

cudaMemcpy(h_A, d_A, sizeof(float)*N, cudaMemcpyDeviceToHost);

free(h_A);
cudaFree(d_A);

メモリを確保する
GPUにデータを送る
計算する
GPUからデータを受け取る
メモリを開放する

ここで忘れてはいけないのが、最後にきちんとメモリを開放することでしょう。

開放し忘れても、プログラムを終了させたら、ちゃんと開放される………のかな？

そんなわけで、メモリ開放を忘れないためのクラスを書いてみました。

#ifndef        __CUDA_MEM_H
#define        __CUDA_MEM_H

#include        <cuda_runtime_api.h>
#include        <stdexcept>

template<typename T>
class CudaMem
{
  private:
    size_t size_;
    T* host_;
    T* device_;

  public:
    CudaMem(size_t size) : size_(size), host_(NULL), device_(NULL)
    {
        host_ =new T[size_];
        const cudaError err = cudaMalloc(reinterpret_cast<void**>&device_, 
                                         sizeof(T)*size_);
        if (err != cudaSuccess) {
            delete[] host_;
            throw std::bad_alloc(cudaGetErrorString(err));
        }
    }

    ~CudaMem()
    {
        if (device_)
            cudaFree(device_);

        delete[] host_;
    }

    size_t size() const {return size_;}

    T& operator[](size_t index) {return host_[index];}
    const T& operator[](size_t index) const {return host_[index];}

    T* get() {return host_;}
    const T* get() const {return host_;}

    T* get_gpu() {return device_;}
    const T* get_gpu() const {return device_;}

    void to_gpu()
    {
        const cudaError err = cudaMemcpy(device_, host_, sizeof(T)*size_,
                                         cudaMemcpyHostToDevice);
        if (err != cudaSuccess)
            throw std::runtime_error(cudaGetErrorString(err));
    }

    void from_gpu()
    {
        const cudaError err = cudaMemcpy(host_, device_, sizeof(T)*size_,
                                         cudaMemcpyDeviceToHost);
        if (err != cudaSuccess)
            throw std::runtime_error(cudaGetErrorString(err));
    }
    
  private:
    CudaMem(const CudaMem<T>&);
    CudaMem<T>& operator=(const CudaMem<T>&);
};

#endif

最初のサンプルコードを、このクラスを使って書き換えると、こんな感じ。

const int N = 256;
CudaMem a(N);

for (int i = 0; i < N; i++)
    a[i] = i;

a.to_gpu();

func<<<1, N>>>(a.get_gpu());

a.from_gpu();

このクラスのインスタンスはコピーできないようになってますが、必要に応じて、所有権で管理したり（auto_ptr風）、参照カウンタで管理したり（shared_ptr風）すればいいんじゃないかな？

タグ：Cuda

2010-09-20 08:56 nice!(0) コメント(0) トラックバック(0)

nice! 0

コメントを書く

トラックバック 0

Irvine用コンテキストメニュー拡張、..｜group byとdistinct ブログトップ

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

RSS1.0 | RSS2.0

晶紀の館第2別館

CUDA用メモリクラス(素体)　[プログラミング] [編集]

nice! 0

コメント 0

コメントを書く

トラックバック 0

マイカテゴリー

最新記事一覧

カレンダー

リンク集

RSS取得

晶紀の館 第2別館

CUDA用メモリクラス(素体) [プログラミング] [編集]

nice! 0

コメント 0

コメントを書く

トラックバック 0

マイカテゴリー

最新記事一覧

カレンダー

リンク集

RSS取得

晶紀の館第2別館

CUDA用メモリクラス(素体)　[プログラミング] [編集]