覚え書き
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[実験メモ]]
**デバイスの確認 [#f441a980]
cudaGetDeviceCount( int* count )
デバイスの数を返す
cudaGetDevice( int* device )
現在使用中のデバイスを返す
**書き方とか [#h4995e64]
cudaSetDevice( int device )
使用したいデバイスのセット
cudaSetDeviceでデバイスを指定して、その下に処理を書く。
デバイスを切り替えたいときはcudaSetDeviceする。
あまりオーバーヘッドはないらしい。
最初はデバイス0が指定されている。
変数で指定しておくと、あとでデバイスの処理順を変えるのに...
cudaGetDeviceCountでデバイス数取得して、for文で指定するの...
メモリ確保部分とかには使えそうな気がしないでもない。
float *dev_a[deviceNum];
for(i=0;i<deviceNum;i++){
cudaSetDevice(i);
cudaMalloc(&dev_a[i],size);
}
とかそんなかんじで
**デバイスを切り替えるときの注意 [#l8504d90]
一方のデバイスにセットされた状態で、もう一方のデバイスに...
こういう管理めんどくさそうな気がするので、自動化させられ...
**GPUDirect v2 [#i2ee23cf]
GPUDirect v2だと、他のデバイスの領域にアクセスできるらし...
cudaDeviceCanAccessPeer( int* canAccessPeer, int device,...
peerDeviceからdeviceにアクセス可能かをcanAccessPeerに返す。
cudaDeviceEnablePeerAccess( int peerDevice, unsigned int...
peerDeviceに指定されたデバイスを他のデバイスからアクセス...
GPUDirect v2はTeslaのシリーズのプレミアム機能らしい。あと...
**P2Pメモリコピー [#y1408763]
P2Pアクセスはできなくとも、デバイス間で直にメモリコピーを...
cudaMemcpyPeer(void* dst, int dstDevice, const void* src...
大体cudaMemcpyと同じ。dstDeviceにコピー先のデバイスID、sr...
**メモ [#mb407156]
大本のデータを二つに分割。(GPUの能力に応じて配分を変える...
データの境界領域をP2Pメモリコピーで渡す。処理のアクセス範...
データを一定数に分割。それぞれのデバイスにいくつかデータ...
終了行:
[[実験メモ]]
**デバイスの確認 [#f441a980]
cudaGetDeviceCount( int* count )
デバイスの数を返す
cudaGetDevice( int* device )
現在使用中のデバイスを返す
**書き方とか [#h4995e64]
cudaSetDevice( int device )
使用したいデバイスのセット
cudaSetDeviceでデバイスを指定して、その下に処理を書く。
デバイスを切り替えたいときはcudaSetDeviceする。
あまりオーバーヘッドはないらしい。
最初はデバイス0が指定されている。
変数で指定しておくと、あとでデバイスの処理順を変えるのに...
cudaGetDeviceCountでデバイス数取得して、for文で指定するの...
メモリ確保部分とかには使えそうな気がしないでもない。
float *dev_a[deviceNum];
for(i=0;i<deviceNum;i++){
cudaSetDevice(i);
cudaMalloc(&dev_a[i],size);
}
とかそんなかんじで
**デバイスを切り替えるときの注意 [#l8504d90]
一方のデバイスにセットされた状態で、もう一方のデバイスに...
こういう管理めんどくさそうな気がするので、自動化させられ...
**GPUDirect v2 [#i2ee23cf]
GPUDirect v2だと、他のデバイスの領域にアクセスできるらし...
cudaDeviceCanAccessPeer( int* canAccessPeer, int device,...
peerDeviceからdeviceにアクセス可能かをcanAccessPeerに返す。
cudaDeviceEnablePeerAccess( int peerDevice, unsigned int...
peerDeviceに指定されたデバイスを他のデバイスからアクセス...
GPUDirect v2はTeslaのシリーズのプレミアム機能らしい。あと...
**P2Pメモリコピー [#y1408763]
P2Pアクセスはできなくとも、デバイス間で直にメモリコピーを...
cudaMemcpyPeer(void* dst, int dstDevice, const void* src...
大体cudaMemcpyと同じ。dstDeviceにコピー先のデバイスID、sr...
**メモ [#mb407156]
大本のデータを二つに分割。(GPUの能力に応じて配分を変える...
データの境界領域をP2Pメモリコピーで渡す。処理のアクセス範...
データを一定数に分割。それぞれのデバイスにいくつかデータ...
ページ名: