'Programming/openCL & CUDA'에 해당되는 글 80건

  1. 2010.11.03 ATI Stream SDK
  2. 2010.11.02 GPU Gems 3 (2)
  3. 2010.11.02 CUDA 예제파일 실행결과 + SLI
  4. 2010.11.01 SLI mode - AFR, SFR, AA
  5. 2010.10.30 CUDA 와 SLI
  6. 2010.10.24 CUDA SDK 설치하기 (2)
  7. 2010.10.24 CUDA Toolkit 설치하기
  8. 2010.10.24 BLAS - Basic Linear Algebra Subprograms
  9. 2010.10.10 nbody
  10. 2010.10.10 GPU 컴퓨팅 전문기업 - 미루웨어
Programming/openCL & CUDA2010. 11. 3. 09:17

Nvidia CUDA와 비슷하게 GPU 컴퓨팅을 지원하는 ATI Stream이라는 녀석이 있다.
SDK는 아래의 링크에서 다운로드!
[링크 : http://developer.amd.com/gpu/ATIStreamSDK/Pages/default.aspx]


이녀석도 CUDA 처럼 드라이버 버전에 민감하다.
일단 Catalyst 10.9 이상의 버전인지 아래의 도표에서 확인을 해보고 고고싱
(2010.11.03일 기준 최신버전은 10.10 이다. 드라이버 업그레이드시 리부팅은 불필요)
[링크 : http://developer.amd.com/drivers/ccc/Pages/default.aspx]

그렇지 않으면 요런화면을 보게됨.


아무튼, ATI STREAM은 CUDA와는 다르게 SDK와 샘플코드가 같이 패키지로 되어있다.
하지만 일일이 Agree 해주고 몇번이고 해야 하는 귀찮은 4번의 과정이 조금 짜증난다.

패키지는 이렇게 4가지이고

아래와 같은 인스톨러 화면이 나온다.



설치하고 나서 추가된 프로그램목록


샘플코드중 nbody 프로그램


사족 : Express를 고속으로 번역하는 센스!
틀린건 아닌데 지적을 하고 싶은데 이 먼가 찜찜한 기분은 -_-!

'Programming > openCL & CUDA' 카테고리의 다른 글

ATI Stream / OpenCL 을 Nvidia에서 돌려보았더니!  (0) 2010.11.06
ATI STREAM - OpenCL 문서들  (0) 2010.11.04
ATI Stream SDK  (0) 2010.11.03
GPU Gems 3  (2) 2010.11.02
CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
Posted by 구차니

댓글을 달아 주세요

Programming/openCL & CUDA2010. 11. 2. 00:31
Nvidia CUDA 홈페이지에 있는 GPU Gems 3의 링크이다.


[링크 : http://http.developer.nvidia.com/GPUGems3/gpugems3_part01.html]


어디서 많이 보던 빠박인데!? 라는 생각이들면 클릭!
근데.. 책 내용에 포함된 그림들은 참 끌리는데.. 나랑은 거리가 멀단 말이지 ㅠ.ㅠ



---
2011.03.02 추가

'Programming > openCL & CUDA' 카테고리의 다른 글

ATI STREAM - OpenCL 문서들  (0) 2010.11.04
ATI Stream SDK  (0) 2010.11.03
GPU Gems 3  (2) 2010.11.02
CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
Posted by 구차니

댓글을 달아 주세요

  1. 번역서도 나와서 사볼까 했는데... 가격이.. 으헝헝..

    2010.11.02 09:19 신고 [ ADDR : EDIT/ DEL : REPLY ]

Programming/openCL & CUDA2010. 11. 2. 00:23
nvidia 제어판에서 SLI 옵션에 따른결과가 별로 차이가 나지 않아서 재미가 없음 -_-


nbody
SLI off <-> SLI on
151 FPS <-> 165 FPS
 

Fluid는 프로그램의 문제인지 SLI던 아니던 거의 75.7fps에 고정되어 있었다.
단, 버그인지 SLI를 켠 경우에는 초반에 1019.8 fps 라고 나오고 잠시후 75.7fps로 고정되었다.

SLI off
 

SLI on
 

'Programming > openCL & CUDA' 카테고리의 다른 글

ATI Stream SDK  (0) 2010.11.03
GPU Gems 3  (2) 2010.11.02
CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
Posted by 구차니
TAG CUDA, SLI

댓글을 달아 주세요

Programming/openCL & CUDA2010. 11. 1. 23:03
CUDA 리눅스 쪽의 Readme 파일이다.
어찌된게... windows 용으로는 readme 파일이 부실한데, 리눅스는 이렇게나 빵빵할꼬?

아무튼, SLI로 돌리면 3가지 모드로 사용이 가능하다고 한다.
    첫째는 더블 버퍼링 처럼 교대로 렌더링을 하는 방식이고
    둘째는 화면을 수직 1/n 개로 나누어 서로 렌더링하는 방식이고(물론 성능에 따라 비율이 달라질 수 있음)
    셋째는 계단현상 제거이다(통칭 안티알리아싱)

25A. RENDERING MODES

In Linux, with two GPUs SLI and Multi-GPU can both operate in one of three
modes: Alternate Frame Rendering (AFR), Split Frame Rendering (SFR), and
Antialiasing (AA). When AFR mode is active, one GPU draws the next frame while
the other one works on the frame after that. In SFR mode, each frame is split
horizontally into two pieces, with one GPU rendering each piece. The split
line is adjusted to balance the load between the two GPUs. AA mode splits
antialiasing work between the two GPUs. Both GPUs work on the same scene and
the result is blended together to produce the final frame. This mode is useful
for applications that spend most of their time processing with the CPU and
cannot benefit from AFR.

With four GPUs, the same options are applicable. AFR mode cycles through all
four GPUs, each GPU rendering a frame in turn. SFR mode splits the frame
horizontally into four pieces. AA mode splits the work between the four GPUs,
allowing antialiasing up to 64x. With four GPUs SLI can also operate in an
additional mode
, Alternate Frame Rendering of Antialiasing. (AFR of AA). With
AFR of AA, pairs of GPUs render alternate frames, each GPU in a pair doing
half of the antialiasing work. Note that these scenarios apply whether you
have four separate cards or you have two cards, each with two GPUs.

With some GPU configurations, there is in addition a special SLI Mosaic Mode
to extend a single X screen transparently across all of the available display
outputs on each GPU. See below for the exact set of configurations which can
be used with SLI Mosaic Mode.

[링크 : http://developer.download.nvidia.com/compute/cuda/3_2/drivers/docs/README_Linux.txt]


'Programming > openCL & CUDA' 카테고리의 다른 글

GPU Gems 3  (2) 2010.11.02
CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
Posted by 구차니

댓글을 달아 주세요

Programming/openCL & CUDA2010. 10. 30. 22:19
BOINC SETI@HOME 에서 SLI로 돌릴바에는 독립으로 두개로 돌리는게
효용이 좋다는 말을 들은적이 있는데(아마 영문 게시판이었던듯?)
CUDA 문서를 읽다가 문득 떠올라 검색을 해보니 메모리 할당의 특징으로 인해(이부분은 찾아봐야 하겠지만)
다른 GPU의 메모리 까지 끌어가면서 메모리 부족사태가 발생하여 예상보다 적은 수의 CUDA device만
작동이 되므로 SLI의 효용이 예상보다는 떨어지는게 아닐까 생각을 해본다.

4.3  Multiple Devices

In a system with multiple GPUs, all CUDA-enabled GPUs are accessible via the CUDA driver and runtime as separate devices. There are however special considerations as described below when the system is in SLI mode.

First, an allocation in one CUDA device on one GPU will consume memory on other GPUs. Because of this, allocations may fail earlier than otherwise expected.
(첫째, 하나의 GPU상의 하나의 CUDA 장치에 대한 메모리 할당은 다른 GPU들의 메모리를 소비할 것이다. 이러한 것으로 인해, 예상한것보다 더욱 빨리 메모리 할당이 실패할수 있을지도 모른다. - 직역
첫째, 메모리 할당을 하면 GPU상의 CUDA 장치가 다른 GPU의 메모리까지 소비하기 때문에, 생각보다 더욱 빨리 메모리 부족사태가 벌어질지도 모른다. - 의역)

Second, when a Direct3D application runs in SLI Alternate Frame Rendering mode, the Direct3D device(s) created by that application can be used for CUDA-Direct3D interoperability (i.e., passed as a parameter to cudaD3D[9|10]SetDirect3DDevice() when using the runtime API), but only one CUDA device can be created at a time from one of these Direct3D devices.

This CUDA device only executes the CUDA work on one of the GPUs in the SLI configuration.
As a consequence, real interoperability only happens with the copy of a Direct3D resource in that GPU
(note: in AFR mode Direct3D resources that must be in GPU memory are duplicated in the GPU memory of each GPU in the SLI configuration).
In some cases this is not the desired behavior and an application may need to forfeit use of the CUDA-Direct3D interoperability API and manually copy the output of its CUDA work to Direct3D resources using the existing CUDA and
Direct3D API.

[출처 : NVIDIA_CUDA_C_ProgrammingGuide.pdf 파일에서 발췌]

두번째는 interoperability가 모르니 일단 패스 -_-




검색해보니 제목도 거의 유사한 내용 -_-

Posted 31 Jan 2009 19:22:14 UTC
SLI basically combines 2 (or more) matched GPU devices into 1 logical GPU device. When in SLI mode, the system sees only 1 logical GPU and unfortunately for CUDA this means that it only has visibility to 1 physical device (not 2, 3 or 4). Disabling SLI mode for CUDA is best because it allows SETI to take advantage of each GPU as its own device.

[링크 : http://boinc.berkeley.edu/dev/forum_thread.php?id=3592]

2010/10/09 - [프로그램 사용/BOINC - seti@home] - CUDA 그리고 SLI

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
Posted by 구차니
TAG CUDA, CUDA SLI, SLI

댓글을 달아 주세요

Programming/openCL & CUDA2010. 10. 24. 21:50
CUDA Toolkit에는 간단한 문서와 개발환경만 존재할뿐 예제 코드들이 들어있지 않다.
그렇기 때문에, 공부하려면 Toolkit과 더불어 SDK code samples를 설치해주어야 한다.

CUDA Toolkit

  • C/C++ compiler
  • CUDA Visual Profiler
  • OpenCL Visual Profiler
  • GPU-accelerated BLAS library
  • GPU-accelerated FFT library
  • Additional tools and documentation

*New* Updated versions of the CUDA C Programming Guide (Version 3.1.1) and the Fermi Tuning Guide (Version 1.2) are available via the links to the right.

32-bit
64-bit
GPU Computing SDK code samples 32-bit
64-bit

[링크 : http://developer.nvidia.com/object/cuda_3_1_downloads.html]



--- 추가내용
CUDA Toolkit 32bit
 - 2010.10.24 다운로드 대략 64MB / 설치용량 대략 120MB
GPU Computing SDK code samples 32bit
 - 2010.10.24 다운로드 대략 300MB / 설치용량 대략 1GB

'Programming > openCL & CUDA' 카테고리의 다른 글

SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
Posted by 구차니
TAG CUDA

댓글을 달아 주세요

  1. 오오... 이것은 쿠다!!
    써먹어보려다 어려워서 때려친 =ㅅ=

    2010.10.25 13:23 신고 [ ADDR : EDIT/ DEL : REPLY ]
    • 헐 -_-
      천재티스님도 땔친걸 제가 하려고 했다니 ㅠ.ㅠ
      경솔한 행동이었군요 ㅠ.ㅠ

      Welcome to Hell? ㅋ

      2010.10.25 13:27 신고 [ ADDR : EDIT/ DEL ]

Programming/openCL & CUDA2010. 10. 24. 21:17
한줄요약 : 260 이상 버전의 nvidia 드라이버 깔고 시작하면 편함



미친척 CUDA Toolkit 설치시작
헉 경고다!!!

해석 : 니꺼는 드라이버 버전 조또 아님. 업글하셈!


그래서 부랴부랴 엔비디아 홈페이지가서 다운로드 시작!
버전이 무려 60가까이 차이가 나는구나 -_-
+ 드라이버 설치에는 리부팅 필수

별 특이한건 없으므로 CUDA Toolkit 설치 화면은 패스
기본적으로 C:\CUDA에 설치가 되며 아래는 C:\CUDA\bin 의 내용
nvcc가 컴파일러이며 cudart의 저렴한 사이즈와 cuBLAS 그리고 cuFFT의 크고 아름다운(!) 사이즈를 감상!
파일 갯수도 얼마 안되면서 용량은 졸라 먹네 -_-

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
GPU 컴퓨팅 전문기업 - 미루웨어  (0) 2010.10.10
Posted by 구차니

댓글을 달아 주세요

Programming/openCL & CUDA2010. 10. 24. 21:03
처음 BLAS라는 것의 존재를 알게된 것은
MATLAB이라는 녀석을 AMD cpu 에서 돌릴때였다.
[링크 : http://blog.naver.com/morpheuz82/130016114034] << 네이년 구차니 블로그

아무튼 그때는 별 생각없이 넘어갔는데
CUDA를 설치하려고 하면서 메뉴얼들을 보니 CUBLAS Library라는게 눈에 띄길래 또 다시 검색을 했는데
여전히 무슨 말인지는 모르겠다 -_-


선형대수를 안들은걸 지금와서 후회중 ㅠ.ㅠ
간단하게 이해하자면(응?) 선형대수학 연산중 "벡터" 와 "행렬의 곱셈" 등과 같은 연산에 대한 표준을 의미하는 것으로 보인다.

Basic Linear Algebra Subprograms (BLAS) is a de facto application programming interface standard for publishing libraries to perform basic linear algebra operations such as vector and matrix multiplication. They were first published in 1979, and are used to build larger packages such as LAPACK. Heavily used in high-performance computing, highly optimized implementations of the BLAS interface have been developed by hardware vendors such as Intel and AMD, as well as by other authors, e.g. Goto BLAS and ATLAS (a portable self-optimizing BLAS). The LINPACK benchmark relies heavily on DGEMM, a BLAS subroutine, for its performance.

[링크 : http://en.wikipedia.org/wiki/Basic_Linear_Algebra_Subprograms]

SIMD 계열인 MMX나 SSE 등도 모두 이러한 BLAS와 연관이 있을것으로 추측된다.
(그런 이유로 "highly optimized implementations of the BLAS interface have been developed by hardware vendors such as Intel and AMD" 라고 CPU 업체들이 언급이 될게 아닐까?)

[링크 : http://en.wikipedia.org/wiki/SIMD]
[링크 : http://en.wikipedia.org/wiki/MMX_(instruction_set)]
[링크 : http://en.wikipedia.org/wiki/Streaming_SIMD_Extensions]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
GPU 컴퓨팅 전문기업 - 미루웨어  (0) 2010.10.10
Posted by 구차니
TAG BLAS

댓글을 달아 주세요

Programming/openCL & CUDA2010. 10. 10. 16:23
CUDA나 그래픽 쪽 글들을 보면 nbody가 나오길래 머하는 녀석일려나 하고 찾아보게 되었다.
(일단 그래픽이 멋지잖아!)


대충 설명하자면, n 개의 body 들의 상호연관성을 계산하는 시뮬레이션이다.

[링크 : http://en.wikipedia.org/wiki/N-body_simulation]
    [링크 : http://en.wikipedia.org/wiki/N-body_problem]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
GPU 컴퓨팅 전문기업 - 미루웨어  (0) 2010.10.10
Posted by 구차니
TAG nbody

댓글을 달아 주세요

Programming/openCL & CUDA2010. 10. 10. 15:43
마루웨어 아님 -_-

CUDA 라고 불리우는, GPU 프로그래밍 관련해서 국내에서는 유일한 기업이라고 하는데
몇몇 자료들은 꽤 쓸만해 보인다.

[링크 : http://www.miruware.com/]

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
GPU 컴퓨팅 전문기업 - 미루웨어  (0) 2010.10.10
Posted by 구차니

댓글을 달아 주세요