Programming/openCL & CUDA2010. 11. 2. 00:23
nvidia 제어판에서 SLI 옵션에 따른결과가 별로 차이가 나지 않아서 재미가 없음 -_-


nbody
SLI off <-> SLI on
151 FPS <-> 165 FPS
 

Fluid는 프로그램의 문제인지 SLI던 아니던 거의 75.7fps에 고정되어 있었다.
단, 버그인지 SLI를 켠 경우에는 초반에 1019.8 fps 라고 나오고 잠시후 75.7fps로 고정되었다.

SLI off
 

SLI on
 

'Programming > openCL & CUDA' 카테고리의 다른 글

ATI Stream SDK  (0) 2010.11.03
GPU Gems 3  (2) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
Posted by 구차니
Programming/openCL & CUDA2010. 11. 1. 23:03
CUDA 리눅스 쪽의 Readme 파일이다.
어찌된게... windows 용으로는 readme 파일이 부실한데, 리눅스는 이렇게나 빵빵할꼬?

아무튼, SLI로 돌리면 3가지 모드로 사용이 가능하다고 한다.
    첫째는 더블 버퍼링 처럼 교대로 렌더링을 하는 방식이고
    둘째는 화면을 수직 1/n 개로 나누어 서로 렌더링하는 방식이고(물론 성능에 따라 비율이 달라질 수 있음)
    셋째는 계단현상 제거이다(통칭 안티알리아싱)

25A. RENDERING MODES

In Linux, with two GPUs SLI and Multi-GPU can both operate in one of three
modes: Alternate Frame Rendering (AFR), Split Frame Rendering (SFR), and
Antialiasing (AA). When AFR mode is active, one GPU draws the next frame while
the other one works on the frame after that. In SFR mode, each frame is split
horizontally into two pieces, with one GPU rendering each piece. The split
line is adjusted to balance the load between the two GPUs. AA mode splits
antialiasing work between the two GPUs. Both GPUs work on the same scene and
the result is blended together to produce the final frame. This mode is useful
for applications that spend most of their time processing with the CPU and
cannot benefit from AFR.

With four GPUs, the same options are applicable. AFR mode cycles through all
four GPUs, each GPU rendering a frame in turn. SFR mode splits the frame
horizontally into four pieces. AA mode splits the work between the four GPUs,
allowing antialiasing up to 64x. With four GPUs SLI can also operate in an
additional mode
, Alternate Frame Rendering of Antialiasing. (AFR of AA). With
AFR of AA, pairs of GPUs render alternate frames, each GPU in a pair doing
half of the antialiasing work. Note that these scenarios apply whether you
have four separate cards or you have two cards, each with two GPUs.

With some GPU configurations, there is in addition a special SLI Mosaic Mode
to extend a single X screen transparently across all of the available display
outputs on each GPU. See below for the exact set of configurations which can
be used with SLI Mosaic Mode.

[링크 : http://developer.download.nvidia.com/compute/cuda/3_2/drivers/docs/README_Linux.txt]


'Programming > openCL & CUDA' 카테고리의 다른 글

GPU Gems 3  (2) 2010.11.02
CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
Posted by 구차니
Programming/openCL & CUDA2010. 10. 30. 22:19
BOINC SETI@HOME 에서 SLI로 돌릴바에는 독립으로 두개로 돌리는게
효용이 좋다는 말을 들은적이 있는데(아마 영문 게시판이었던듯?)
CUDA 문서를 읽다가 문득 떠올라 검색을 해보니 메모리 할당의 특징으로 인해(이부분은 찾아봐야 하겠지만)
다른 GPU의 메모리 까지 끌어가면서 메모리 부족사태가 발생하여 예상보다 적은 수의 CUDA device만
작동이 되므로 SLI의 효용이 예상보다는 떨어지는게 아닐까 생각을 해본다.

4.3  Multiple Devices

In a system with multiple GPUs, all CUDA-enabled GPUs are accessible via the CUDA driver and runtime as separate devices. There are however special considerations as described below when the system is in SLI mode.

First, an allocation in one CUDA device on one GPU will consume memory on other GPUs. Because of this, allocations may fail earlier than otherwise expected.
(첫째, 하나의 GPU상의 하나의 CUDA 장치에 대한 메모리 할당은 다른 GPU들의 메모리를 소비할 것이다. 이러한 것으로 인해, 예상한것보다 더욱 빨리 메모리 할당이 실패할수 있을지도 모른다. - 직역
첫째, 메모리 할당을 하면 GPU상의 CUDA 장치가 다른 GPU의 메모리까지 소비하기 때문에, 생각보다 더욱 빨리 메모리 부족사태가 벌어질지도 모른다. - 의역)

Second, when a Direct3D application runs in SLI Alternate Frame Rendering mode, the Direct3D device(s) created by that application can be used for CUDA-Direct3D interoperability (i.e., passed as a parameter to cudaD3D[9|10]SetDirect3DDevice() when using the runtime API), but only one CUDA device can be created at a time from one of these Direct3D devices.

This CUDA device only executes the CUDA work on one of the GPUs in the SLI configuration.
As a consequence, real interoperability only happens with the copy of a Direct3D resource in that GPU
(note: in AFR mode Direct3D resources that must be in GPU memory are duplicated in the GPU memory of each GPU in the SLI configuration).
In some cases this is not the desired behavior and an application may need to forfeit use of the CUDA-Direct3D interoperability API and manually copy the output of its CUDA work to Direct3D resources using the existing CUDA and
Direct3D API.

[출처 : NVIDIA_CUDA_C_ProgrammingGuide.pdf 파일에서 발췌]

두번째는 interoperability가 모르니 일단 패스 -_-




검색해보니 제목도 거의 유사한 내용 -_-

Posted 31 Jan 2009 19:22:14 UTC
SLI basically combines 2 (or more) matched GPU devices into 1 logical GPU device. When in SLI mode, the system sees only 1 logical GPU and unfortunately for CUDA this means that it only has visibility to 1 physical device (not 2, 3 or 4). Disabling SLI mode for CUDA is best because it allows SETI to take advantage of each GPU as its own device.

[링크 : http://boinc.berkeley.edu/dev/forum_thread.php?id=3592]

2010/10/09 - [프로그램 사용/BOINC - seti@home] - CUDA 그리고 SLI

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 예제파일 실행결과 + SLI  (0) 2010.11.02
SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA SDK 설치하기  (2) 2010.10.24
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
Posted by 구차니
Programming/openCL & CUDA2010. 10. 24. 21:50
CUDA Toolkit에는 간단한 문서와 개발환경만 존재할뿐 예제 코드들이 들어있지 않다.
그렇기 때문에, 공부하려면 Toolkit과 더불어 SDK code samples를 설치해주어야 한다.

CUDA Toolkit

  • C/C++ compiler
  • CUDA Visual Profiler
  • OpenCL Visual Profiler
  • GPU-accelerated BLAS library
  • GPU-accelerated FFT library
  • Additional tools and documentation

*New* Updated versions of the CUDA C Programming Guide (Version 3.1.1) and the Fermi Tuning Guide (Version 1.2) are available via the links to the right.

32-bit
64-bit
GPU Computing SDK code samples 32-bit
64-bit

[링크 : http://developer.nvidia.com/object/cuda_3_1_downloads.html]



--- 추가내용
CUDA Toolkit 32bit
 - 2010.10.24 다운로드 대략 64MB / 설치용량 대략 120MB
GPU Computing SDK code samples 32bit
 - 2010.10.24 다운로드 대략 300MB / 설치용량 대략 1GB

'Programming > openCL & CUDA' 카테고리의 다른 글

SLI mode - AFR, SFR, AA  (0) 2010.11.01
CUDA 와 SLI  (0) 2010.10.30
CUDA Toolkit 설치하기  (0) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
Posted by 구차니
Programming/openCL & CUDA2010. 10. 24. 21:17
한줄요약 : 260 이상 버전의 nvidia 드라이버 깔고 시작하면 편함



미친척 CUDA Toolkit 설치시작
헉 경고다!!!

해석 : 니꺼는 드라이버 버전 조또 아님. 업글하셈!


그래서 부랴부랴 엔비디아 홈페이지가서 다운로드 시작!
버전이 무려 60가까이 차이가 나는구나 -_-
+ 드라이버 설치에는 리부팅 필수

별 특이한건 없으므로 CUDA Toolkit 설치 화면은 패스
기본적으로 C:\CUDA에 설치가 되며 아래는 C:\CUDA\bin 의 내용
nvcc가 컴파일러이며 cudart의 저렴한 사이즈와 cuBLAS 그리고 cuFFT의 크고 아름다운(!) 사이즈를 감상!
파일 갯수도 얼마 안되면서 용량은 졸라 먹네 -_-

'Programming > openCL & CUDA' 카테고리의 다른 글

CUDA 와 SLI  (0) 2010.10.30
CUDA SDK 설치하기  (2) 2010.10.24
BLAS - Basic Linear Algebra Subprograms  (0) 2010.10.24
nbody  (0) 2010.10.10
GPU 컴퓨팅 전문기업 - 미루웨어  (0) 2010.10.10
Posted by 구차니
SLI 커넥터를 사용하고(골드핑거)
Nvidia 제어판에서 SLI로 해놔도 두개로 일단 인식한다.
하나는 540Mhz / 다른 하나는 600Mhz 라서 GFLOPS 값이 다르게 나온듯.

2010-10-17 오전 11:41:11  NVIDIA GPU 0: GeForce 8600 GT
                                    (driver version 25896, CUDA version 3010, compute capability 1.1, 256MB, 76 GFLOPS peak)
2010-10-17 오전 11:41:11  NVIDIA GPU 1: GeForce 8600 GT
                                    (driver version 25896, CUDA version 3010, compute capability 1.1, 256MB, 86 GFLOPS peak)

일단 CUDA RT / CU FFT 이런류의 CUDA를 위한 라이브러리를 알아서 다운받고 있다.

'프로그램 사용 > BOINC - seti@home' 카테고리의 다른 글

8800GT 512MB on BOINC  (2) 2011.01.05
BOINC seti@home on WindowsXP SP3 32bit  (0) 2010.10.31
BOINC 설치시 리부팅 안하면?  (0) 2010.10.17
CUDA 그리고 SLI  (0) 2010.10.09
Seti@home 랭킹  (2) 2009.11.09
Posted by 구차니
결론만 말하자면, SLI는 복수개의 (대개는 2개지만) 그래픽 카드를 1개의 논리 그래픽 카드로 만들어서 사용하는 것이므로,
CUDA에서 1개의 그래픽 카드로 인식, BOINC에서 1개분의 속도 밖에 나오지 않는 것으로 추측된다.

Posted 10 Feb 2009 13:42:02 UTC
Correction. SLI means that you have two or more graphics cards working as one, with a single output. BOINC will recognize all the cards, but it will only use one card due to it being used in SLI mode. Seti CUDA will then only work on one card.

[링크 : http://setiathome.berkeley.edu/forum_thread.php?id=51951]

Posted 31 Jan 2009 19:22:14 UTC
SLI basically combines 2 (or more) matched GPU devices into 1 logical GPU device. When in SLI mode, the system sees only 1 logical GPU and unfortunately for CUDA this means that it only has visibility to 1 physical device (not 2, 3 or 4). Disabling SLI mode for CUDA is best because it allows SETI to take advantage of each GPU as its own device.

[링크 : http://boinc.berkeley.edu/dev/forum_thread.php?id=3592]

'프로그램 사용 > BOINC - seti@home' 카테고리의 다른 글

BOINC with CUDA  (2) 2010.10.17
BOINC 설치시 리부팅 안하면?  (0) 2010.10.17
Seti@home 랭킹  (2) 2009.11.09
BOINC 버전업  (0) 2009.11.04
seti@home boinc manger 설정하기 - WU 미리 받아 놓기  (0) 2009.10.28
Posted by 구차니

셋업파일 인증서 내용으로는
2009년 10월 29일 목요일 오전 4:08:40 에 작성된 것으로 보인다.


가장 큰 눈에 띄는 차이점은
어떤 GPU 사용중인지

2009-11-04 오전 12:22:05        NVIDIA GPU 0: GeForce 8600 GT (driver version 19107, CUDA version 2030, compute capability 1.1, 256MB, 76 GFLOPS peak)

메시지에 이렇게 성능을 표시해 준다는 것이다.

Posted by 구차니
하드웨어2009. 10. 18. 12:55
엔비디아 CUDA 지원 제품은 비디오 및 오디오 인코딩, 석유 및 가스 탐사, 제품 설계, 의학 이미지 및 과학 연구 등 고성능 컴퓨팅이 필요한 분야의 개발 속도를 높여줍니다. 대부분의CUDA 프로그램은 GPU 전용으로 최소 256 MB의 메모리를 필요로 합니다. 따라서, GPU가 CUDA 프로그램을 실행하는데 필요한 메모리가 충분한지 귀하의 시스템 사양을 확인하십시오.

[링크 : http://kr.nvidia.com/object/cuda_learn_products_kr.html]

NVIDIA CUDA-enabled products can help accelerate the most demanding tasks—from video and audio encoding to oil and gas exploration, product design, medical imaging, and scientific research. Many CUDA programs require at least 256 MB of memory attached to the GPU. Please check your system’s specifications to ensure the GPU has enough memory to run CUDA programs.

[링크 : http://www.nvidia.com/object/cuda_learn_products.html]

문득, CUDA에 필요하다는 256MB 의 위치가 궁금해졌다.
Nvidia korea에서는 CPU전용으로 256MB 라고 했는데, 전용이라는 의미가 참 모호하다.
비디오 메모리로 할당된 것이 256MB 라는건지 말이다.

그래서 영문 홈페이지를 가보니, attached to the GPU라고 되어있다.
역시.. 한글 번역은 항상 안습수준 ㅠ.ㅠ

그래픽 카드에 장착된 메모리가 256MB 이상이어야지 CUDA가 가동될수 있다는데
왜 256MB 인지에 대한 언급은 없다...

왜일까?


머.. 그냥 추측이긴 하지만, 그래픽 카드라는 특성상 하드웨어 연산 유닛들을 한번에
데이터를 채워 넣어줘야지 작동을 하기 때문에 한번에 요구하는 데이터의 양이 256MB 정도가 아닐까 라는 생각이 든다.
그게 아니라면 128MB 정도를 요구하고 double buffer 식으로 구현을 하는게 아닐까 그렇게 때문에
CUDA를 돌리는데 최소한 GPU 메모리가 256MB가 필요하다고 한게 아닐까?

'하드웨어' 카테고리의 다른 글

쇼트키(Schottky)  (2) 2009.11.11
anode / cathode - 애노드 / 캐소드  (0) 2009.10.22
winXP AHCI SATA HDD - 900번째 글  (6) 2009.10.09
inductor - 저항이 아니라규!  (2) 2009.09.29
CVBS / RGB - SCART  (2) 2009.09.23
Posted by 구차니

고급 - 환경설정 에 들어오면 위의 화면이 나오는데,
왜 3분 냅둬야 그렇게 되었는지 궁금했는데.. 위의 설정에 나와있었다.. OTL
아.. 죠낸 부끄부끄 *-_-*

아무튼 "컴퓨터를 사용하는 동안 GPU 사용" 에 체크를 하면 항상 GPU로 연산을 한다.
(체감상으로.. 파이어폭스도 조금 버벅대지는 느낌이.. OTL)

[링크 : http://210.218.8.126/zseti/zboard.php?id=setihelp&no=4810]

'프로그램 사용 > BOINC - seti@home' 카테고리의 다른 글

BOINC 버전업  (0) 2009.11.04
seti@home boinc manger 설정하기 - WU 미리 받아 놓기  (0) 2009.10.28
seti@home cuda 연산  (2) 2009.10.17
seti@home boinc cuda 연산  (0) 2009.10.17
cuda로 돌린 credit  (0) 2009.10.16
Posted by 구차니