프로그램 사용/openHPC2020. 12. 15. 12:06

예제에서 컴퓨트 노드를 c1 이런식으로 이름을 지어놨는데

openhpc-로 접두를 바꾸면서 생기는 문제

에러 그대로 NodeName을 판별할 수 없다는데

아래 경로의 파일을 수정해주면 문제없이 된다.

cp /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf.ohpc /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf

vi /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf

NodeName=openhpc-[1-2] Sockets=2 CoresPerSocket=8 ThreadsPerCore=2 State=UNKNOWN 
PartitionName=normal Nodes=openhpc-[1-2] Default=YES MaxTime=24:00:00 State=UP Oversubscribe=EXCLUSIVE 

 

-

도대체 머가 문제일까...

 

# slurmd -v
slurmd: fatal: Unable to determine this slurmd's NodeName
# slurmd -V
slurm 20.02.5
# slurmd -C
NodeName=openhpc-1 CPUs=1 Boards=1 SocketsPerBoard=1 CoresPerSocket=1 ThreadsPerCore=1 RealMemory=968
UpTime=0-00:30:27

[링크 : https://www.raspberrypi.org/forums/viewtopic.php?t=245429]

[링크 : https://serverfault.com/questions/988027/slurm-service-running-failed-again-i-dont-know-why]

[링크 : https://medium.com/@racedowling/slurmd-exits-with-error-slurmd-718-fatal-unable-to-determine-this-slurmds-nodename-on-both-7542564befbf]

 

'프로그램 사용 > openHPC' 카테고리의 다른 글

openmpi 및 예제  (0) 2020.12.22
openmpi on centos8  (0) 2020.12.17
environment module / lmod  (0) 2020.12.15
openHPC 설치 part3?  (0) 2020.12.15
OpenFabrics interface - ofi  (0) 2020.12.14
Posted by 구차니