분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
위성 이미지 객체 검출 미래도전기술 경진대회
훈련시 계속 멈춤을 반복합니다.
윈도우10
rtx 2080ti (4대장착중이나 훈련시에는 잘 안쓰는 1대로만 진행중)
쿠다10 & 여기에 맞는 cudnn
python 3.7
TF 1.15x 버전
사용중입니다.
훈련 시 아래 사진과 같이 찔끔 훈련이 진행되다가 10-20분간 멈춰버립니다. 그러다 또 찔금 진행되다 멈춥니다..
(멈추었을 땐 Ctrl-C나 어떠한 키보드도 안먹습니다)
밤새도록 켜두어도 이러던데 혹시 해결책이나 짐작가는 원인이 있을까요 ㅠㅠ?
흐음... 메모리는 64기가라 여유가 충분히 있고 GPU로 학습중이라 CPU는 사용하지않아 여유가 있습니다.
구글에 어떻게든 검색해보니까 tfrecord를 만들 때의 그 코드가 공백(?)을 만들게 돼있어서? 저같은 멈춤 현상을 겪은 사람들이 있긴하네요. 해결했다는데 어떻게 해결했는지 다시 찾아보려고합니다.
삭제된 댓글입니다
gpu 온도는 어떤가요 ?
50도 아래를 유지중입니다 ㅠㅠ 어디서 문제가 있는걸까요... 후
현재 다른피시에서 시도중입니다 감사합니다
저도 같은환경입니다.
윈도우10
rtx 2080ti (4대장착중이나 훈련시에는 잘 안쓰는 1대로만 진행중)
쿠다10 & 여기에 맞는 cudnn
python 3.7
TF 1.15x 버전
저도 같은 증상이 있습니다.
gpu는 2080ti 한대입니다.
감사합니다
안녕하세요. 저도 같은 증상을 여러차례 겪고 있습니다. 혹시 해결하셨는지요? 아니면 참고하고 계신 레퍼런스를 공유받을 수 있을까요??
https://github.com/tensorflow/models/issues/1817
config 옵션 추가하면 잘 됩니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
다른 프로세스쪽에서 cpu나 메모리를 많이 사용하고 있는건 아닐까요? 진행은 되는데 중간 중간 멈추는거면 프로세스 스레싱 같아 보이네요.