아리랑 위성영상 AI 객체 검출 경진대회

rbox_cnn_resnet101.config 설정 질문

2020.10.21 14:27 4,939 조회

안녕하세요.


베이스라인에 참조된 simplified rnn에서 rbox_cnn_resnet101.config 설정 중 train과 val 그리고 ckpt 저장경로 외에 또 설정해야 하는


부분이 있나요?


train.py 돌리면 계속 에러가 나는데 뭐가 뭔지를 모르겠네요. 성공하신 분 지식 공유 좀 부탁 드릴께요.

로그인이 필요합니다
0 / 1000
화난독수리
2020.10.21 16:34

저두요...혹시 어떤 에러 나시나요?

마성
2020.10.21 18:06

삭제된 댓글입니다

마성
2020.10.21 18:11

혹시 텐서플로우 몇 버전으로 진행하셨나요?

마성
2020.10.22 14:18

slim을 simplified에 있는 것으로 setup하셨나요? 아니면 기본 텐서플로우 api의 slim으로 셋업하셨나여?

마성
2020.10.21 18:15

이런 식 오류에요.
ERROR:tensorflow Object was never used type class 'tensorflow.python.framework.ops.Tensor'

화난독수리
2020.10.21 19:09

위 오류로는 잘 모르겠네요...일단 저는 해결하고 train 중이긴 한데 제가 진행한 대로 말씀드리면(colab기준) 
1. 기존 텐서플로우 uninstall 후 tensorflow-gpu 1.15 버전 설치
2. slim 관련 환경변수 설정(이거 안해주니까 train 할때 contribute? 에러 나더라구요)
import os
os.environ['PYTHONPATH'] = 'simplified_rbox_cnn/slim/'

화난독수리
2020.10.21 19:10

3. tfrecord 생성 및 config  변경
config는 num_classes, fine_tune_checkpoint,  input_path, label_map_path 만 변경했어요

근데 train 중에 자꾸 중단돼서 원인 찾는 중이에요ㅠ

DACON.JeanValjean
2020.10.22 08:42

삭제된 댓글입니다

마성
2020.10.22 13:52

저도 
1. 텐서플로우 1.15.2 설치
2. 기본 object detection tensorflow api 깃헙에서 클론
3. simplified 깃헙 클론 후 기본 텐서플로우의 object detection 폴더 대신에 해당 폴더로 변경

마성
2020.10.22 13:54

4. 프로토콜 버퍼 컴파일
5. research 경로 setup 파일 설치
6. slim 셋업파일 설치
7. config - train, eval 패스 설정 및 model.ckpt 경로 설정

마성
2020.10.22 13:56

환경변수도 research랑 simplified 쪽 os.environ 해줬구요...
그런데 트레이닝 시키면 대충 보니까 세션 실행시키고 gpu까지 할당되는 것 같긴한데....뭔가 로그 찍다가 죽네요. 

마성
2020.10.22 13:59

혹시 label_map
item {
    id:1
    name:'small ship'
}
item {
    id:2
    name:'large ship'
} 이런식으로 16개 만들어주는 거 맞나요?

화난독수리
2020.10.23 04:24

네네 그렇게 셋팅해줬어요. 로그에 iteration 이라고 찍히시나요? 저는 colab 메모리 부족으로 끊기는거 같아요ㅠㅠ