K-Fashion AI 경진대회

알고리즘 | 이미지 | 영상분할 | 이미지 세분화 | mAP

  • moneyIcon 상금 : 1,000만원
  • 755명 마감

 

Train/Validation 데이터셋 분할 코드

2020.11.12 03:43 9,722 조회 language

train.json, train.csv 데이터 파일을 정해진 비율로 새로운 Train/Validation 데이터셋으로 분할하는 코드입니다

dataset 디렉토리 구조는 아래와 같습니다.
..
└── dataset
      ├── train
      ├── test
      ├── test_pubilc.json
      ├── train.json
      └── train.csv

코드
로그인이 필요합니다
0 / 1000
당쇠
2020.11.12 08:05

감사합니다~

Rona
2020.11.12 10:21

train_all, test_all로 데이터 전처리 한 것 처럼 validation data도 val_all로 옮겨야 하나요?

Dylan
2020.11.12 12:20

제가 베이스라인으로 제공된 코드를 사용한게 아니라서 옮겨야 하는것에 대해선 말씀을 못 드리겠네요.
여기서 제공하는 데이터 파일을 그대로 사용합니다.

이미지 로드와 데이터셋 정의 관련 코드도 추가했습니다.
위에 새로 추가단 마지막 3개의 ROW를 참고해서 data_root와 img_prefix를 적절히 바꿔주시면 이미지 파일을 옮기지 않고서도 실행 가능합니다.

김수봉
2020.11.16 01:31

좋은 글 감사합니다.
덕분에 수월하게 validation set을 나눌 수 있었습니다.

jake5
2020.11.16 11:35

안녕하세요. 패션 코디 상품 자동 추천 솔루션 style.ai 를 운영중인데요.
Dylan님 한번 만나뵙고 이야기 나누고 싶습니다. jake@fashionade.ai 로 연락부탁드릴게요.