분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Train/Validation 데이터셋 분할 코드
train.json, train.csv 데이터 파일을 정해진 비율로 새로운 Train/Validation 데이터셋으로 분할하는 코드입니다
dataset 디렉토리 구조는 아래와 같습니다.
..
└── dataset
├── train
├── test
├── test_pubilc.json
├── train.json
└── train.csv
train_all, test_all로 데이터 전처리 한 것 처럼 validation data도 val_all로 옮겨야 하나요?
제가 베이스라인으로 제공된 코드를 사용한게 아니라서 옮겨야 하는것에 대해선 말씀을 못 드리겠네요.
여기서 제공하는 데이터 파일을 그대로 사용합니다.
이미지 로드와 데이터셋 정의 관련 코드도 추가했습니다.
위에 새로 추가단 마지막 3개의 ROW를 참고해서 data_root와 img_prefix를 적절히 바꿔주시면 이미지 파일을 옮기지 않고서도 실행 가능합니다.
좋은 글 감사합니다.
덕분에 수월하게 validation set을 나눌 수 있었습니다.
안녕하세요. 패션 코디 상품 자동 추천 솔루션 style.ai 를 운영중인데요.
Dylan님 한번 만나뵙고 이야기 나누고 싶습니다. jake@fashionade.ai 로 연락부탁드릴게요.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다~