분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Train/Validation 데이터셋 분할 코드
train.json, train.csv 데이터 파일을 정해진 비율로 새로운 Train/Validation 데이터셋으로 분할하는 코드입니다
dataset 디렉토리 구조는 아래와 같습니다.
..
└── dataset
├── train
├── test
├── test_pubilc.json
├── train.json
└── train.csv
train_all, test_all로 데이터 전처리 한 것 처럼 validation data도 val_all로 옮겨야 하나요?
제가 베이스라인으로 제공된 코드를 사용한게 아니라서 옮겨야 하는것에 대해선 말씀을 못 드리겠네요.
여기서 제공하는 데이터 파일을 그대로 사용합니다.
이미지 로드와 데이터셋 정의 관련 코드도 추가했습니다.
위에 새로 추가단 마지막 3개의 ROW를 참고해서 data_root와 img_prefix를 적절히 바꿔주시면 이미지 파일을 옮기지 않고서도 실행 가능합니다.
좋은 글 감사합니다.
덕분에 수월하게 validation set을 나눌 수 있었습니다.
안녕하세요. 패션 코디 상품 자동 추천 솔루션 style.ai 를 운영중인데요.
Dylan님 한번 만나뵙고 이야기 나누고 싶습니다. jake@fashionade.ai 로 연락부탁드릴게요.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다~