분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[PyTorch] 이미지를 레이블별로 저장하고 ImageFolder를 사용하여 data split까지 해보자
torch 사용자들에게는 ImageFolder 라는 아주 강력한 무기가 존재합니다.
폴더명을 레이블로하여 이미지만 분류할 수 있다면 data split하기에 너무 편한 환경을 구축할 수 있습니다.
다행히도 데이콘측에서 이미지명에 따른 레이블을 알려주었기 때문에 쉽게 데이터 전처리를 마칠 수 있었습니다.
mean/std에 따른 이미지 normaliztion까지 적용하여 train data/ valid data 로 7:3 비율 data split 까지 해보겠습니다.
이제 여러분은 이어서 데이터 불균형 문제를 해결하고, 모델을 구축하고, dataloader를 불러와 학습과 평가를 진행하시면 됩니다.
감사합니다!
삭제된 댓글입니다
삭제된 댓글입니다
label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"][i]
이 부분
label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"].item()으로 수정하면 되던데 맞나요?
우와 감사합니다. 잘 사용하겠습니다,,
label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"][i] # train_df에서 이미지 이름에 맞는 label을 불러와 저장
이 구간에서 index 에러가 발생 하는데, 혹시 해결 방법이 어떤 건지 알 수 있을까요??
위에분이 남기신 것처럼 .item() 함수 호출해도 다른 에러 발생하고 해결이 안되서여!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다