월간 데이콘 Computer Vision 이상치 탐지 알고리즘 경진대회

알고리즘 | CV | 분류 | 이상탐지 | Macro f1 score

  • moneyIcon 상금 : 100만원 + ɑ
  • 1,392명 마감

 

[PyTorch] 이미지를 레이블별로 저장하고 ImageFolder를 사용하여 data split까지 해보자

2022.04.07 18:41 23,711 조회 language

torch 사용자들에게는 ImageFolder 라는 아주 강력한 무기가 존재합니다.
폴더명을 레이블로하여 이미지만 분류할 수 있다면 data split하기에 너무 편한 환경을 구축할 수 있습니다.
다행히도 데이콘측에서 이미지명에 따른 레이블을 알려주었기 때문에 쉽게 데이터 전처리를 마칠 수 있었습니다.
mean/std에 따른 이미지 normaliztion까지 적용하여 train data/ valid data 로 7:3 비율 data split 까지 해보겠습니다. 
이제 여러분은 이어서 데이터 불균형 문제를 해결하고, 모델을 구축하고, dataloader를 불러와 학습과 평가를 진행하시면 됩니다.

코드
로그인이 필요합니다
0 / 1000
dinggulman
2022.04.08 10:43

삭제된 댓글입니다

데이터분석잘하고싶은사람
2022.04.14 14:24

감사합니다!

victory
2022.04.21 16:04

삭제된 댓글입니다

steven
2022.05.01 22:02

삭제된 댓글입니다

ingbeeeded
2022.05.06 19:29

label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"][i]

이 부분 

label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"].item()으로 수정하면 되던데 맞나요?

minkyoon
2023.04.21 16:37

우와 감사합니다. 잘 사용하겠습니다,,

KimVision
2023.04.26 02:42

label = train_df.loc[train_df["file_name"] == f"{train_folder[i]}"]["label"][i]  # train_df에서 이미지 이름에 맞는 label을 불러와 저장

이 구간에서 index 에러가 발생 하는데, 혹시 해결 방법이 어떤 건지 알 수 있을까요??

위에분이 남기신 것처럼 .item() 함수 호출해도 다른 에러 발생하고 해결이 안되서여!