분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
작물 병해 분류 AI 경진대회
이미지 클래스 잘 구분되시나요?(근데 이제 가벼운 설명을 곁들인..)
제가 눈이 안좋은건지 보면서도 구분하기가 어렵네요.
Label
육안으로 분류하셨나요?
아무래도 제가 눈이 멀었습니다..
데이터 불균형 문제도 있네요.
정상 106 시설포도노균병 46 시설포도노균병반응 30 일소피해 29 축과병 17 시설포도탄저병 12 시설포도탄저병반응 10 Name: disease, dtype: int64 0 106 1 46 2 30 3 29 4 17 5 12 6 10 Name: disease_code, dtype: int64
마지막으로 train 데이터 클래스별로 나눠서 저장하는 코드 남깁니다.
train_total = pd.read_csv('data/train.csv') data_path = './data' def make_new_dir(path): if os.path.isdir(path) == False: os.makedirs(path) for i in range(7): # 클래스 개수(7)만큼 반복된다 make_new_dir(f'{data_path}/train_category/{i}') # 클래스 폴더 생성 train_image_paths = list(train_total[train_total['disease_code'] == i]['img_path']) # train.csv에 저장된 img_path for train_image_path in train_image_paths: # 이미지 경로 하나씩 열고 img = Image.open(data_path + '/' + train_image_path) # 이미지 열고 img = img.resize((224, 224)) # 이미지 크기 조절 옵션 img.save(f'{data_path}/train_category/{i}/' + train_image_path.split('/')[1]) # 이미지 저장
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
데이터 불균형 문제가 큰 거 같습니다.
첫번째 이미지들에서는 특히 구분이 쉽지않네요..