사물 이미지 분류 AI 해커톤

Computer Vision | Accuracy

  • moneyIcon 상금 : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 502명 마감

 

[EDA]_데이터 분석 입문자를 위한 데이터 살펴보기

2022.02.18 10:53 2,421 조회 language

안녕하세요 데이콘입니다.


기본적인 EDA 코드입니다.

각자 데이터를 보고 인사이트를 얻었다면 코드로 공유해주세요! 
좋아요, 댓글이 많은 글을 작성하신 분께 '데이콘 후드'를 선물로 드립니다!

* 코드를 어떻게 실행시켜야 할지 잘 모르시는 분은 아래 "코랩으로 데이콘 참여하기"를 먼저 봐주세요!
https://dacon.io/competitions/official/235836/talkboard/404882


감사합니다.
데이콘 드림.

코드
로그인이 필요합니다
0 / 1000
프리랜Seo
2022.02.22 08:34

Q ) sns.countplot(training_labels.ravel()) 
지하철 이동 중 눈팅하다가 문의 남깁니다.ravel() 함수는 어떤 기능인가요? 

백남진
2022.02.22 20:47

다차원 배열을 1차원 배열로 바꿔줍니다.

jinmc
2022.02.23 14:30

위 코드를 받아서 그대로 실행해 보았더니 label이 모두 0으로 나오더군요!
load_CIFAR10 함수를 아래와 같이 변환해서 해봤더니 잘 나왔습니다.

def load_CIFAR10(path):
    
    path = path
    images = []
    labels = []
    lbl = -1
    for filename in glob(path +"*"):
        lbl += 1
        for img in glob(filename + "/*.jpg"):
            an_img = PIL.Image.open(img) #read img
            img_array = np.array(an_img) #img to array
            images.append(img_array) #append array to training_images
            label = lbl #get label
            labels.append(label) #append label
    images = np.array(images)
    labels = np.array(labels)

    from sklearn.preprocessing import LabelEncoder
    le = LabelEncoder()
    labels= le.fit_transform(labels)
    labels = labels.reshape(-1,1)
    
    return images, labels

jinmc
2022.02.23 17:03

또, 데이터를 colab에 업로드하는데 어려움을 겪으시는 분들을 위해서
다음과 같은 코드를 삽입하면, data.zip 경로에 접근할 수 있도록 도와줍니다.
이거 몰라서 엄청 헤맸네요.. ㅠ

from google.colab import drive
drive.mount('/content/drive')