분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[EDA]_데이터 분석 입문자를 위한 데이터 살펴보기
안녕하세요 데이콘입니다.
기본적인 EDA 코드입니다.
각자 데이터를 보고 인사이트를 얻었다면 코드로 공유해주세요!
좋아요, 댓글이 많은 글을 작성하신 분께 '데이콘 후드'를 선물로 드립니다!
* 코드를 어떻게 실행시켜야 할지 잘 모르시는 분은 아래 "코랩으로 데이콘 참여하기"를 먼저 봐주세요!
https://dacon.io/competitions/official/235836/talkboard/404882
감사합니다.
데이콘 드림.
다차원 배열을 1차원 배열로 바꿔줍니다.
위 코드를 받아서 그대로 실행해 보았더니 label이 모두 0으로 나오더군요!
load_CIFAR10 함수를 아래와 같이 변환해서 해봤더니 잘 나왔습니다.
def load_CIFAR10(path):
path = path
images = []
labels = []
lbl = -1
for filename in glob(path +"*"):
lbl += 1
for img in glob(filename + "/*.jpg"):
an_img = PIL.Image.open(img) #read img
img_array = np.array(an_img) #img to array
images.append(img_array) #append array to training_images
label = lbl #get label
labels.append(label) #append label
images = np.array(images)
labels = np.array(labels)
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
labels= le.fit_transform(labels)
labels = labels.reshape(-1,1)
return images, labels
또, 데이터를 colab에 업로드하는데 어려움을 겪으시는 분들을 위해서
다음과 같은 코드를 삽입하면, data.zip 경로에 접근할 수 있도록 도와줍니다.
이거 몰라서 엄청 헤맸네요.. ㅠ
from google.colab import drive
drive.mount('/content/drive')
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Q ) sns.countplot(training_labels.ravel())
지하철 이동 중 눈팅하다가 문의 남깁니다.ravel() 함수는 어떤 기능인가요?