분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[데이콘 Basic] 데이터 분석 입문자를 위한 안내서 (코랩으로 데이콘 제출하기)
파이썬 설치가 잘 안 돼도, vscode가 뭔지 몰라도 괜찮습니다. 구글 아이디만 있으면 됩니다!
구글 코랩을 사용해서 데이콘의 대회에 참가해봅시다.
1. 구글 검색창에 “구글 코랩”을 검색하여 구글 코랩에 접속합니다.
혹은 아래 링크를 통해 코랩에 접속합니다.
링크: https://colab.research.google.com/notebooks/welcome.ipynb?hl=ko-kr
2. ‘Colaboratory에 오신 것을 환영합니다’는 처음 코랩을 사용하는 사람들을 위한 간단한 튜토리얼입니다. 시간을 들여 천천히 읽어 보시면 좋습니다.
지금은 페이지 좌 상단의 Drive로 복사 버튼을 클릭합시다.
3. 그러면 내 구글 계정의 드라이브에 해당 코랩 페이지의 사본이 만들어집니다.
이제 이 페이지의 왼쪽 위 부분의 [파일] – [드라이브에서 찾기] 버튼을 클릭하면 해당 코랩 파일이 저장된 내 드라이브의 폴더로 이동하게 됩니다.
4. 참가 중인 데이콘 대회 페이지의 [데이터] 탭에서 분석에 사용할 데이터를 다운로드 받습니다.
5. 다운 받은 데이터를 3번에서 나온 내 드라이브의 Colab Notebooks 폴더에 업로드 합니다.
파일을 마우스로 클릭하고 끌어와서 놓는 (드래그 & 드롭) 방식으로 업로드 할 수 있습니다.
6. 구글 드라이브 Colab Notebooks 폴더에서 아무 빈 부분에 마우스 [우클릭]을 한 다음
[더보기] – [Google Colaboratory] 를 클릭하여 새 코랩 파일을 생성합니다.
7. 새로 생성된 Untitled0.ipynb 파일의 왼쪽 부분에서 폴더 모양 아이콘을 클릭합니다.
잠시 기다리면 위 사진과 같이 되는데, 여기서 사진에 표시된 [드라이브 마운트] 아이콘을 클릭합니다.
‘노트북이 Google Drive 파일에 액세스하도록 허용하시겠습니까?’ 질문에 “Google Drive에 연결” 버튼을 클릭합니다.
8. 잠시 후 왼쪽 [파일]에 ‘drive’ 폴더가 새로 생긴 것을 확인할 수 있습니다. 더블 클릭하면 폴더 내용을 볼 수 있습니다.
[drive] – [MyDrive] – [Colab Notebooks] 이 현재 작업이 이루어지는 폴더입니다.
9. 리눅스 명령어를 이용하여 데이터를 압축 해제합니다.
%cd "데이터 zip 파일이 있는 경로" !unzip "데이터 zip 파일 이름"
%cd 는 change directory의 약자로, 작업이 일어나는 장소를 옮기는 명령어입니다.
!unzip은 zip 파일을 압축 해제하는 명령어입니다.
예를 들어서 iris 꽃받침/꽃잎 너비 예측 경진대회에서는 아래와 같이 작성하면 됩니다.
%cd "/contentdrive/MyDrive/Colab Notebooks" !unzip "[데이콘 Basic] iris dataset.zip"
구글 코랩에서 코드를 실행시키려면 왼쪽 진한 회색 부분의 "재생 버튼"을 클릭하거나 ctrl+Enter를 함께 누르면 됩니다.
10. 이제 왼쪽의 압축 해제된 데이터를 사용해서 데이터 분석을 진행해봅시다.
분석은 다음 베이스라인 코드 예시를 참고하세요.
https://dacon.io/competitions/official/235836/codeshare/3593?page=1&dtype=recent
데이터와 동일한 방식으로 베이스라인 코드를 다운 받아서 Colab Notebooks 폴더에 업로드 합니다.
11. 업로드 한 코드를 더블 클릭하여 연 다음, 7번에서 진행한 드라이브 마운트를 다시 진행합니다.
코랩에서는 각 코드 파일마다 드라이브 마운트를 진행해주어야 합니다.
왼쪽 짙은 회색 폴더 모양 아이콘을 누르면 코드 셀이 생성되고,
해당 셀을 실행시키면 위 빨간색 박스 같은 텍스트가 출력됩니다.
파란색 링크를 클릭하세요.
12. 링크를 클릭하면 제일 왼쪽과 같은 화면이 나타납니다. 연결하려는 계정을 선택해주세요. 처음에 로그인한 계정을 사용해야 합니다.
중간 화면이 나타나면 로그인 버튼을 눌러주세요.
로그인이 성공하면 가장 오른쪽 화면이 나타납니다. 여기서 아래 코드를 복사해주세요. (CTRL+C)
이 과정은 코드에서 드라이브를 들여다보려는 계정이 본인의 것이 맞음을 확인하는 과정입니다.
13. 복사한 코드를 "Enter your authorization code" 아래의 빈칸에 붙여넣어 주세요 (CTRL+V)
그리고 엔터키를 누르시면 드라이브와 마운트가 완료됩니다.
이제 베이스라인 코드에 따라 분석을 진행해주세요.
14. 예측 결과로 생성된 submission.csv 파일을 다운로드 합니다.
15. 다운 받은 submission.csv 제출 파일을 데이콘 대회의 [제출] 탭에서 제출합니다!
파일을 끌어와서 놓는 (drag & drop) 방법도 가능하고, 파일 업로드 아이콘을 클릭하여 업로드 할 수 있습니다.
혹은 API를 사용해서 자동으로 제출하도록 하는 방법도 있습니다.
이렇게 구글 코랩만을 사용하여 데이콘 대회에 참가하는 방법을 알아보았습니다!
데이커 여러분 모두 즐거운 데이터 분석 되시길 바랍니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
감사합니다:) 금욜에 제출할게용