펭귄 몸무게 예측 AI 해커톤

정형 | RMSE

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 839명 마감

 

데이콘 경진대회 데이터셋 Colab에서 쉽게 다운로드 받는 법

2021.12.29 03:08 3,236 Views language

데이콘 경진대회 데이터셋은 대부분 구글 드라이브 download 링크로 제공합니다.
Google Colab을 활용하시는 분들은 데이터셋 업로드 하실 때 번거로움을 느끼는 분도 있을껍니다.
그래서 간단한 google drive 링크로 데이터셋을 직접 다운로드 받는 간단한 라이브러리 형태로 만들었습니다.
코드 몇 줄이면 쉽게 다운받을 수 있습니다.
(아직 모든 경진대회를 테스트 해본 건 아니지만, 펭귄 몸무게 예측 데이터셋은 테스트 완료 했습니다)

파일 id는 
경진대회 - 데이터 탭 - 다운로드 버튼을 눌러서 나오는 URL에서 추출하시면 됩니다. (세부 설명은 코드에 마크다운으로 설명 달아 놨습니다)

감사합니다.

Code
로그인이 필요합니다
0 / 1000
햄스터
2024.04.17 23:29

안녕하세요!
from gdrivedataset import loader

file_id = '1bRrckzwsflolqxf5K6Y3wuDEJI99_mQv'
loader.load_from_google_drive(file_id)
해당 코드에서 BadZipFile: File is not a zip file의 오류가 나는건 어떻게 해결이 가능할까요ㅠ?
조류이미지분류의 open.zip 파일 입니다. (링크: https://drive.google.com/file/d/1bRrckzwsflolqxf5K6Y3wuDEJI99_mQv/view)
답변 주시면 감사하겠습니다:)

DACON.SooWoong
2024.04.19 17:58

안녕하세요, 햄스터님
해당 오류의 경우, 데이터의 용량이 커 압축 파일 자체가 Colab 환경에 아직 완벽히 다운로드되지 않았을 수 있습니다.
따라서, 일정 시간이 지난 후 실행해보시면 정상적으로 실행이 될 수 있습니다.
해당 문제가 지속될 경우에  재문의 해주시기 바랍니다.
감사합니다.