데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Data
# clicked == 1 데이터 clicked_1 = all_train[all_train['clicked'] == 1] # clicked == 0 데이터에서 동일 개수x2 만큼 무작위 추출 (다운 샘플링) clicked_0 = all_train[all_train['clicked'] == 0].sample(n=len(clicked_1)*2, random_state=42) # 두 데이터프레임 합치기 train = pd.concat([clicked_1, clicked_0], axis=0).sample(frac=1, random_state=42).reset_index(drop=True)
할때마다 RAM이 53까지 쳐서 코렙이나 로컬에서 죽는 현상이 있습니다...데이터가 너무 많아서 그런것 같은데 혹시 다른 방법을 알 수 있을까요...?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
polars같은 lazy loading이 잘 구현된 라이브러리들이 많습니다