DASCHOOL! Fall Special Discount
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Data
# clicked == 1 데이터 clicked_1 = all_train[all_train['clicked'] == 1] # clicked == 0 데이터에서 동일 개수x2 만큼 무작위 추출 (다운 샘플링) clicked_0 = all_train[all_train['clicked'] == 0].sample(n=len(clicked_1)*2, random_state=42) # 두 데이터프레임 합치기 train = pd.concat([clicked_1, clicked_0], axis=0).sample(frac=1, random_state=42).reset_index(drop=True)
할때마다 RAM이 53까지 쳐서 코렙이나 로컬에서 죽는 현상이 있습니다...데이터가 너무 많아서 그런것 같은데 혹시 다른 방법을 알 수 있을까요...?
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
polars같은 lazy loading이 잘 구현된 라이브러리들이 많습니다