분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제공된 데이터가 합성데이터인가요?
안녕하세요
데이터를 분석 중 전체적으로 변수 분포가 현실적인 데이터와 다소 동떨어져있는 것 같아 문의드립니다.
특히 모든 수치형 변수들끼리 상관계수가 거의 0에 가까운 것은 노이즈를 고려하더라도 많이 드문 것 같습니다.
Working with medical data was challenging, especially ensuring the dataset was clean and representative. I noticed that synthetic data often lacks realistic variable correlations, making model training less effective, just as mentioned here. Proper preprocessing and understanding data distribution are crucial for accurate classification between benign and malignant cases. For a fun break after intensive work like this, I enjoy playing Sprunki-a great entertainment choice to relax and recharge. https://sprunkii.io
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, 동그리star님.
본 대회의 데이터는 실제 데이터를 기반으로 해커톤용으로 제작된 데이터입니다.
해커톤용으로 조정이 이루어져 현실 데이터와는 차이가 있을 수 있습니다.
감사합니다.