Thyroid Cancer Diagnosis Classification Hackathon : Accurately distinguish between benign and malignant using AI!

Dacon Hackathon | Algorithm | Begin | Tabular | Classification | F1 Score

  • moneyIcon Prize : DASCHOOL Pro Subscription
  • 2025.05.07 ~ 2025.06.30 09:59 + Google Calendar
  • 988 Users Completed

 

제공된 데이터가 합성데이터인가요?

2025.06.02 18:03 729 Views

안녕하세요

데이터를 분석 중 전체적으로 변수 분포가 현실적인 데이터와 다소 동떨어져있는 것 같아 문의드립니다.

특히 모든 수치형 변수들끼리 상관계수가 거의 0에 가까운 것은 노이즈를 고려하더라도 많이 드문 것 같습니다.



Login Required
0 / 1000
DACON.SooWoong
2025.06.04 12:18

안녕하세요, 동그리star님.
본 대회의 데이터는 실제 데이터를 기반으로 해커톤용으로 제작된 데이터입니다.
해커톤용으로 조정이 이루어져 현실 데이터와는 차이가 있을 수 있습니다.
감사합니다.

LincolnDrury
2025.08.04 11:56

Working with medical data was challenging, especially ensuring the dataset was clean and representative. I noticed that synthetic data often lacks realistic variable correlations, making model training less effective, just as mentioned here. Proper preprocessing and understanding data distribution are crucial for accurate classification between benign and malignant cases. For a fun break after intensive work like this, I enjoy playing Sprunki-a great entertainment choice to relax and recharge. https://sprunkii.io

Previous
No Previous Post
Current
제공된 데이터가 합성데이터인가요?
Competition - 갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!
Likes 7
Views 729
Comments 2
3mo ago
Next
수상 인터뷰
Competition - 갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!
Likes 4
Views 225
Comments 0
1mo ago