분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문
각 클래스에 대한 샘플의 수가 학습 방식에서 문제를 찾기에 충분하다고 생각하나요?
..
1번 문제는 추가적인 데이터를 못 찾으면 해결하기 힘들겠네요..
The number of samples for each class is crucial in determining the effectiveness of a learning method. If the sample size is too small, it might not accurately represent the data, leading to overfitting or biased results. A well-balanced dataset helps identify potential problems in the learning model, ensuring robust and reliable outcomes.
For students working on machine learning projects, understanding these concepts can be challenging. That's where assignment help Perth comes in handy, providing expert guidance to ensure students grasp key ideas like sample sizes and their impact on learning methods, ultimately improving their academic work.
Visit: https://myassignment.live/assignment-help-perth.html
외부 데이터 사용을 안하면 한계가 있어 보여요,, 다른분들은 어떻게 하고 계신지 궁금하네요
test 에는 있지만 train에는 없는 카테고리 데이터를 찾는 거에 고생하고 있습니다..
삭제된 댓글입니다
추가적인 외부 데이터가 있을까요 ㅠㅠ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
아뇨. 데이터 불균형이 제법 큽니다.
아울러 다음과 같은 문제점도 있습니다.
1. train 데이터에는 없는 카테고리가 test 데이터에는 있습니다.
2. train 데이터에서 모두 동일한 카테고리를 가지고 있는 칼럼이 제법 있는데 test 데이터에는 그렇지 않아요.