2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문

각 클래스에 대한 샘플의 수가 학습 방식에서 문제를 찾기에 충분하다고 생각하나요?

2024.09.11 11:52 2,408 Views

..

Login Required
0 / 1000
시티즌DS
2024.09.11 15:27

아뇨. 데이터 불균형이 제법 큽니다.
아울러 다음과 같은 문제점도 있습니다.
1. train 데이터에는 없는 카테고리가 test 데이터에는 있습니다.
2. train 데이터에서 모두 동일한 카테고리를 가지고 있는 칼럼이 제법 있는데 test 데이터에는 그렇지 않아요.

ja7
2024.09.11 17:03

1번 문제는 추가적인 데이터를 못 찾으면 해결하기 힘들겠네요..

bellami
2024.09.11 19:24


The number of samples for each class is crucial in determining the effectiveness of a learning method. If the sample size is too small, it might not accurately represent the data, leading to overfitting or biased results. A well-balanced dataset helps identify potential problems in the learning model, ensuring robust and reliable outcomes.

For students working on machine learning projects, understanding these concepts can be challenging. That's where assignment help Perth comes in handy, providing expert guidance to ensure students grasp key ideas like sample sizes and their impact on learning methods, ultimately improving their academic work.
Visit: https://myassignment.live/assignment-help-perth.html

푹신한이불
2024.09.12 12:23

외부 데이터 사용을 안하면 한계가 있어 보여요,, 다른분들은 어떻게 하고 계신지 궁금하네요

ja7
2024.09.12 13:42

test 에는 있지만 train에는 없는 카테고리 데이터를 찾는 거에 고생하고 있습니다..

defchltldn
2024.09.24 14:46

Deleted Comment

양근보
2024.09.13 16:37

추가적인 외부 데이터가 있을까요 ㅠㅠ 

Previous
Column Error가 발생합니다.
Competition - 난임 환자 대상 임신 성공 여부 예측 AI 온라인 해커톤
Likes 6
Views 1,175
Comments 4
7달 전
Current
각 클래스에 대한 샘플의 수가 학습 방식에서 문제를 찾기에 충분하다고 생각하나요?
Competition - 2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문
Likes 8
Views 2,408
Comments 7
일 년 전
Next
데이터 증강 관련 규칙 질문
Competition - 난독화된 한글 리뷰 복원 및 생성 AI 경진대회
Likes 5
Views 969
Comments 2
7달 전