2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문

각 클래스에 대한 샘플의 수가 학습 방식에서 문제를 찾기에 충분하다고 생각하나요?

2024.09.11 11:52 2,397 조회

..

로그인이 필요합니다
0 / 1000
시티즌DS
2024.09.11 15:27

아뇨. 데이터 불균형이 제법 큽니다.
아울러 다음과 같은 문제점도 있습니다.
1. train 데이터에는 없는 카테고리가 test 데이터에는 있습니다.
2. train 데이터에서 모두 동일한 카테고리를 가지고 있는 칼럼이 제법 있는데 test 데이터에는 그렇지 않아요.

ja7
2024.09.11 17:03

1번 문제는 추가적인 데이터를 못 찾으면 해결하기 힘들겠네요..

bellami
2024.09.11 19:24


The number of samples for each class is crucial in determining the effectiveness of a learning method. If the sample size is too small, it might not accurately represent the data, leading to overfitting or biased results. A well-balanced dataset helps identify potential problems in the learning model, ensuring robust and reliable outcomes.

For students working on machine learning projects, understanding these concepts can be challenging. That's where assignment help Perth comes in handy, providing expert guidance to ensure students grasp key ideas like sample sizes and their impact on learning methods, ultimately improving their academic work.
Visit: https://myassignment.live/assignment-help-perth.html

푹신한이불
2024.09.12 12:23

외부 데이터 사용을 안하면 한계가 있어 보여요,, 다른분들은 어떻게 하고 계신지 궁금하네요

ja7
2024.09.12 13:42

test 에는 있지만 train에는 없는 카테고리 데이터를 찾는 거에 고생하고 있습니다..

defchltldn
2024.09.24 14:46

삭제된 댓글입니다

양근보
2024.09.13 16:37

추가적인 외부 데이터가 있을까요 ㅠㅠ 

이전 글
Column Error가 발생합니다.
대회 - 난임 환자 대상 임신 성공 여부 예측 AI 온라인 해커톤
좋아요 6
조회 1,164
댓글 4
7달 전
현재 글
각 클래스에 대한 샘플의 수가 학습 방식에서 문제를 찾기에 충분하다고 생각하나요?
대회 - 2024 생명연구자원 AI활용 경진대회 : 인공지능 활용 부문
좋아요 8
조회 2,397
댓글 7
일 년 전
다음 글
데이터 증강 관련 규칙 질문
대회 - 난독화된 한글 리뷰 복원 및 생성 AI 경진대회
좋아요 5
조회 951
댓글 2
7달 전