건설기계 오일 상태 분류 AI 경진대회

학습데이터 관련 문의

2022.11.21 22:40 1,400 Views

안녕하세요.

AI 대회가 처음이라서 질문드립니다.


1) 모델 학습 시 Train.csv 파일 내 모든 칼럼을 다 학습시켜야 하는지? 아니면

일부 칼럼만 학습시켜도 문제가 없는건지.. 문의드립니다.


2) 리더보드의 Private/Public Score는.. 코드를 제출해야만 알수있는 값일까요?

또 제출한 코드의 점수로만 반영이 되는건지, 그리고 두 score의 차이가 무엇인지.. 참조할만한 자료가 있을까요?


감사합니다.

로그인이 필요합니다
0 / 1000
alphakoo
2022.11.22 08:42

사실 저도 그 부분이 궁금했습니다. 처음 대회를 나가다 보니 train 데이터의 columns 수와 test 데이터의 columns가 달라서 어떻게 해야 하는지 정말 궁금합니다. 혹시 아시는 분 계시면 답변 좀 부탁드립니다. ㅠㅠ

닉네임이다.
2022.11.22 10:30

"코드 공유" 보시면 나와있어요. 지식 증대라는 기법으로서 여기 서는 pytorch 구현되어 있으나 tensorflow 변경 가능합니다. 
인터넷에 자료 많으니 참고하시면 될 거에요.  도움이 되었다면 좋겠습니다.. ~~

alphakoo
2022.11.22 13:36

pytorch, tensorflow 라면 딥러닝으로 문제를 해결하는 flow인가요? 저는 머신러닝으로 도전해보고 있는데요. 머신러닝에서는 feature 이름이 다르거나 개수가 다르면 오류가 납니다. 제가 무엇을 모르고 있는걸까요... 혹시 알려주시면... 감사하겠습니다!

DACON.GM
2022.11.22 09:06

안녕하세요 RyanKang님,
문의주신 내용에 대한 답변입니다.
1. 학습 Column은 자유롭게 선택해서 학습할 수 있으나, 추론시에는 진단 환경 Column내에서 추론이 이루어질 수 있어야 합니다.
2. Public 점수는 Test 데이터셋에서 사전에 샘플링된 30%만으로 채점된 결과로, 대회 기간 동안 제출 시 실시간으로 점수를 확인할 수 있습니다. 대회 종료 후 나머지 70%에 대해서 일괄 채점되며 이때의 점수가 Private 점수로 1차 평가의 최종 점수입니다.
감사합니다.