분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제2회 팩토리핵 코리아
[2021-01-11 17:15 수정] 문제 관련 QnA
Q. (2)번과 (3)번은 분석 프로세스 등을 정성적으로만 평가할 수 있을 것 같습니다. 그런데 (2)번 문항에서 예측 모델 성능을 평가한다고 되어 있어서 혼동이 옵니다.
-> 위에 2-1번 문항에 따라 모델 성능을 평가하는 것입니다.
Q. (2)번 문항에서 XAI 방법론을 세 가지 이상 사용하여 변수의 중요도를 판단하라 되어 있습니다. 여기서 변수의 중요도라는 것이 모델에서 기여하는 정도를 의미하는 것인지, 아니면 통계적으로 얼마나 중요한지를 나타내는 것인지 궁금합니다.
-> 통계적으로 얼마나 중요한지 라는 부분에서 잘 이해 못했습니다. 아마 이런 의도로 작성하신 거 같습니다.
* 모델 기여 정도 : trade-off 고려하여 예측 모델을 만들었을 때, 어떤 독립 변수가 이 모델 예측 성능에 높은 기여도를 나타내는가?
* 통계적 중요도 : 어떤 독립 변수가 종속 변수 예측값에 영향을 주는가?
이렇다면, 2개 다 하셔도 됩니다. 다양하게 고민하시고, 다양한 결과를 내주시면 될 거 같습니다.
Q. 혹시 딥러닝 모델을 반드시 사용해야 하나요?
-> 딥러닝 사용하는 건 필수 아닙니다.
(선택) 이라고 표기했지만, 착오를 일으킨 점 죄송합니다.
딥러닝 사용하셔도 되고, 안하셔도 됩니다.
Q. 각 문제를 따로 따로 해결 (예: (2)에서 제시하는 변수 설명력과 (1)에서 개발한 성능 예측 모델과는 무관해도 된다)해도 되나요?
-> 따로따로 하셔도 되고, 문제 순대로 진행하시면서, 문제 간의 인사이트가 발견하면, 그 인사이트를 제시하는 것도 좋을 거 같습니다.
Q. 도메인에 대해서 잘 모르는데 추가적으로 쿨러의 특성에 대한 추가 설명이 필요합니다.
-> 아래의 블로그를 참고하시거나, 추가적인 설명은 직접 찾아서 진행해주시길 바랍니다.
Q. 2번 문제 분석 결과 데이터 제출 방법
-> 각 공유폴더 result 에 yymmdd 폴더 생성 후 팀명_yymmdd.csv로 저장 (양식은 sample_submission.csv 참고)
Q. 분석 파일 / 폴더 제출 방법
-> 각 문항 풀이를 기준으로 test_1, test_2, test_3 이름으로 파일 저장
-> 패키지의 경우 폴더명을 test_1, test_2, test_3 으로 하여 저장
Q. (변수명)모델 에 대해서 추가적인 정보를 얻을 수 있나요?
-> 현재 제공해드린 데이터는 기업에서 제공해드린 데이터 전부입니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved