제2회 팩토리핵 코리아

[2021-01-11 17:15 수정] 문제 관련 QnA

2021.01.11 09:26 3,058 조회

Q. (2)번과 (3)번은 분석 프로세스 등을 정성적으로만 평가할 수 있을 것 같습니다.  그런데 (2)번 문항에서 예측 모델 성능을 평가한다고 되어 있어서 혼동이 옵니다.

  -> 위에 2-1번 문항에 따라 모델 성능을 평가하는 것입니다.



Q. (2)번 문항에서 XAI 방법론을 세 가지 이상 사용하여 변수의 중요도를 판단하라 되어 있습니다. 여기서 변수의 중요도라는 것이 모델에서 기여하는 정도를 의미하는 것인지, 아니면 통계적으로 얼마나 중요한지를 나타내는 것인지 궁금합니다.

  -> 통계적으로 얼마나 중요한지 라는 부분에서 잘 이해 못했습니다. 아마 이런 의도로 작성하신 거 같습니다.

    * 모델 기여 정도 : trade-off 고려하여 예측 모델을 만들었을 때, 어떤 독립 변수가 이 모델 예측 성능에 높은 기여도를 나타내는가?

    * 통계적 중요도 : 어떤 독립 변수가 종속 변수 예측값에 영향을 주는가?

      이렇다면, 2개 다 하셔도 됩니다. 다양하게 고민하시고, 다양한 결과를 내주시면 될 거 같습니다. 


   

Q. 혹시 딥러닝 모델을 반드시 사용해야 하나요?

  -> 딥러닝 사용하는 건 필수 아닙니다. 

    (선택) 이라고 표기했지만, 착오를 일으킨 점 죄송합니다.

    딥러닝 사용하셔도 되고, 안하셔도 됩니다.



Q. 각 문제를 따로 따로 해결 (예: (2)에서 제시하는 변수 설명력과 (1)에서 개발한 성능 예측 모델과는 무관해도 된다)해도 되나요?

 -> 따로따로 하셔도 되고, 문제 순대로 진행하시면서, 문제 간의 인사이트가 발견하면, 그 인사이트를 제시하는 것도 좋을 거 같습니다.



Q. 도메인에 대해서 잘 모르는데 추가적으로 쿨러의 특성에 대한 추가 설명이 필요합니다.

->  아래의 블로그를 참고하시거나, 추가적인 설명은 직접 찾아서 진행해주시길 바랍니다.

  • https://m.blog.naver.com/leeho099/50137705512



Q. 2번 문제 분석 결과 데이터 제출 방법

 -> 각 공유폴더 result 에 yymmdd 폴더 생성 후 팀명_yymmdd.csv로 저장 (양식은 sample_submission.csv 참고)



Q. 분석 파일 / 폴더 제출 방법

 -> 각 문항 풀이를 기준으로 test_1, test_2, test_3 이름으로 파일 저장

 -> 패키지의 경우 폴더명을 test_1, test_2, test_3 으로 하여 저장 



Q. (변수명)모델 에 대해서 추가적인 정보를 얻을 수 있나요?

-> 현재 제공해드린 데이터는 기업에서 제공해드린 데이터 전부입니다.