시스템 품질 변화로 인한 사용자 불편 예지 AI 경진대회

정형데이터는 AutoML부터 돌려보자! (팀원 구합니다)

2021.01.06 14:43 11,483 조회 language

베이스라인에서 정형화 시킨 데이터로 AutoML을 돌려보았습니다.

간단하지만 model selection&ensemble이 편리하면서 강력해서 베이스라인보다는 0.1정도 올라간 것을 볼 수 있습니다.

Background Knowledge와 feature extraction, selection이 중요할 것 같네요!

같이 공부하며 참가하실 팀원 구합니다!

제 이력이며 https://www.rocketpunch.com/@yjunwoo14 

- 마감되었습니다! 많은 연락 감사드립니다-
-------------------------------------------------------------------------------------------------------------------------------------------------
 코드 업데이트 하였고 코랩 기준 이상 없음을 확인하였습니다

코드
로그인이 필요합니다
0 / 1000
겨울제비
2021.01.06 18:49

#pycaret에서는 score이 label을 맞출 확률이기때문에 output을 제출 양식에 맞게 바꿔줍니다
x = []
for i in range(len(predictions['Score'])):
  if predictions['Label'][i] =='1.0':
    x.append(predictions['Score'][i])
  else:
    x.append(1-predictions['Score'][i])

이 코드를 실행하면 점수가 엄청 낮게 나오는데 수정이 필요해보입니다!

Jay 윤
2021.01.06 19:02

pycaret prediction에서 Label은 '0', '1', 'Score'은 Label을 맞출 확률이기에 저렇게 계산했습니다!
제가 이 코드로 제출을 하여 점수가 정상적이였는데 혹시 다른 곳에서 문제 생겼지 않을까요?

dnwk
2021.01.06 19:58

저도 점수가 엄청 낮게 나와서 그냥 Score 값 그대로 쓰니까 제대로 나왔습니다!

Jay 윤
2021.01.06 20:17

뭔가 착오가 있었던 것 같네요! 오늘 제출 횟수가 다 되어서 확인을 못했는데 감사합니다 :)

TG
2021.01.07 08:59

if predictions['Label'][i] =='1.0': 
이 조건문에서 문제가 발생한거 같습니다. 
str 형태가 아니라 float형태인데 str 형태로 조건문이 작성되어 else 조건으로 빠지는거 같네요 ㅎㅎ

Jay 윤
2021.01.07 15:35

predictions['Label']은 str형태가 맞아 그 부분에서는 이상 없었습니다. 아마 출력이 다른 건 pyrcaret이나 다른 라이버리 버전 문제일 수도 있겠네요

TG
2021.01.08 16:23

아 그러네요. else문으로 계속 빠지길래 조건 문제인가 했는데..  ㅎㅎ

Jay 윤
2021.01.08 21:40

간단히 ensemble해보기엔 automl같이 편한 게 없는 거 같아요! ㅎㅎㅎ

Jay 윤
2021.01.06 19:02

삭제된 댓글입니다

durro
2021.01.09 16:27

삭제된 댓글입니다

durro
2021.01.09 17:05

안녕하세요 ! 좋은 코드 공유 감사합니다. 저는 colab을 사용하지 않아서 sklearn 버젼이 달라서 처음에 오류가 났습니다.
다른 분들도 참고 하시면 좋을 것 같습니다. ! 

Jay 윤
2021.01.13 01:17

알려주셔서 감사드립니다 :)

데아트
2021.01.27 20:26

AutoML에 대해서 배웠습니다. 좋은 글 감사합니다.