정형데이터는 AutoML부터 돌려보자! (팀원 구합니다) - DACON

[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁

[신규 오픈 기념] 데이스쿨 최대 40% 할인 🎁

시스템 품질 변화로 인한 사용자 불편 예지 AI 경진대회

정형데이터는 AutoML부터 돌려보자! (팀원 구합니다)

2021.01.06 14:43 11,483 조회 language

language

베이스라인에서 정형화 시킨 데이터로 AutoML을 돌려보았습니다.

간단하지만 model selection&ensemble이 편리하면서 강력해서 베이스라인보다는 0.1정도 올라간 것을 볼 수 있습니다.

Background Knowledge와 feature extraction, selection이 중요할 것 같네요!

같이 공부하며 참가하실 팀원 구합니다!

제 이력이며 https://www.rocketpunch.com/@yjunwoo14

- 마감되었습니다! 많은 연락 감사드립니다-
-------------------------------------------------------------------------------------------------------------------------------------------------
코드 업데이트 하였고 코랩 기준 이상 없음을 확인하였습니다

코드

로그인이 필요합니다

comment

0 / 1000

겨울제비

2021.01.06 18:49

#pycaret에서는 score이 label을 맞출 확률이기때문에 output을 제출 양식에 맞게 바꿔줍니다
x = []
for i in range(len(predictions['Score'])):
  if predictions['Label'][i] =='1.0':
    x.append(predictions['Score'][i])
  else:
    x.append(1-predictions['Score'][i])

이 코드를 실행하면 점수가 엄청 낮게 나오는데 수정이 필요해보입니다!

Jay 윤

2021.01.06 19:02

pycaret prediction에서 Label은 '0', '1', 'Score'은 Label을 맞출 확률이기에 저렇게 계산했습니다!
제가 이 코드로 제출을 하여 점수가 정상적이였는데 혹시 다른 곳에서 문제 생겼지 않을까요?

dnwk

2021.01.06 19:58

저도 점수가 엄청 낮게 나와서 그냥 Score 값 그대로 쓰니까 제대로 나왔습니다!

Jay 윤

2021.01.06 20:17

뭔가 착오가 있었던 것 같네요! 오늘 제출 횟수가 다 되어서 확인을 못했는데 감사합니다 :)

TG

2021.01.07 08:59

if predictions['Label'][i] =='1.0':
이 조건문에서 문제가 발생한거 같습니다.
str 형태가 아니라 float형태인데 str 형태로 조건문이 작성되어 else 조건으로 빠지는거 같네요 ㅎㅎ

Jay 윤

2021.01.07 15:35

predictions['Label']은 str형태가 맞아 그 부분에서는 이상 없었습니다. 아마 출력이 다른 건 pyrcaret이나 다른 라이버리 버전 문제일 수도 있겠네요

TG

2021.01.08 16:23

아 그러네요. else문으로 계속 빠지길래 조건 문제인가 했는데.. ㅎㅎ

Jay 윤

2021.01.08 21:40

간단히 ensemble해보기엔 automl같이 편한 게 없는 거 같아요! ㅎㅎㅎ

Jay 윤

2021.01.06 19:02

삭제된 댓글입니다

durro

2021.01.09 16:27

삭제된 댓글입니다

durro

2021.01.09 17:05

안녕하세요 ! 좋은 코드 공유 감사합니다. 저는 colab을 사용하지 않아서 sklearn 버젼이 달라서 처음에 오류가 났습니다.
다른 분들도 참고 하시면 좋을 것 같습니다. !

Jay 윤

2021.01.13 01:17

알려주셔서 감사드립니다 :)

데아트

2021.01.27 20:26

AutoML에 대해서 배웠습니다. 좋은 글 감사합니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

to_list

랜덤포레스트를 이용한 baseline

대회 - 태양광 발전량 예측 AI 경진대회

현재 글

정형데이터는 AutoML부터 돌려보자! (팀원 구합니다)

대회 - 시스템 품질 변화로 인한 사용자 불편 예지 AI 경진대회

좋아요 32

조회 11,483

댓글 11

3년 전

월간 데이콘 시각화

대회 - 월간 데이콘 2020 D CUP Google Analytics 데이터 경진대회