월간 데이콘 반도체 박막 두께 분석 경진대회

알고리즘 | 정형 | 회귀 | 산업 | MAE

  • moneyIcon Prize : 83만원
  • 1,600명 마감

 

Adversarial Validation

2020.01.28 16:52 7,949 Views language

캐글에서 자주 활용되는 adversarial validation을 한 번 적용 해봤습니다.
train과 test셋의 분포가 거의 동일할 것이라고 생각했는데 결과가 이를 뒷받침 해주는 것 같습니다.
이미지 첨부가 안되니까 너무 불편하네요.. auc 값은 0.53 정도 나옵니다.
참조 - https://www.kaggle.com/tunguz/elo-adversarial-validation

Code
로그인이 필요합니다
0 / 1000
최정명
2020.01.28 17:40

0.5 에 가까울수록 train 과 test의 데이터가 비슷한 것이겠죠 ? 

ChrisYang
2020.01.28 17:50

0.5가 랜덤으로 예측했다는 뜻이니 맞습니다

당쇠
2020.01.28 21:39

위처럼 해주시면 복사 붙여 넣기가 편할것 같은데요. 불편하신가 봅니다.

DACONIO
2020.01.29 00:35

ipynb 쥬피터 셀 실행 결과물 까지 올릴 수 있습니다. 다만 2mb 이하만 가능합니다. 감사합니다.

ChrisYang
2020.01.29 00:57

셀 실행 결과물은 어떻게 올릴 수 있는지요?

DACONIO
2020.01.29 10:01

셀 실행 결과물은 output이 있는 ipynb 파일을 그대로 올리시면 됩니다.
ipynb output에 그림이 첨부되 있는 경우 그림이 함께 올라갑니다.
예) https://dacon.io/competitions/official/235554/codeshare/581

ChrisYang
2020.01.29 13:39

캐글에서 실행한 노트북 파일을 그대로 첨부했던것 같은데 이런 경우에는 적용이 안되기도 하나요?

DACONIO
2020.01.29 18:00

그렇지는 않습니다. 캐글에서 실행한 노트북 파일도 output이 있으면 output이 함께 올라갑니다.
이 경우 첫 번째 셀에 In [12] 로 되어 있고 그 다음 셀 부터는 In []으로 되어 있는 것으로 보아 
첫 번째 셀이 12번째로 실행 되었고 그 다음 셀부터는 실행이 안된 것 같습니다.

DACONIO
2020.01.29 18:00

아직은 노트북을 실행하는 기능이 없고 output이 있는 경우 output을 보여주는 형식이라 이렇게 보이는 것 같습니다.
전체 실행 된 결과파일을 올리시면 gc.collect() 의 실행 결과가 출력된 것을 확인하실 수 있을 것 입니다.
소중한 자료 감사드립니다.

ChrisYang
2020.01.30 00:38

답변 감사합니다.