월간 데이콘 반도체 박막 두께 분석 경진대회

알고리즘 | 정형 | 회귀 | 산업 | MAE

상금 : 83만원
1,560명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[1등][Context_KKP] Skipconnection MLP with Ensemble

JunhwaKim

2020.02.04 22:43 11,434 조회 language

코드

댓글 18개

로그인이 필요합니다

comment

0 / 1000

최정명

2020.02.07 02:34

다른 토론창에서 모델의 복잡성을 증가시킨다고 했을 때 어떤식으로 한다는거지 ? 했는데 과정들을 보니까 정말 배울것이 많네요!!
UP-block, Down-block 그리고 skip connection 까지 제가 모르는 것 천지네요 ㅠㅠ

궁금한게LayerNorm(10000) 부분은 어떤 역할을 하는지 궁금합니다.
그리고 Nh = Ns/(a * (Ni + No)) 이렇게 node수를 설정하는 방법은 어떤 키워드로 검색해야 볼 수 있을까요 ?

JunhwaKim

2020.02.07 03:06

Layer Norm은 batch norm을 변형하여 입력 데이터의 평균과 분산을 이용해 학습의 수렴속도를 향상에 도움을 주는 효과를 가지고 있습니다. https://arxiv.org/pdf/1607.06450.pdf 관련 논문 첨부드려요.

JunhwaKim

2020.02.07 03:06

그리고 Nh = Ns ... 이 수식은 https://stats.stackexchange.com/questions/181/how-to-choose-the-number-of-hidden-layers-and-nodes-in-a-feedforward-neural-netw 이 사이트 참고해주세요. 제가 검색한 키워드는 mlp number of hidden nodes 입니다.

JunhwaKim

2020.02.07 03:07

하지만 실험 결과 저 공식이 항상 정답은 아닌 것 같습니다!

최정명

2020.02.07 10:54

감사합니다.
수식부분은 처음 base로 잡을 때 한 번 써보려고 합니다.
layer norm 관련 논문 첨부까지 정말 감사합니다.

Cardy

2020.02.09 20:10

위의 코드에 LayerNorm class를 따로 만들어서 입력차원에 맞게 feature의 Normalization을 수행합니다. upblock4를 보시면 feature를 10000까지 늘렸기 때문에 이 feature에 대한 normalization을 사용하였습니다. (LayerNorm(10000)) 추가로 정보가 도움이 되셨길 바랍니다.

최정명

2020.02.10 16:22

감사합니다. 많은 도움 되었습니다.