AI프렌즈 시즌 공공 데이터 활용 온도 추정 AI 경진대회

알고리즘 | 정형 | 회귀 | 기상 | MSE

  • moneyIcon 상금 : 총 250만원
  • 1,593명 마감

 

기상캐스터 잔나의 데이터를 만지는 5가지 꿀팁

2020.03.12 01:04 6,704 조회 language

기상캐스터잔나  [데이콘의 협곡에서 잔나가 생방송으로 전해드립니다. 스튜디오 나와주세요]
스튜디오              [네 스튜디오입니다. 현장 코드 상황은 어떠한가요?]
기상캐스터잔나  [현재, 공유된 꿀팁으로 아군의 예측률이 상승할 것으로 예상됩니다.]
스튜디오              [더 좋은 꿀팁 있으면서 잔나가 숨기고 있다는 소문이 있습니다. 어떻게 생각하시나요?]
기상캐스터잔나  [잔나의 코드 정보는 믿고 안심하셔도 좋습니다. 믿으시라니까요 ~! 칫!]

럭스                       [전략적인 선택이군요 소환사님, 추천은 누르셨나요 ?]

코드
로그인이 필요합니다
0 / 1000
제루스챈스
2020.03.12 11:09

공유 감사합니다. 참여버튼만누르는사람이지만 추천버튼도 누르고 갑니다.

26
2020.03.12 21:20

아리스토텔레스 -  시작이 반이다.  모든 인간은 태어나는 순간부터 참여하고자 하는 욕망을 갖고 있다.
26 - 추천 감사합니다.

분석하고시퍼용
2020.03.12 11:12

안녕하세요 쉽고 간략하게 설명해주셔서 감사합니다~참고가 많이 되네요. 표준화부분에서 scikit-learn을 사용하면 더 간편하게 계산할 수 있을 것 같아요!
from sklearn.preprocessing import StandardScaler 등 여러가지 모듈이 있으니 다른 분들도 참고가 될까하여 댓글 남겨봅니다...!

26
2020.03.12 21:19

안녕하세요 . 말씀해주신 sklearn 패키지에 대한 설명 추가하였습니다. 함수를 직접 만드는 것과 스케일러를 사용하는 것은 각각 장단점이 있으므로 다른 분들도 고려하셨으면 좋겠습니다.  감사합니다. 

호구너
2020.03.12 21:28

컨셉, 코드, 정보  와  데이콘을 뒤집어 놓으셨다! ㅋㅋ
시간변수는 가장 유용한 정보죠 ㅋㅋ
깔끔한 코드 감사합니다~

26
2020.03.13 09:59

제드 - 보이지 않는 시간이 가장 무서운 법이지
26 - 추천 감사합니다.

홍재권
2020.03.13 11:05

데이터 제공할때 10분 단위라고 했는데,  그럼 6분 단위의 데이터 인건가요?

26
2020.03.13 13:06

1일 = 24시간 = 1440분 = 144 행
3일 = 72시간 = 4320분 = 432 행
30일 = 720시간 = 43200분 = 4320 행
train = 33일 = 792시간 = 47520분 = 4752 행 
입니다.

홍재권
2020.03.13 13:32

아 제가 순간 잘못계산했네요 죄송합니다^^

26
2020.03.14 10:29

죄송하다뇨 ㅎ 6분단위로 잘라서 모델 성능을 올릴 수 있다면 잘라야죠 ㅎ
추천 감사합니다.

홍재권
2020.03.13 13:35

삼각함수 변환시 pi 보가 2*pi로 혀면 연속함수가 되어서 보기 좋을것 같습니다..
제 개인적인 의견..

26
2020.03.14 10:32

시간 데이터를 연속형변수로 만드는 작업을 팁으로 드렸습니다. 
연속함수로 만들 지 않은 이유는 제 선택이었습니다. ㅎ
시간 변수를 만들 때는 주로 3가지 방법이 있습니다.
Pi/2 사용 = 삼각함수 주기의 1/4 사용
Pi     사용 = 삼각함수 주기의 1/2 사용
2*Pi 사용 = 삼각함수 주기의 1 사용
이중 EDA 해보시고 좋은 것을 골라 쓰시면 좋을 것 같습니다.

Junho.PARK
2020.03.14 09:36

좋은글 감사합니다. 그런데 추천버튼은 어디에 있나요?

26
2020.03.14 10:28

코드 공유 목록 
코드 공유 제목 왼쪽 녹색버튼 누르시면 1이 올라갑니다!
감사합니다. 

haspberry
2020.03.16 11:16

temperature_name = ["X00","X07","X28","X31","X32"] #기압

변수명은 temperature 이라고 적혀있는데 주석에는 기압이라고 적혀있네요!! 오타인것같아요!!

좋은자료감사합니다!! 큰 도움 되었습니다.

26
2020.03.17 23:07

오타 찾아주셔서 감사합니다!

도움이 되신다니 다행입니다.

Raywon
2020.03.16 18:33

좋은자료감사합니다.
혹시  표준화식에서 

def standardization:
        norm = ~~~ 
이부분에서  norm은 노멀리제이션(정규화)을 표현하신건가요?? 
혹시 표준화식이라고 하셨는데 따로 norm이라고 변수를 설정하신부분에대해서 이유를 알수있을까요?
추천 꾹 누르고기다립니다!

26
2020.03.17 23:23

영어 사전에  표준을 검색하면 standard와 norm이 나오는데,
 standard deviation을 이미 std로 적어서.. 짧은 norm으로 사용했습니다.

norm1, norm2 랑도 햇갈리실 수있으시겠지만.. 
standardized_data은 너무 길어서 사용했습니다. 귀찮쓰..
normalization과 혼동되신다면.. 기억에 남으실 수 있도록
Standardization 표준화는  평균을 0 표준편차를 1로 변환하는 것.
Normalization은 범위를 변환하여 분포를 조정하는 방법이라고 말씀 드립니다

Raywon
2020.03.16 18:33

좋은자료감사합니다.
혹시  표준화식에서 

def standardization:
        norm = ~~~ 
이부분에서  norm은 노멀리제이션(정규화)을 표현하신건가요?? 
혹시 표준화식이라고 하셨는데 따로 norm이라고 변수를 설정하신부분에대해서 이유를 알수있을까요?
추천 꾹 누르고기다립니다!

26
2020.03.17 23:23

영어 사전에  표준을 검색하면 standard와 norm이 나오는데,
 standard deviation을 이미 std로 적어서.. 짧은 norm으로 사용했습니다.

norm1, norm2 랑도 햇갈리실 수있으시겠지만.. 
standardized_data은 너무 길어서 사용했습니다. 귀찮쓰..
normalization과 혼동되신다면.. 기억에 남으실 수 있도록
Standardization 표준화는  평균을 0 표준편차를 1로 변환하는 것.
Normalization은 범위를 변환하여 분포를 조정하는 방법이라고 말씀 드립니다

bigbro
2020.03.20 14:41

재밌게 잘 정리해주셨네요. 명적 드립니다 ㅋㅋ

26
2020.03.21 16:03

질리언 - 그리할줄 알고 있엇소

초보DS
2020.03.24 09:36

추천 버튼 겨우겨우 찾아서 눌렀네요 ^^
너무 많이 배웠네요~
감사합니다.

26
2020.03.27 09:08

26 - 감사합니다.

🇰🇷🇹🇼🇳🇮🇬🇺🇳🇫
2021.09.16 11:43

삭제된 댓글입니다