월간 데이콘 행동 데이터 분석 인공지능 AI 경진대회

어떻게 전처리하고 계시나요?

2020.03.05 16:46 4,184 Views

이 대회는 전처리부터 많은 시간이 들 것 같은데 어떻게 전처리하고 계신가요 ?


저는 game_id 한 경기의 데이터를 하나의 데이터로 압축시켜 전처리를 하였습니다.


테란 VS 테란

테란 VS 저그

테란 VS 프로토스

프로토스 VS 프로토스

프로토스 VS 저그

저그 VS 저그


이런식으로 종족 대전별 데이터를 만들어볼까도 생각중입니다.



참여하시는 분들은 어떤식으로 전처리 중이신지 궁금합니다.

로그인이 필요합니다
0 / 1000
숨은물건찾기최고기록은엄마
2020.03.05 21:58

어떻게 하나의 데이터로 압축시키셨는지 알 수 있을까요? 저는 우선 event_content를 build, attack 같은 용어들로 나누는 중인데, 데이터가 너무 많아서 힘드네요. 

최정명
2020.03.06 04:50

저도 event_content의 내용들을 컬럼으로 하여 데이터를 만들었습니다!!
데이터가 많긴하네요 ㅠㅠ 정리되어 있는것 보단 전처리 공부도 하고 좋네요 하하 ...

elbicuderri
2020.03.06 13:09

경기당 데이터 갯수가 다른데 어떻게 인풋을 맞춰줘야 될지 힘드네영..

GoldBar
2020.03.06 18:03

가장 쉬운 방법은 분단위 데이터 합산 이런거긴한데 결국 데이터 손실이 발생하네요 '~'

데아트
2020.03.08 21:41

테란 저그 프로토스에서 중복되는 빌드나 유닛은 합치는데 별로 소용이 없네요