분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 행동 데이터 분석 인공지능 AI 경진대회
어떻게 전처리하고 계시나요?
이 대회는 전처리부터 많은 시간이 들 것 같은데 어떻게 전처리하고 계신가요 ?
저는 game_id 한 경기의 데이터를 하나의 데이터로 압축시켜 전처리를 하였습니다.
테란 VS 테란
테란 VS 저그
테란 VS 프로토스
프로토스 VS 프로토스
프로토스 VS 저그
저그 VS 저그
이런식으로 종족 대전별 데이터를 만들어볼까도 생각중입니다.
참여하시는 분들은 어떤식으로 전처리 중이신지 궁금합니다.
저도 event_content의 내용들을 컬럼으로 하여 데이터를 만들었습니다!!
데이터가 많긴하네요 ㅠㅠ 정리되어 있는것 보단 전처리 공부도 하고 좋네요 하하 ...
경기당 데이터 갯수가 다른데 어떻게 인풋을 맞춰줘야 될지 힘드네영..
가장 쉬운 방법은 분단위 데이터 합산 이런거긴한데 결국 데이터 손실이 발생하네요 '~'
테란 저그 프로토스에서 중복되는 빌드나 유닛은 합치는데 별로 소용이 없네요
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
어떻게 하나의 데이터로 압축시키셨는지 알 수 있을까요? 저는 우선 event_content를 build, attack 같은 용어들로 나누는 중인데, 데이터가 너무 많아서 힘드네요.