분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
케이투더알투터엑스 - 코스닥 상장 기업의 한계기업 분류 및 예측 -재무비율과 거시경제 지표를 활용하여-
공동작성자
안녕하세요. 케이 투더 알 투터 엑스 팀입니다.
저희가 선정한 주제는 바로 '기업 재무비율과 거시경제 지표를 활용한 코스닥 상장 기업의 한계기업 분류 및 예측'입니다.
한국거래소 시장감시위원회는 투기적이거나 불공정거래의 개연성이 있는 종목을 사전에 감지하고 투자자에게 알리는 역할을 수행합니다.
2022년 국내 상장기업 중 한계기업의 비중은 18.9%로, 이들은 정상기업에 비하여 불공정거래 등으로 인한 건전한 자본시장 운영과 투자자 보호를 저해할 확률이 높습니다.
따라서 저희는 한계기업을 정상기업과 분류하고 사전에 예측할 수 있는 최적 모형과 주요 변수를 도출해냄으로써 개인투자자들에게 도움을 주고자 본 주제를 선정하게 되었습니다.
그러나 현재 공공데이터 중에서 한계기업을 정의하고 예측하는 데 필요한 데이터셋이 존재하지 않기 때문에, 저희는 다수의 공공데이터 사이트에서 데이터를 수집해 새로운 데이터셋을 구축하고 전처리 과정을 거쳤습니다.
구체적인 과정은 다음과 같습니다.
1. 한국거래소 정보데이터포털, 전자공시시스템(DART), FnGuide, e-나라지표에서 데이터를 수집.
2. '이자보상비율이 3년 연속 1 미만'인 기업을 한계기업으로 정의하고 '1', 정상기업을 '0'으로 라벨링(labeling) 하여 데이터셋을 구축.
3. 21개의 재무비율과 8개의 거시경제 지표를 각 연도별로 다양한 모델에 투입.
4. 각 모형의 성능 검증을 위해 혼동행렬(confusion matrix)과 ROC Curve를 작성.
추후 발전시킬 방향은 다음과 같습니다.
1. 2019년, 2020년, 2021년 재무비율과 거시경제 지표로 2022년도 한계기업을 분류 및 예측(T+1).
2. T+2, T+3...T+N년도 분류 및 예측 방안 고안.
3. 기타 다양한 모델링, 서비스-비즈니스 아이디어 고안.
https://drive.google.com/drive/folders/1iJS-FG-TvNbISUcBNWg_iIXZ23Rx-LmG?usp=sharing
좋은 정보 감사합니다 ^___^
감사합니다:)
설명란에 오타 같습니다.
ROC curve를 계산하기 위해서는 CM이 필요 하신거 같습니다.
혼동행렬 : Confusion Matrix
교차검증 : Cross Validation
감사합니다 :) 오타 수정 완료했습니다.
좋은 정보 감사합니다
좋은 말씀 감사합니다:)
좋은 아이디어인거 같습니다 ~ 화이팅입니다. 흐에 !
아이고 함장님 응원 감사합니다 ㅠㅠ,, 이이잉~ 기모링,,
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다