제1회 KRX 금융 빅데이터 활용 아이디어 경진대회

알고리즘 | 정형 | 회귀 | 금융 | 정성평가

  • moneyIcon 상금 : 총 2,000만원
  • 837명 마감
마감

 

케이투더알투터엑스 - 코스닥 상장 기업의 한계기업 분류 및 예측 -재무비율과 거시경제 지표를 활용하여-

공동작성자

stroke
2022.07.13 22:56 2,573 조회 language

안녕하세요. 케이 투더 알 투터 엑스 팀입니다.

저희가 선정한 주제는 바로 '기업 재무비율과 거시경제 지표를 활용한 코스닥 상장 기업의 한계기업 분류 및 예측'입니다.
한국거래소 시장감시위원회는 투기적이거나 불공정거래의 개연성이 있는 종목을 사전에 감지하고 투자자에게 알리는 역할을 수행합니다. 
2022년 국내 상장기업 중 한계기업의 비중은 18.9%로, 이들은 정상기업에 비하여 불공정거래 등으로 인한 건전한 자본시장 운영과 투자자 보호를 저해할 확률이 높습니다.
따라서 저희는 한계기업을 정상기업과 분류하고 사전에 예측할 수 있는 최적 모형과 주요 변수를 도출해냄으로써 개인투자자들에게 도움을 주고자 본 주제를 선정하게 되었습니다.

그러나 현재 공공데이터 중에서 한계기업을 정의하고 예측하는 데 필요한 데이터셋이 존재하지 않기 때문에, 저희는 다수의 공공데이터 사이트에서 데이터를 수집해 새로운 데이터셋을 구축하고 전처리 과정을 거쳤습니다.

구체적인 과정은 다음과 같습니다.

1. 한국거래소 정보데이터포털, 전자공시시스템(DART), FnGuide,  e-나라지표에서 데이터를 수집.
2. '이자보상비율이 3년 연속 1 미만'인 기업을 한계기업으로 정의하고 '1', 정상기업을 '0'으로 라벨링(labeling) 하여 데이터셋을 구축.
3. 21개의 재무비율과 8개의 거시경제 지표를 각 연도별로 다양한 모델에 투입.
4. 각 모형의 성능 검증을 위해 혼동행렬(confusion matrix)과 ROC Curve를 작성.

추후 발전시킬 방향은 다음과 같습니다.

1. 2019년, 2020년, 2021년 재무비율과 거시경제 지표로 2022년도 한계기업을 분류 및 예측(T+1).
2. T+2, T+3...T+N년도 분류 및 예측 방안 고안.
3. 기타 다양한 모델링, 서비스-비즈니스 아이디어 고안.

https://drive.google.com/drive/folders/1iJS-FG-TvNbISUcBNWg_iIXZ23Rx-LmG?usp=sharing

PDF
코드
로그인이 필요합니다
0 / 1000
minmarch
2022.07.14 09:17

삭제된 댓글입니다

minmarch
2022.07.14 09:17

좋은 정보 감사합니다 ^___^

으어드리대
2022.07.16 11:30

감사합니다:)

검은짱돌의계략
2022.07.15 22:08

설명란에 오타 같습니다.
ROC curve를 계산하기 위해서는 CM이 필요 하신거 같습니다.
혼동행렬 : Confusion Matrix
교차검증 : Cross Validation

으어드리대
2022.07.16 11:30

감사합니다 :) 오타 수정 완료했습니다.

프로페셔X
2022.07.18 15:09

좋은 정보 감사합니다 

으어드리대
2022.07.18 15:22

좋은 말씀 감사합니다:)

hamjang
2022.07.18 23:56

좋은 아이디어인거 같습니다 ~ 화이팅입니다. 흐에 !

으어드리대
2022.07.19 00:08

아이고 함장님 응원 감사합니다 ㅠㅠ,, 이이잉~ 기모링,,

이전 글
R 코드 업로드 방법
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 2
조회 1,883
댓글 1
2년 전
현재 글
케이투더알투터엑스 - 코스닥 상장 기업의 한계기업 분류 및 예측 -재무비율과 거시경제 지표를 활용하여-
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 74
조회 2,573
댓글 8
2년 전
다음 글
토픽모델링과 토픽트렌드를 활용한 LSTM 딥러닝 정확도 개선
대회 - 제1회 KRX 금융 빅데이터 활용 아이디어 경진대회
좋아요 31
조회 3,787
댓글 6
2년 전