신한AI, 보다 나은 금융 생활을 위한 AI 서비스 아이디어 경진대회

아이디어 | 금융 | AI | 서비스 | 플랫폼 | 알고리즘 | 정성평가

  • moneyIcon 상금 : 500만원
  • 1,285명 마감

 

아이디어 관련 창의성에 의문을 제기합니다.

2023.05.13 23:44 2,156 조회

안녕하십니까. 


진행 중인 대회 리더보드에 게시되어있는 아이디어에 의문점이 생겨 문의하고자 합니다.


저는 저의 주요 관심사 및 아이디어인 리츠를 가지고 이번 대회에 참가를 고민하고 있던 사람이었습니다. 

하지만 이에 과거 데이콘 리더보드를 참고하던 중, 작년 한국거래소 금융 빅데이터 공모전에 다른팀이 제출하여 수상까지한 아이디어와 유사하여 다음 대회를 기약하였습니다.


대회에 대한 관심으로 현재 게시되어있는 리더보드를 확인해보니 리츠를 아이템으로 대회에 참가한 팀이 있어 살펴보았습니다.


작년 수상팀과 

1) 리츠의 정보시스템을 제안한 점

2) 아이디어 접근 방식이 유사한 점

3) 주가지수에 부동산 심리지수를 반영하였다는 점

까지 아이디어가 너무 일치한 작품이 10등안에 들어와있다는 것을 확인할 수 있었습니다.


같은 플랫폼에 작년 수상작과 아이디어가 거의 유사한 작품이 다시 등장하는 것이 과연 타당한지 의문이 듭니다.


이는 본 플랫폼과 공모전의 미래에 악영향을 미칠 우려가 있다고 생각합니다.


작년 수상작 링크입니다.

https://dacon.io/competitions/official/235914/codeshare/5733


감사합니다.

로그인이 필요합니다
0 / 1000
ssong1205
2023.05.14 01:46

안녕하세요 경제맛쿠키님.
이번 신한AI 대회에서 리츠 투자 플랫폼 'SAR' 아이디어를 제안한 영앤리츠팀입니다.
먼저 저희의 주제에 대해 관심을 가져주셔서 감사의 말씀을 드립니다.
저희 팀도 경제맛쿠키님처럼 리츠에 대한 지속적이고 많은 관심을 가지고 있었습니다.

경제맛쿠키님께서 언급해주신 내용에 대해 답변드리겠습니다.

저희는 ‘초고령 시대 은퇴 설계의 중요성’을 아이디어의 주된 방향성으로 두고 아이디어 구체화를 진행하였습니다. 
고령화 시대에 인컴형 자산을 통한 은퇴 설계 니즈가 증가하면서 상장 리츠가 인컴형 자산으로서 가진 장점에 집중하였습니다.
따라서 저희는 AI 기반 주가 등락 예측 모형을 통해 추천 리츠를 1일 뒤, 1주 뒤, 1달 뒤 기준으로 제공하는 상장 리츠 주가 등락 예측 모형과 리츠에 대한 세부적인 정보를 담은 대시보드를 제안하였습니다.

먼저 상장 리츠 주가 등락 예측 모형에 대하여 기존 아이디어와의 차별점에 대해 말씀드리겠습니다.

현재 구글 스칼라에서도 주가 등락 예측을 검색하면 많은 결과가 나오는 것을 확인할 수 있듯이 주가 등락 예측 모형은 흔하게 볼 수 있습니다. 

하지만 해당 모형에서 어떤 전처리 방식(Winsorization, NA 값 처리)을 선택하여 전처리를 진행했는지, 종속변수를 어떻게 설정했는지, 어떤 변수 카테고리로 독립변수를 추출하고, 어떤 방식(GLM 기반, 정규성 검정, 다중공선성 등)으로 독립변수를 선정하는 지, 어떤 알고리즘을 사용하여 해당 모형을 구성하느냐에 따라 분명한 차이가 있다고 생각합니다.

저희 팀은 리츠는 일반 주식과는 다르게 주가, 리츠 회사의 재정 상황, 기초 자산의 건전성에 영향을 받는다고 생각했습니다.
따라서 저희는 모델을 구축할 때 주가 데이터, 회계 데이터, 거시경제 데이터, 부동산 뉴스 심리 지수 데이터에서 크게 다음과 같은 변수 카테고리를 추출하였습니다.

ssong1205
2023.05.14 01:46

1. 주가 데이터
- 추세 변수
- 정보비대칭 변수
2. 회계 데이터
- 부채 변수
- 현금 흐름 변수
- 가치 평가 변수
3. 거시경제 데이터
- 금리 변수
- 지수 변수
4. 리츠별 자산 비중을 가중 평균한 뉴스 심리지수

현재 모델의 파라미터를 최적화하고 있으며, 리츠의 특성을 최대한 반영하고자 여러 카테고리의 변수를 빈틈 없이 구성하도록 노력하고 있습니다. 

또한, 최종적인 모형이 아님에도 불구하고 정확도가 0.8159로 비교적 높은 수치로 나오는 것을 확인하실 수 있습니다. 

경제맛쿠키님의 말씀처럼 상장 리츠의 주가 등락을 예측한다는 점에서는 아이디어가 동일하지만 모형에 사용되는 변수, 리츠별로 보유중인 섹터 비중을 가중평균한 부동산 시장 뉴스 심리 지수를 사용했다는 점에서 기존 모형과 충분히 차별점이 있다고 생각합니다.

ssong1205
2023.05.14 01:48

다음으로 대시보드에 대한 차별점에 대해 말씀 드리겠습니다.

저희 팀 제안서의 사례 분석 부분을 참고하시면 에이리츠 사례와 같이 단순히 개인 투자자가 리츠의 주가와 배당수익률만을 보고 투자를 하면 안된다는 사실을 아실 수 있을 겁니다. 따라서 상장 리츠 주가 등락 예측 모형과 더불어 다음과 같은 정보를 SAR 대시보드에서 제공합니다.

1. 리츠 주가에 큰 영향을 미치는 거시 경제 변수
2. 부동산 뉴스 키워드 트리맵 / 섹터별 부동산 뉴스 심리
3. 리츠정보시스템에 자세하게 공시되어 있지 않은 FFO, P/FFO, NOI와 같은 변수를 리츠회사의 재무상태표에 기반하여 직접 산출
4. 개별 리츠에 대한 배당 내역 제공
5. 섹터별 기초자산에 대한 평균 임대현황, 임대율 추이 제공
6. 개별 기초 자산에 대한 교통, 유동인구, 편의시설, 상권과 같은 정보 제공

저희는 이러한 정보를 일반 투자자에게 알기 쉬운 설명으로 제공하여 일반 투자자의 알 권리를 충족시켜주는 서비스를 고안하였고, 이는 리츠 투자에 대한 진입장벽을 낮추고, 리츠 회사와 개인 투자자간의 정보비대칭성을 완화하는 데 차별점이 있다고 생각합니다.

리츠에 관심이 있으시다면 2023. 1. 5. 국토교통부에서 ‘리츠 제도 개선방안’을 발표한 사실을 알고 계실 것이라 생각합니다. 
현재 국가 차원에서도 일반 투자자에 대해 진입 장벽을 낮추기 위해 리츠 정보시스템 개발 필요성을 언급하며 리츠 시장을 활성화를 위한 많은 노력을 하고 있습니다. 

또한, 저희는 고령 인구가 늘어나고 은퇴 설계가 중요해지면서 리츠 상품에 대한 장점을 잘 알고 있습니다. 
하지만 고령층과 젊은 세대가 리츠 투자를 잘 하기에 현재 ‘리츠정보시스템’의 정보가 부실하다는 점에서 리츠 특성을 반영한 리츠 주가 등락 예측 모형과 더불어 리츠 투자에 중요한 정보들을 대시보드 형태로 한 눈에 제공하였습니다. 

저희의 서비스 SAR에 대한 차별점을 보시고 의문이 드는 부분이 있으시다면 질문 부탁드립니다.

감사합니다 :)

영앤리츠팀 드림

신동해
2023.05.14 02:41

뭐지? 싶어서 몇 번째 보고 있는데요.
이건 정말 똑같은데요?
아주 몇 개 다르다고 하시는데 전반적으로 내용이 거의 똑같네요.
심지어 코드 모양도 그렇고요. 어떻게 색상까지 같을 수가 있을까.
카피 다 떠놨습니다. 당당하시다면 지금부터 수정하지 마세요.

ssong1205
2023.05.14 02:51

안녕하세요 신동해님.

코드 모양, 색상 어느 부분이 같다고 생각하시는 지 궁금합니다.

ssong1205
2023.05.14 03:52

안녕하세요 신동해님.

언급해주신 코드 모양에 대해서는 구체적으로 설명해주셔야 저희가 확인할 수 있을 것 같습니다.

그리고 언급해주신 그래프 색상을 확인해본 결과, 모델의 피쳐중요도를 확인하는 부분에서 그래프 색상이 같은 것을 확인할 수 있었습니다. 

저희가 피쳐중요도를 시각화하는 부분에서는 따로 color를 지정하지 않아 default 값인 rainbow 색상으로 출력되어 오해가 있으셨던 것 같습니다.

내용 부분에 대해서는 차별화된 점을 충분히 위에서 언급을 한 거 같습니다.

신동해님께서 똑같다고 생각하시는 코드 모양에 대해 구체적으로 설명해주시면 저희가 자세히 답변드리도록 하겠습니다.

감사합니다.

ssong1205
2023.05.14 05:09

코드 모양에 대해서 언급해주신 부분에 대해 추가적인 답변드리겠습니다.

머신러닝 기법을 통해 예측 모델링을 진행할 때 데이터 수집 -> 데이터 전처리 -> 변수 선정 -> 모델링 -> 결과 분석과 같은 절차는 대부분의 예측 모델링이 유사한 절차를 따른다고 생각합니다.

저희가 어떻게 데이터를 수집하였는지, 어떻게 raw data를 핸들링하였는지, 어떤 카테고리의 변수를 선정하였고 해당 변수에 대한 이상치 처리를 어떤 방식을 이용해서 했는지, 섹터별 뉴스 데이터라도 이를 어떤 방식으로 모형에 활용했는지, 어떤 검정 과정을 거쳤는지, 모델에 대한 하이퍼파라미터는 무엇인지에 대한 내용을 좀 더 집중해서 봐주셨으면 좋겠습니다.

그리고 주가 등락 예측이라도 이를 제안하는 플랫폼 내에서 어떤 방식으로 활용했는지, 개인 투자자들에게 리츠 투자에 필요한 정보들을 요약된 대시보드 형태로 잘 보여줄 수 있는지, 해당 서비스의 비즈니스 모델은 무엇인지에 대한 것도 이번 공모전의 중요한 포인트라고 생각합니다. 

이러한 디테일한 내용을 봐주시지 않고, 코드 모양(?)이 똑같고 seaborn 라이브러리에서 default로 설정되어 있는 그래프 색상을 동일하게 사용했다고 하여 저희가 열심히 준비한 프로젝트가 표절 작품이라고 하시니 저희 입장에서는 당황스러울 뿐입니다.

또한, 현재 주가 등락 말고도 개별 리츠의 배당수익률을 예측하는 모델링을 진행중이니 관심을 갖고 지켜봐주시면 좋을 거 같습니다.

코드 모양에 대해서는 추가적인 질문이 있으시면 답변드리도록 하겠습니다.

감사합니다.

뽀또
2023.05.14 06:01

지나가는 사람입니다. ssong1205님께서 열심히 반박해주시는데, 핀트가 어긋난 것 같아 말씀 올립니다.
영앤리츠팀과 과거 Team_IBA팀의 공모전 내용을 확인해본 결과, 제가 영앤리츠팀에 갖게된 의문에 대해 해명(?)해주시기 바랍니다.

인공지능, 데이터 분석, 금융이 섞인 공모전에서는 무엇보다 1. 문제점 포착 2. 해결책 제안으로 이어지는 빌드업이 무엇보다 중요하다고 생각됩니다.
데이터 전처리, 분석, 사용하는 인공지능 기법은 차이를 두려고 해도 종류가 한정되어 있기 때문이죠.
그런데 가장 중요한 아이디어부터 의문이 듭니다.

의문 1. 아이디어의 차별성?

ssong1205님께서 열심히 적어주신 글을 읽으면서 오히려 의문만 들었습니다.
아이디어의 차별성을 강조하고자 하신다면 Team_IBA팀과 비교하여 자신들의 차별성을 강조하는 것이 정상일 것입니다.
그러나, ssong1205님께서는 단 한 번도 Team_IBA와 비교하는 부분이 없었습니다.

왜 그런지 내용을 확인해보았습니다.

1) 사용한 데이터의 차별성?
Team_IBA팀은 주가데이터, 부동산,데이터, 거시경제 데이터, 부동산 뉴스 심리 지수 데이터를 사용했습니다.
영앤리츠팀은 주가 데이터, 회계 데이터, 거시경제 데이터, 부동산 뉴스 심리 지수 데이터를 사용했습니다.

영앤리츠팀이 Team_IBA팀에 비해 어떤 점이 차별화된 데이터를 사용한 것인지 전혀 파악되지 않습니다.
약 1년이란 시차가 존재하는데, 차이라고는 회계데이터를 사용한 것이 다입니까?

뽀또
2023.05.14 05:56

2) 팀 목표
영앤리츠팀은 "일반 투자자에게 알기 쉬운 설명으로 제공하여 일반 투자자의 알 권리를 충족시켜주는 서비스를 고안하였고, 이는 리츠 투자에 대한 진입장벽을 낮추고, 리츠 회사와 개인 투자자간의 정보비대칭성을 완화하는 데 차별점이 있다고 생각합니다."
라고 말씀하셨죠?

Team_IBA팀은 리츠시장에 대한 전반적인 투자 이해도 제고 등 리츠시장에 대한 정보가 부족하거나 잘 모르는 투자자들을 위한 정보시스템을 제공한다는 점에서 
말만 다르지 어느 점이 얼마나 다른 아이디어인지 감이 안옵니다.
둘 다 동일하게 리츠시장에 대한 정보가 부족한 사람들에게 정보를 보기 좋은 대시보드 형태로 제공하겠다고 했습니다.
차이점은 약 1년의 시차가 존재한다는 것이지요.

제가 이해력이 부족한 것 일까요?

뽀또
2023.05.14 06:27

의문 2. ssong1205님은 Team_IBA팀의 리츠 관련 작품의 존재를 전혀 몰랐는가?

1) DACON 검색창에 '리츠'를 검색하면 단 3개의 코드공유가 뜨는데 ssong1205님이 속한 영앤리츠팀, 작년 KRX 공모전 Team_IBA팀, 그리고 종합 투자대회에 리츠라는 단어가 언급된 코드공유 단 3개 입니다.
공모전을 준비하면서 본인의 아이디어가 과거에 쓰였는지 검색 안해봤을리는 없겠죠?

2) 만약 검색하지 않으셨다고 해도, ssong1205님은 과거 KRX 금융빅데이터 활용 아이디어 경진대회에 'Micro A.N.T'팀으로 참가하였고, 리더보드 12등을 달성해 상위 20팀에 속했습니다.
그리고 수상팀 Team_IBA팀은 리더보드 14등 했습니다. 
 "🤝 부동산과 주식의 만남, 부동산 뉴스심리와 주식정보를 결합한 상장리츠 등락 예측모형 개발"으로 리츠가 주제라는 것이 제목에 확실하게 드러나게 말이죠.
https://dacon.io/competitions/official/235914/codeshare/5693

동일한 공모전에 참여한 이력이 있고, 제목부터 '리츠'가 적혀있는 Team_IBA팀의 작품을 보지 못했을 확률은 얼마나 될까요? 
본인의 아이디어에 대한 사전조사가 부족했을까요? 양심이 부족했을까요?

뽀또
2023.05.14 06:21

1년전 본인이 참가했던 대회의 수상작과 매우매우매우비슷한(제 생각입니다) 아이디어로 프로젝트를 진행하고,
작성일 기준 단 2일전 업로드해서 투표수:76 리더보드 점수: 66.7점을 받았다는 것도 앞서 공정한 평가에 대한 의문을 제시한 글이 한 번 더 생각나게 하는군요.

그래도 정말정말정말 Team_IBA의 존재를 몰랐고, 본인들의 아이디어가 차별성이 있다고 생각하신다면, 뭐...그런거겠죠?

이상 제 생각이었습니다.

ssong1205
2023.05.14 10:33

안녕하세요 뽀또님, 영앤리츠팀입니다.
저의 글을 통해 뽀또님의 의문이 해소가 되었으면 좋겠습니다.

먼저 인공지능, 데이터 분석, 금융이 섞인 공모전에서는 무엇보다 1. 문제점 포착 2. 해결책 제안으로 이어지는 빌드업이 무엇보다 중요하다는 것에 매우 동의합니다.

먼저 저희가 아이디어 빌드업을 한 흐름에 대해 먼저 설명드리겠습니다.

현재 고령화로 인해 2030년도에는 65세 이상 고령 인구의 비중이 전체 인구의 25%를 차지할 것이라고 예측할만큼 고령인구가 점차 많아지고 있습니다.
고령 인구의 은퇴 설계는 매우 중요하고, 국가적인 차원에서 해결해야 할 중대한 과제라고 생각합니다.
따라서 저희는 은퇴 설계에서 인컴형 자산이 가지는 장점에 주목을 했고, 인컴형 자산 중 실물자산군에 속하는 REITs 시장에 주목하였습니다.
또한, 저희가 제안서에 언급한 에이리츠 사례와 같은 문제점을 방지하고자 단순히 주가 정보와 배당 수익률만을 제공하는 것이 아니라 리츠 회사에 대한 재무상태 정보와 각 리츠가 보유하고 있는 기초자산에 대한 세부적인 정보까지 대시보드 형태로 제공을 합니다.
그리고 저희 SAR 서비스의 주 타겟층이 고령인구이기 때문에 물음표 아이콘을 통해 어려운 회계 용어를 이해하기 쉬운 설명으로 제공하려고 하고 있습니다. 
또한, 리츠는 기본적으로 위험 자산으로 분류되는데 저희 SAR 플랫폼을 통해 개인투자자가 리츠를 투자하는 데 있어 risk를 줄이고, 리츠 회사와 일반 투자자간의 정보비대칭을 해소하고자 했습니다.
그리고 신한투자증권의 IRP 계좌와 연동하여 SAR을 통해 안전하게 리츠 투자를 할 수 있도록 비즈니스 모델까지 구성하였습니다.

저희는 이러한 내용이 충분히 아이디어 빌드업에서 차별점이 있다고 생각하고, 실제로 저희가 제작한 대시보드를 보시면 기존의 대시보드와는 차별화된 점이 명확히 보이실 거라고 생각합니다.

ssong1205
2023.05.14 10:30

다음으로 의문 1. 아이디어 차별성에 대한 답변을 드리겠습니다. 

해당 게시글의 첫 댓글에서도 언급했듯이 저희는 크게 모델과 대시보드 두 가지 측면에서 차별점을 가지고 있습니다.

모델 부분에서는 언급해주신 회계 데이터와 부동산 뉴스 심리 지수에 차별점을 두어 모델링에 반영했다는 점입니다.

먼저 리츠 회사의 회계 데이터가 왜 중요한 지 말씀드리겠습니다.

리츠 투자는 일반적인 부동산 직접투자와는 다르게 리츠 회사의 운용 능력과 배당지급여력이 매우 중요한 투자상품입니다. 

리츠회사가 부채와 매출채권 등을 잘 관리하지 못하거나 현금 흐름이 안 좋을 경우 투자자에게 지급하는 배당에 차질이 생길 수 있습니다. 
따라서 저희는 부채 변수 카테고리에서 부채비, 매출채권 및 기타채권의 증가, 금융부채의 증감 변수를 사용했고, 현금 흐름 변수에는 투자부동산 변수, 기말현금 변수, 환율변동효과 변수를 사용하여 리츠 회사의 현금 흐름이 정상적인 상태인 지 모델에 반영하였습니다. 
또한 리츠는 주로 EPS가 아닌 FFO로 가치 평가를 진행합니다. 
하지만 리츠 시장이 활성화되어 있는 미국 시장과는 다르게 리츠 가치 평가에 중요한 FFO, P/FFO가 공시되어 있지 않습니다. 
이에 대한 정보가 있더라도 모두 분산되어 있거나 산출 공식이 리츠 회사마다 달라 투자자들이 어려움을 겪고 있습니다. 
이에 저희는 FFO 변수를 여러 선행연구와 증권사 보고서 등을 통해 저희만의 기준을 세우고 재무상태표 계정 과목을 통해 직접 산출하여 모델에 반영하였습니다. 

다음으로 부동산 뉴스 심리지수에 대해서 말씀드리겠습니다. 개별 리츠별로 보유하고 있는 기초자산 섹터 비중이 모두 다릅니다. 저희는 개별 리츠 기초자산 섹터의 비중을 고려하여 개별 리츠별로 감성지수가중치 변수를 생성하여 모든 리츠마다 감성지수 값이 다르도록 변수를 선정하였습니다.

저희는 이러한 부분이 저희가 사용한 데이터의 차별성이라고 생각합니다.

ssong1205
2023.05.14 10:31

다음으로 언급하신 팀 목표에 대해 설명드리겠습니다.

"일반 투자자에게 알기 쉬운 설명으로 제공하여 일반 투자자의 알 권리를 충족시켜주는 서비스를 고안하였고, 이는 리츠 투자에 대한 진입장벽을 낮추고, 리츠 회사와 개인 투자자간의 정보비대칭성을 완화하는 데 차별점이 있다고 생각합니다.”

제가 말한 내용을 그대로 가져와보았습니다.

저희의 제안서 21p부터 29p까지 대시보드를 통해 저희의 팀 목표를 달성하고자하는 저희의 노력이 담겨있습니다. 

만약 제가 첫 댓글로 작성한 내용을 보신 후에 저희가 제작한 대시보드에 들어가는 내용과 구성을 보시고, 기존의 아이디어와 어떤 점이 다른 지에 대해 여전히 감이 안오신다면 제가 다시 하나하나 대시보드에 들어가는 내용과 카테고리를 구분하여 차별점에 대해 감이 오시도록 구체적으로 설명드리도록 하겠습니다.

ssong1205
2023.05.14 10:31

또한, 1년의 시차가 존재한다고 하셨습니다. 

2022년 6월과는 다르게 현재 2023년 5월 기준금리가 정점에 달했고, 이는 금리에 큰 영향을 받는 부동산 시장에 타격을 줄 것이라고 생각합니다. 
이에 따라 2023년 1월 31일 에이리츠는 급격한 통화긴축 정책과 금리 인상 등 대외여건 악화로 인해 매출액이 줄어들어 한국거래소로부터 거래정지를 당했습니다. 

따라서 투자자는 현재 기준 금리가 정점에 도달한 상황에서 이러한 상황속에서 리츠회사와 일반 투자자간의 정보비대칭은 더욱 심해지고, 리츠 투자의 리스크를 최소화할 필요성이 있다고 생각합니다. 

따라서 1년 전인 2022년 6월에는 미국의 기준 금리가 1.75%였지만, 현재 5.25%에 도달한 지금, 무엇보다 부동산 시장에서의 리스크 관리는 중요하다고 생각합니다. 

따라서 저희는 리츠 투자에 있어서 일반 투자자의 리스크를 줄이고자 주가 등락 예측 뿐만 아니라 리츠에 영향을 주는 거시경제 변수, 부동산 뉴스 키워드 및 심리지수,  개별 리츠회사에 대한 운용 능력을 평가할 수 있는 회계 지표, 배당을 꾸준히 지급했느냐를 볼 수 있는 배당 지급 내역, 리츠의 가치 평가를 돕는 FFO, P/FFO, NOI, 개별 리츠의 기초자산을 평가할 수 있도록 교통, 유동인구, 편의시설, 상권, 주요산업군, 주변 공실률 정보를 투자자가 한 눈에 볼 수 있도록 대시보드 형태로 제공한다는 점에 있어서 분명한 차별점이 있다고 생각합니다.

ssong1205
2023.05.14 10:32

다음으로 의문 2.에 대한 답변을 드리겠습니다.

작년 공모전 본선 발표 pt를 하면서 Team_IBA팀의 리츠 관련 작품의 존재를 알고 있었습니다. 대회를 참가하던 와중에도 생소한 리츠를 주제로 했다는 것이 인상 깊었고, 한국 리츠 시장이 얼마나 성장성이 큰 시장인 지 Team_IBA 덕분에 알게 되었습니다. 

완전히 세상에 없는 새로운 아이디어를 내는 것은 매우 어려운 일이다라는 것을 알고 계실거라고 생각합니다. 그래서 아이디어 빌드업의 중요성을 언급한 것이라고 생각합니다.

단순히 주가의 등락을 예측하는 것은 서적을 참고하거나, 구글링을 해봐도 누구나 도전해볼 수 있는 일이라고 생각합니다.

언급해주셨듯이 데이터 전처리, 분석, 사용하는 인공지능 기법은 차이를 두려고 해도 종류가 한정되어 있기 때문이죠.

하지만 시가 대비 종가의 등락을 예측하는지, 전일 종가 대비 다음날 종가의 등락을 예측하는지, 시가 대비 다음날의 종가의 등락을 예측하는지에 따라 모델의 정확도도 다르고 들어가야 하는 독립변수 또한 다르다고 생각합니다. 또한, 독립변수 기간을 장이 열리는 9시부터 11시까지로 설정할 지, 9시부터 10시까지로 설정할 지 등 이러한 부분에 있어서도 모두 다른 모델이 나온다고 생각합니다.

모두 똑같은 주가 등락 예측이지만, 어떤 변수를 선정하였는 지, 검정 방법은 어떻게 되는지, 데이터 전처리(아웃라이어 제거, NA 값 처리 등)를 어떻게 했는지, 종속변수의 기간을 어떻게 설정했는지에 따라 모두 다른 결과, 다른 해석이 나옵니다.

따라서 비슷한 아이디어라도 이를 어떻게 빌드업 했는지, 모델에서 어떠한 차별점을 두었는지, 대시보드에서 어떤 세부적인 정보를 담고 있는지에 따라 나올 수 있는 아이디어는 무궁무진하다고 생각합니다. 
또한, 위의 댓글에서도 언급했듯이 아이디어가 비슷하다고 해도 이를 어떤 형식을 채택하여 투자자에게 제공하는지, 어떻게 개인 투자자나 증권사에게 서비스를 제공하는지에 대한 비즈니스 모델도 이번 공모전의 중요한 포인트라고 생각합니다.

ssong1205
2023.05.14 10:33

그리고 제가 참가했던 대회의 수상작과 이번 아이디어가 매우매우매우 비슷한 아이디어라고 하셨습니다.

개별 KOSPI 종목의 시가 대비 종가의 등락을 예측하는 것은 일중의 분당 데이터를 활용하여 모델링을 진행을 했기 때문에 리츠의 1일 뒤, 1주일 뒤, 1달 뒤의 종가를 예측하는 것과는 매우 다릅니다. 

또한, 대회 평가 방식에 대해서는 신한AI측과 데이콘 측이 언급한 바 있습니다. 신한 AI측에서 공정한 심사가 이루어질 수 있도록 노력하고 있다고 합니다. 이에 대해서는 저희가 드릴 말씀은 없을 거 같습니다.

저의 글의 뽀또님의 의문을 모두 해소해줄 수 있을지는 모르겠지만, 추가적인 의문과 질문이 있으시다면 질문 부탁드립니다.

감사합니다.

영앤리츠팀 드림

뽀또
2023.05.14 13:22

혹시 표절하셨다는걸 스스로 인정하시는 진술서를 작성하신건가요?

1. 아이디어 경진대회에서 타 대회 수상작 아이디어를 가져오는 것이 정당한가요?

저와 본 게시글에 처음으로 의문을 제기한 경제맛쿠키님이 동일하게 말한 의도를 전혀 파악하지 못한 것인지, 이악물고 모른척 넘어가려하시는 것인지 감이 안잡힙니다.
1) 리츠의 정보시스템을 제안한 점(+인터페이스로 정보시스템을 제공한다는 점, 리츠라는 생소한 시장을 알리고자 한 점)
2) 아이디어 접근 방식이 유사한 점(정보가 부족하니 인터페이스를 제공하겠다, 리츠의 중요성이 높아지고 있다 등)
3) 주가지수에 부동산 심리지수를 반영하였다는 점(+사용한 4가지 데이터중 3가지가 동일한 점)

이렇게 가장 중요한 프레임이 같고, 내부 그림 채색을 다른색으로 했다는 것으로 비유하면 이해될까요?
혹시 감자탕에서 돼지 등뼈(감자)가 아닌 돼지 경추 25% 섞으면 감자탕이 아닌걸까요?
음악도 가락, 리듬, 화음의 3가지 요소의 실질적 유사성 여부가 표절의 기준이 되는데, 어찌 3가지 중요 기둥이 모두 동일한데, 내부가 좀 다르다고 전혀 차별화된 아이디어라고 당당하게 말씀하시는지 모르겠네요.

Team_IBA작품을 알고 있었고, 리츠 시장이 생소하다는 점, 정보시스템이 부족하다는 점까지 인지한 상태로 그것을 해소하고자 본 대회에 아이디어를 내셨다?

아이디어 빌드업의 중요성이라고 하시기엔, 이미 남이 좋은 아이디어를 내고 그걸 한국거래소에서 상금을 주고 저작권을 가져간 아이디어를 차용해 신한AI 공모전에서 사용하는 것이 옳다고 생각하십니까?
만약 이 행동이 정당하다면, Team_IBA에 한 분은 이번 공모전에서 다른 작품을 출품한 것으로 파악되는데, 왜 그분은 과거 제출한 리츠 작품을 수정해서 제출하지 않았을까요?
과거에 한 경험이 있어 그것을 기반으로 디벨롭해서 제출한다면 이번엔 작년보다 더 높은 상을 쉽게 쟁취하실 수 있을 것 같은데, 그분이 그 아이디어를 사용하지 않은 이유가 무엇일까? 라는 생각은 안해보셨을까요?

뽀또
2023.05.14 14:04

만약 Team_IBA의 한 분이 작년 수상작의 아이디어를 그대로 갖고 이번에 게시하셨다면, 해당 아이디어를 알고 있던 영앤리츠팀은 아무런 이의제기를 안하셨을까요? 양심에 손을 얹고 생각해보십쇼.
만약 다른 공모전 수상작을 차용하고자 한다면, 적어도 정보시스템을 제안하더라도 최대한 피해서 대시보드라는 동일한 도구가 아닌, 다른 방법을 제시하는게 맞지 않을까요?

2. 여긴 퍼포먼스 경진대회가 아닌, 아이디어 경진대회입니다.
"모두 똑같은 주가 등락 예측이지만, 어떤 변수를 선정하였는 지, 검정 방법은 어떻게 되는지, 데이터 전처리(아웃라이어 제거, NA 값 처리 등)를 어떻게 했는지, 종속변수의 기간을 어떻게 설정했는지에 따라 모두 다른 결과, 다른 해석이 나옵니다."
라고 말씀하셨죠?
어떤 변수를 선정하였는지, 데이터 전처리 과정을 어떻게 하였는지에 따라 다른 모델이라고 말씀하셨죠?
그건 딥러닝 모델을 제안하고, 성능을 평가하는 경진대회에서 하실 말씀이지, 아이디어 경진대회에서 하실 말씀이 아닌 것 같습니다.
그리고 이게 가장 중요한 이 대회의 본질이라고 생각됩니다.
다들 사용할 수 있는 데이터분석기법, 인공지능 기법은 큰 틀을 벗어나지 못합니다. 신한AI는 저희보다 더 우수한 인재가 많을 것입니다.
그들이 지금 모델의 성능을 높히는 방법을 찾고 있는 것일까요? 그럼 논문을 찾아보셨겠죠.
왜 아이디어 경진대회를 열었을까요? 논문이나 회의에서 찾을 수 없는, 정말 참신한 사업아이템 아이디어를 얻고자 본 경진대회를 회사 이름, 상금까지 걸면서 개최한 것이 아닐까요?
본 대회의 취지는 정말 차별화된, 사업 가능한 아이디어가 필요한 것인데, 기초공사를 다른 공사장에서 훔쳐오시고 본인이 다 세우신척 떳떳하신게 너무 어이가 없네요.

만약 어떤 변수를 선정하였는지, 데이터 전처리 과정을 어떻게 하였는지에 따라 다른 모델이라면,
제가 리츠팀 데이터에서 회계데이터 제외하고 다른 데이터를 사용한 모델을 업로드하면, 동일한 아이디어가 아닌걸까요?

뽀또
2023.05.14 13:45

리더보드에서 일찍 업로드 한 팀들은 본인들의 아이디어가 유출되어 더 디벨롭된 아이디어의 팀이 나올 수 있는데, 바보라서 일찍 올린 걸까요?
다른 팀들은 공모전을 준비하는 과정에서 업로드된 대시보드를 확인하며, 본인들의 아이디어와 비슷한 팀이 나오지 않을까? 하는 불안감을 가진 적이 없을까요?
저 또한 본 경진대회에서 아이디어를 내보고자 하였으나, 비슷한 아이디어를 가진 팀이 먼저 업로드하여 2번이나 아이디어를 갈아엎던 와중 타이밍을 놓쳐 결국 포기한 사람입니다. 제 입장에선 과거 수상작을 고의로 차용했다는 점에서 분노가 치밀어 오르네요?

아이디어 공모전에서 아이디어 프레임은 같고, 데이터와 결과가 다르면 다른 아이디어라고 말씀하시는게 정말 이해가 되지 않습니다.
만약 이게 맞다면, 전 다음 금융 데이터, 인공지능 관련 공모전이 나온다면 "리츠를 알리고자 정보시스템을 대시보드로 보여주는 아이디어"를 내보겠습니다.
회계 데이터 안쓰고, 더 다양한 정보를 인터페이스에 담아내면 다른 아이디어 맞죠?

ssong1205
2023.05.14 14:18

안녕하세요 뽀또님, 영앤리츠팀입니다.

우선 뽀또님의 좋은 아이디어를 많은 사람들이 볼 수 없다는 점에 대해서는 매우 안타깝게 생각하고 있습니다.

뽀또님께서 저희의 아이디어와 기존 아이디어가 중요한 프레임이 같고, 내부 그림 채색을 다른색으로 했다는 것으로 비유를 해주셨습니다. 

또한, 음악으로도 예시를 들어주셨는데, 이번 공모전이 ‘보다 나은 금융 생활을 위한 AI 서비스 아이디어 경진대회’인 만큼 저희는 서비스를 예시를 들고 싶습니다.

현재 중고거래라는 아이디어 프레임안에서 당근마켓, 중고나라, 번개장터가 각기 다른 내부 채색으로 각자의 차별점을 살리며 서비스를 잘 이어나가고 있습니다. 

3가지 서비스 모두 다음과 같은 중요 기둥이 모두 동일하다고 생각합니다. 

1) 사기 거래를 방지하기 위한 APP 형태의 서비스 제공

2) 개인과 개인의 중고 거래 중계

3) 중고거래 이용자 인증제도

3가지 서비스 모두 중고거래라는 프레임안에서 위와 같은 큰 기둥이 동일하기 때문에 이 서비스가 서로를 표절했다고 봐야할 지 의문입니다.

이들은 중고거래라는 동일한 프레임과 중요 기둥을 토대로 각기 다른 채색을 하며, 차별화된 기능을 제공하고 있습니다.

저희 또한 마찬가지입니다. 

리츠라는 큰 프레임 안에서 저희는 리츠 회사의 회계 정보와 개별 리츠의 섹터 비중을 가중평균한 뉴스 심리지수를 반영한 주가 등락 예측 모형과 리츠에 영향을 미치는 거시변수, 부동산 뉴스 키워드 및 심리지수, 리츠 회사에 대한 구체적인 회계 정보, 개별 리츠의 기초자산에 대한 정보를 담은 대시보드를 제공하여 기존 아이디어와 차별화된 내부 채색을 하였습니다.

ssong1205
2023.05.14 14:20

그리고 언급해주신 ‘인터페이스로 리츠정보시스템을 제공한다는 점’과 ‘대시보드가 아닌 동일한 도구가 아닌 다른 방법을 사용하는 것이 맞지 않았을까’에 대해서도 말씀드릴 것이 있습니다.

제가 말씀드린 당근마켓, 중고나라, 번개장터 모두 APP 형태로 서비스를 제공하고 있습니다. 

말씀해주신 대시보드와 같은 인터페이스 형태로 서비스를 제안하는 것이 표절이라면 중고거래라는 프레임 안에서 APP 형태로 서비스를 제안하는 것도 표절인 지에 대해 의문이 듭니다.

신한 NEO에서도 대시보드 방식을 사용했듯이 대시보드란 투자자에게 어떤 대상을 설명하는 데 있어 중요한 정보를 한 번에 정리해서 인터랙티브하게 보여주는 툴이라고 생각합니다. 

따라서 중고나라, 번개장터가 APP으로 서비스를 진행하고 있다고 하여 당근마켓이 APP으로 서비스를 출시하지 못하는 것은 아니라고 생각합니다.

대시보드는 저희의 서비스를 표현하기 위한 매개체일뿐 해당 대시보드에 어떤 내용과 기능으로 채색할 지가 중요하다고 생각합니다.

그리고 Team_IBA팀에서 이번 공모전에서 다른 작품을 출품한 것으로 파악되는데, 왜 그분은 과거 제출한 리츠 작품을 수정해서 제출하지 않았을까라는 것에 대한 의문점을 남겨주셨습니다.

‘보다 더 나은 금융 생활을 위한’ AI 서비스 아이디어 경진대회인 만큼 은퇴 설계가 중요해지고, 금리가 정점에 도달한 이 상황에서 어떻게 하면 인컴형 자산인 리츠 투자를 통해 퇴직 연금을 안전하게 투자할 수 있을지에 대한 내용에 집중했다는 것을 알아주셨으면 좋겠습니다.

ssong1205
2023.05.14 14:21

그리고 여긴 퍼포먼스 경진대회가 아닌, 아이디어 경진대회라고 언급해주셨습니다.

저희가 기획한 SAR 대시보드에서 투자자들이 저희의 주가 등락 예측을 신뢰하기 위해선 제가 언급한 과정들이 매우 중요하다고 생각합니다. 

또한, 일반적인 아이디어 경진대회가 아니라 AI 서비스 아이디어 경진대회이기 때문에 모델의 예측력과 어떤 방식을 사용하여 모델을 구축했는지도 중요하다고 생각합니다.

물론 저희가 완전히 새로운 AI 기법을 사용한 것이 아니지만, 모델링을 진행하는 절차 또한 중요하다고 말씀드리는 것입니다.

저희가 위에서 긴 글로 저희만의 차별화된 내부 채색을 모두 설명해드렸지만,  프레임이 같다는 이유로 훔쳐왔다, 표절이다라고 하시는 건 당황스럽습니다.

ssong1205
2023.05.14 14:22

그리고 만약 다음 공모전에서는 “리츠를 알리고자 정보시스템을 대시보드로 보여주는 아이디어”를 제출하신다고 하면 모델링 부분에 대해서는 종속변수 기간을 어떻게 설정할 것인지, 독립변수는 어떤 변수들을 사용할 것인지, 전처리 방법과 검정 방법은 어떤 것을 사용하실 지 모두 고민해보셔야 할 거 같습니다.

또한, 대시보드 형태로 제공을 할 때도 AI 기반 추천 종목도 어떤 정보가 담긴 형태로 제공할 것인지, 어떠한 거시 경제 지표를 메인 페이지에 보여줄 것인지, 부동산 키워드를 어떤 그래프 형태를 통해 보여줄 것인지, 부동산 뉴스 심리의 긍정, 부정, 중립 기준을 어떻게 잡을 것인지, 리츠의 자산 비중을 보유 개수로 할 것인지 아니면 투자 비중으로 할 것인지, 리츠 회계 정보에 대한 요약 정보에서 어떠한 정보를 주된 요소로 잡고 투자자에게 보여줄 것인지, 섹터별 기초자산에 대한 임대 현황, 장기차입금현황, 임대율 추이, 자산별 임대 현황을 어떤 방식으로 보여줄 것인지, 배당을 주는데 있어 중요하게 봐야하는 지표가 무엇인지, 투자보고서와 월간보고서가 모두 분산되어 있다는 점에 착안하여 실제 파일로 연결되는 링크를 만들 것인지, 고령층을 대상으로 어떠한 디자인과 설명으로 쉽게 정보를 제공할지, 기초자산 정보를 개별 자산을 기준으로 제공할지 아니면 섹터별로 제공할지, 임대인 임차인 정보 중 어떤 정보를 투자자에게 보여줄지, 개별 자산에 대해 키워드를 교통, 유동인구, 편의시설, 상권과 같은 키워드를 어떻게 선정하고 별점을 산출할 것인지, 이러한 데이터들을 모두 어디서 가져올 것인지, 이에 대한 모든 서비스와 기능을 누구에게 제공할 것이며, 구독형태와 같이 어떤 방식으로 고객들에게 제공을 할지, SAR과 신한투자증권과 연동하여 어떻게 퇴직 연금 시장을 노릴 것인지에 대한 내용을 함께 고민해보셨으면 좋겠습니다.

ssong1205
2023.05.14 14:24

그리고 일찍 업로드한 팀들에 대해서는 그만큼 조회 수와 좋아요를 많이 받을 것이라고 예상을 하고 제안서만 미리 제출하는 것을 보았습니다. 

하지만 저희는 신한AI 심사위원분께서도 투표를 하시기 때문에 좀 더 완성도 있는 코드 파일과 제안서를 제출하고자 제출일이 늦어졌습니다. 

그리고 비슷한 아이디어를 가진 팀이 먼저 업로드하여 2번이나 아이디어를 갈아엎으시다가 타이밍을 놓쳐 포기하셨다고 하셨습니다.

뽀또님의 아이디어가 비슷한 아이디어를 가진 팀보다 차별점을 가진다는 것은 뽀또님이 아니라 신한AI의 심사위원 분께서 판단하실 일입니다.

저희도 만약 신한 AI측에서 기존 아이디어에 비해 차별화된 점이 없고 이를 표절했다고 판단하신다면 저희 팀은 그 부분을 깔끔하게 삭제하겠습니다.

현재 배당수익률 예측 모델링을 진행중이기 때문에 이 답변을 기준으로 답변을 더이상 달지 않겠습니다.

뽀또님께서도 저희의 글을 보고 노여움을 푸셨으면 좋겠습니다.

감사합니다. 

영앤리츠팀 드림.

뽀또
2023.05.14 15:28

1. 중고거래 예시의 문제점

중고나라(2003년), 번개장터(2011년), 당근마켓(2015년)는 각각 다른 시기에 등장한 회사입니다.
뒤에 나온 회사는 기존 회사를 SWOT분석하고, 틈새시장을 노려 등장한 플랫폼입니다.
즉, 이미 시장에 나온 아이디어의 헛점을 노려 진출한 것입니다.

하지만, 작년에 한국거래소에서 상금을 주고 지적재산권을 가져간 Team_IBA의 아이디어는 아직 시장에 나오지 않았습니다.
앞으로 한국거래소에서 해당 아이디어로 제품을 만들지도 모르는 상황인데, 본인들의 새로운 아이디어인 마냥 말씀하시는게 의아합니다.

정말 아이디어가 차별화되서 다른 것이라고 생각하신다면, 
한국거래소에서 개최한 금융 빅데이터 아이디어 경진대회에서 수상한 Team_IBA의 아이디어를 참고했다는 참고문헌이라도 작성하는 것이 최소한의 양심이 아닐까 생각합니다. 

뽀또
2023.05.14 15:28

2. 여기는 아이디어 경진대회입니다.

"또한, 대시보드 형태로 제공을 할 때도~어떻게 퇴직 연금 시장을 노릴 것인지에 대한 내용을 함께 고민해보셨으면 좋겠습니다"
라고 말씀하신 부분은, 아이디어를 선정한 뒤에 생각할 문제입니다.

건물을 지을 때, 긴 기간동안 공사하는데 진척없어보이다가 갑자기 건물이 확 올라가는 경우 보셨죠?
기초공사가 제일 어렵고, 오래 걸리기 때문입니다. 그런데, 남이 기초공사 잘해놓은걸 가져오셨다면,  위에 건물올리는건 쉽다고 생각합니다.
그리고 신한AI에서도 기초공사까지 다된걸 원하는거지, 건물을 어떻게 올렸는지는 내용을 바꿔서 사업 아이디어로 만들 신한AI의 몫입니다.

"그리고 만약 다음 공모전에서는 “리츠를 알리고자 정보시스템을 대시보드로 보여주는 아이디어”를 제출하신다고 하면 모델링 부분에 대해서는 종속변수 기간을 어떻게 설정할 것인지, 독립변수는 어떤 변수들을 사용할 것인지, 전처리 방법과 검정 방법은 어떤 것을 사용하실 지 모두 고민해보셔야 할 거 같습니다."
라고 말씀하셨습니다.

심사위원님께서도 다른 토크에서 코드, 데이터 분석과정에서의 차별성은 사업아이템의 실현 가능성에 대한 증명을 위해 필요한 것이지, 꼭 필요한 것이 아니라고 말씀하셨습니다.
즉, 아이디어만 제시하고, "종속변수 기간을 어떻게 설정할 것인지, 독립변수는 어떤 변수들을 사용할 것인지, 전처리 방법과 검정 방법은 어떤 것을 사용하실 지" 말하지 않아도 아이디어가 참신하다면 수상 가능하다는 뜻입니다.

이는 아이디어의 참신함이 중요하다는 점을 강조하는 것이라 생각됩니다.

뽀또
2023.05.14 15:37

3) 저작권에 대한 인식
"저희도 만약 신한 AI측에서 기존 아이디어에 비해 차별화된 점이 없고 이를 표절했다고 판단하신다면 저희 팀은 그 부분을 깔끔하게 삭제하겠습니다."라고 말씀하셨습니다.
이건 이미 아이디어를 제출한 상태에서 표절이라고 판정받으면 지우겠다? 
영앤리츠 팀의 저작권에 대한 인식에 의문을 품게 만드시는군요.

Team_IBA의 아이디어는 이미 한국거래소에서 상금을 주고 지적재산권을 가져갔습니다. 
만약 신한AI 경진대회에서 영앤리츠팀이 수상하고 뉴스가 동일한 주제를 활용한 리츠 정보시스템으로 나간다면 그것 또한 재밌긴 하겠네요.