데이터 분석 프로젝트의 주 내용은 무엇이 들어가야하나요?

2023.12.11 14:34 552 조회

저는 비전공자로 사회과학 계열을 전공했고 데이터 분석에 관심이 생겨서 공부를 시작했습니다.


최근 기회가 생겨서 데이터 분석 프로젝트에 전공자들과 같이 참여했는데 보고서를 작성하는 과정에서 마찰이 있었습니다.


보고서와 발표자료에 핵심으로 들어갈 내용을 정리하는데 저는 주제를 좀 더 다양한 측면에서 뜯어보고 데이터로 본 현 상황을 어떻게 대처할지, 예측 모델을 통해 나온 결과를 가지고 어떤 기대효과를 제시할 수 있을지에 대해서 얘기하고 싶었지만 전공자들은 핵심을 다르게 보더라구요.

주로 모델에 대한 설명과 함께 모델 구축 과정 서술 및 모델 검증 과정 등에 중점을 두더라구요.


제가 비전공자라서 아무래도 전공자들이 하는 얘기니 받아들이고 프로젝트를 마무리했습니다. 전처리부터 모델 구축과정을 중점으로 해서 발표자료를 준비했습니다.


근데 모델은 결국 수단 아닌가요? 이걸 가지고 어떤 결론, 시사점과 기대효과를 제시할 수 있는가에 대해서 핵심적으로 봐야하는게 아닌가 싶어서요...


이미 끝난 프로젝트라서 따로 더 얘기는 안할거같은데 개인적으로 공모전 참여하면서 어떤 방향으로 가야할지 고민됩니다...

로그인이 필요합니다
0 / 1000
ContinualLight
2023.12.12 09:15

그건 그 프로젝트의 목표가 어떤 건지에 따라 달라 보이네요
만약 유의미한 AI 서비스를 만드는 게 목표라면 말씀주신대로 시사점, 기대효과가 더 중요하겠지만, 
새로운 알고리즘을 개발하는 프로젝트라면 추론속도나 정확도 등이 더 중요할 것 같아요
결국 이건 주최 기관이 프로젝트를 개설한 목적을 파악하고 그거에 맞춰서 진행하는게 좋을 것 같습니다. 

세이버
2023.12.12 15:58

목표에 따라 다르죠. 인과추론, 분류/예측, 클러스터링 등 주어진 데이터셋에 따라 다양한 목표가 있고 그에 따른 가설을 세우고 모델링을 하고 결론을 내려야죠.
방법론에 따라 다르겠지만 분석 결곽가 나와도 그 값의 신뢰성은 모델이 재대로 수립 되었는지 안되었는지에 따라 다르기 때문에 모델링이 제대로 되었는지 설명하는 것도 중요하죠. 가령 linear regression 만 하더라도 Gauss Markov Therom에 따라 제대로 모델링 안하면 결과가 다 꼬이니...