손 글씨 (숫자) 분류 AI 해커톤

알고리즘 | CV | 분류 | 제어 | Accuracy

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 458명 D-1

 

[TDA] 숫자들을 기하학적으로 분석해보자. 근데 이제 호몰로지를 곁들인...

2021.11.17 02:59 10,025 Views language

(수정) 출력이 제대로 표시되지 않는 문제가 있어 ipynb 파일을 수정 후 교체하였습니다.

--------

위상수학적 데이터 분석(Topological Data Analysis;TDA)은 데이터의 모양을 위상수학과 기하학을 활용하여 분석하는 신생 수리 데이터 사이언스 분야입니다.

TDA는 미국 스텐포드 대학교에서 시작되어, 인공지능 밴처기업 AYASDI가 TDA를 활용한 솔루션으로 대박을 터트리며 유명해졌습니다.

현재 한국에서는 포스텍 수학과/인공지능대학원의 수리데이터사이언스 연구소 MINDS에서 TDA가 활발히 연구되고 있습니다.

한국에 소개된 지 오래되지 않은 만큼 생소하겠지만, 여러분에게 TDA가 소개되는 기회가 되길 바랍니다.

해당 코드의 많은 부분이 giotto-tda documentation의 튜토리얼에서 참고되었습니다.

아직 대회 일정이 많이 남은 관계로, 제가 독자적으로 사용한 TDA 테크닉과 모델은 추후에 공유하도록 하겠습니다.

Code
로그인이 필요합니다
0 / 1000
마가리따
2021.11.17 05:07

우와 좋은 글 잘 보았습니다. 수학 잘 모르는 사람인데요. 혹시 TDA 가 이미지 데이터 같은 것 말고, 테이블 형태로 된 데이터에도 많이 쓰이나요?

척척석사
2021.11.17 07:49

읽어주셔서 감사합니다 :) 

TDA는 그 취지가 데이터의 '모양'(기하학)을 생각하기 위함인 만큼, 일반적으로는 포인트클라우드형(점들의 집합형태), 시계열, 이미지 등과 같은 형태의 데이터에 주로 힘을 발휘합니다.

테이블 형태의 데이터에는 그 모양을 확실히 발휘한다고 확답 드리기는 어렵습니다.. 아마 데이터에 대한 배경지식이 그 성패 여부를 답할 가장 큰 요인이 아닐까 싶습니다 ^^;;

특히 그 해석에 있어서 유의미함을 따질 때 가장 문제가 된다고 생각합니다.

 TDA를 비롯하여 많은 머신러닝 테크닉들이 데이터 간의 "거리"를 측정하는게 중요한 요소가 됩니다. (예를 들어, SVM, kNN 등)

그런데 테이블 형태로 주어진 경우 일반적으로는 그 거리의 의미가 모호한 경우가 많습니다.

하지만 의미를 잘 모르기 때문에 수학자 입장에서는 이용하기를 망설이는 것이지, 기발한 아이디어가 있다면 얼마든지 시도해볼 수 있다고 생각합니다!


쿵짝작
2021.11.19 08:06

오 너무 흥미롭네요 공유감사합니다

척척석사
2021.11.19 08:57

흥미를 가져주셔서 감사합니다 :)
아무래도 제가 이전에 만들어둔 튜토리얼들을 짜집기하다보니 조금 엉성하거나 설명이 부족한 부분이 보이네요 ..

저희 연구실에서 TDA를 한국에 알리는 겸 한국어로된 튜토리얼을 제작하고 있습니다. 제가 조금 더 자세히 만들어두었으니 흥미가 있으시면 참고하셔도 좋을 것 같습니다 :)

https://github.com/postech-minds/postech-minds/blob/main/tutorials/[GTDA_TUTO]01-Introduction_to_TDA.ipynb

읭읭
2022.10.26 03:40

삭제된 댓글입니다

척척석사
2022.09.23 16:18

안녕하세요, 선생님 :)

아마 여기서 답글로 달아 드리기엔, 너무 길어질 것 같고 혹시 괜찮으시다면 제 개인 이메일 주소로 메일 한 통 남겨주실 수 있으실까요? :)

글 맨 하단에 제 이메일 주소를 남겨두었습니다.