컴퓨터 비전 분야 공부 방법

2025.03.04 17:45 446 Views

📌 전체 로드맵

1️⃣ OpenCV 실습 → 2️⃣ CNN 개념 학습 → 3️⃣ ResNet/YOLO 실습 → 4️⃣ 대회 도전 → 5️⃣ 최신 논문 리뷰 & 연구




1️⃣ 기초 개념 & 수학적 배경

  • 선형대수: 행렬, 벡터 연산
  • 미적분: 미분, 최적화 개념
  • 확률 & 통계: 가우시안 분포, 베이즈 정리
  • 기본 이미지 처리 개념: 픽셀, 히스토그램, 필터링, 컨볼루션


2️⃣ 기본 라이브러리 학습

  • OpenCV: 이미지 전처리, 필터링, 특징 검출
  • Pillow: 간단한 이미지 처리
  • Matplotlib & Seaborn: 데이터 시각화

실습

  • OpenCV로 이미지 불러오기, 변환, 엣지 검출


3️⃣ 딥러닝 기초 & CNN 학습

  • 퍼셉트론, 다층 퍼셉트론(MLP)
  • 역전파(Backpropagation) & 경사 하강법(GD)
  • CNN(합성곱 신경망) 개념
  • Convolution(필터 연산)
  • Pooling(특징 압축)
  • 활성화 함수(ReLU), Softmax


4️⃣ CNN 기반 모델 실습

  • TensorFlow/Keras 또는 PyTorch 사용
  • 대표적인 CNN 모델 실습
  • LeNet-5
  • AlexNet, VGG, ResNet, EfficientNet
  • YOLO, Faster R-CNN (객체 탐지)
  • U-Net, DeepLabV3 (이미지 분할)

실습

  • MNIST/Fashion-MNIST 데이터셋으로 분류 실습
  • PyTorch/TensorFlow로 ResNet 학습
  • YOLOv5를 활용한 객체 탐지


5️⃣ 최신 연구 논문 & 트렌드 파악

  • 주요 컨퍼런스 논문 읽기 (CVPR, ICCV, NeurIPS, ECCV)
  • 최신 모델 학습 (ViT(비전 트랜스포머), Diffusion Models, DINO)
  • 대회 참여


6️⃣ 프로젝트 & 실전 응용

  • 이미지 분류, 객체 탐지, 이미지 분할 프로젝트 수행
  • 데이터셋을 직접 구축하여 실험
  • AI 모델 경량화 (Quantization, Pruning, Distillation) 학습

프로젝트 아이디어

  • 손글씨 숫자 인식 (MNIST)
  • 얼굴 인식 시스템 구축 (Haar Cascade, CNN)
  • 자율주행을 위한 객체 탐지 모델 개발 (YOLO)