Problem design(CV)

1. 흭득과 표현

  • 사람은 눈으로 시각 정보를 얻고 기계는 카메라를 통해 시각정보를 얻는다.
  • 수정체 : 렌즈
  • 망막 : CCD 센서

1.1. 샘플링과 양자화

  • image : 3D -> 2D (M by N 으로 샘플링하고 이 크기를 해상라고 한다)

  • 명암은 L단계로 양자화 -> [0,L-1]에 분포

ex) L = 10 일 경우 [0,9]로 나타냄

  • M.N,L : W.H.C (1-channel)

1.2. 영상좌표계

  • 화소 위치를 x = (j,i) or x= (y,x)로 표기 (pixel)
  • 영상 : f(x) or f(j,i) or 0 <= j <= M-1, 0 <= i <= N-1로 표김 (크기 = (N,M))
  • 컬러 영상 : RGB -> fr(x), fg(x), fb(x) 3channel로 구성

1.3. 영상 표시 방법

  • 숫자 배열

  • 지형 그래프


2. 컴퓨터 비전 문제 해결

2.1. 과학적 접근

Goal : 사람의 시각에 맞먹는 인공 시각을 만든다. (제약이 없는 상황)

  • 사람의 시각원리를 분석해 컴퓨터로 모방
  • 주요 관심사 : 뇌과학
  • 지식표현, 학습 추론 ,창작등에 초점을 둔다.

  • 단점:
  • 3D -> 2D -> 3D 로 차원을 바꾸고 다시 변환시 3차원정보를 손실한다.
  • 기하학전 변환, 광도 변환등 여러가지 변형이 발생하여 힘들다.

2.2. 공학적 접근

Goal : 한정된 범위 에서 특정한 임무를 달성하는 인공시각을 만든다.(제약이 있는상황)

  • 특정상황에 맞는 실용 시스템 구축을 해야한다.
  • 제약이 있는 상황이다 보니 많은 응용 현장에서 사용이 된다.
  • 사람보다 뛰어난 경우가 존재한다.

ex) 엔진 실린더 정밀 측정, 칩 검사 등 ..

  • 과학적 접근과 비슷한 단점이 존재하고 실용적으로 사용할정도로 성능을 끌어올리기 힘들다.

2.3. 계층적 처리

  1. 전처리

영상 처리

  1. 특징 추출

선분, 영역 , 텍스처 , 지역, 엣지 특징등을 검출하여 벡터 추출

  1. 해석

2.4. 시스템 설계

  1. 문제이해

합리적 제약 조건 수립이 필요하다.

ex) 얼굴 인식기.

  • 크기가 일정한 정면 얼굴 -> 제작이 쉬움 + 보안 장치에 활용가능 + 사진분류 응용에는 어려움
  • 자연 영상 속의 얼굴 -> 위와 반대 케이스
  1. 데이터베이스 수집
  • 질,양적으로 모두 우수해야 고성능 모델을 제작 가능
  • training set, test set 필요
  • 수집 방법
  • 직접수집 or 인터넷
  1. 알고리즘 설계 및 구현

  2. 성능평가