Problem design(CV)
1. 흭득과 표현
- 사람은 눈으로 시각 정보를 얻고 기계는 카메라를 통해 시각정보를 얻는다.
- 수정체 : 렌즈
- 망막 : CCD 센서
1.1. 샘플링과 양자화
-
image : 3D -> 2D (M by N 으로 샘플링하고 이 크기를 해상라고 한다)
-
명암은 L단계로 양자화 -> [0,L-1]에 분포
ex) L = 10 일 경우 [0,9]로 나타냄
- M.N,L : W.H.C (1-channel)
1.2. 영상좌표계
- 화소 위치를 x = (j,i) or x= (y,x)로 표기 (pixel)
- 영상 : f(x) or f(j,i) or 0 <= j <= M-1, 0 <= i <= N-1로 표김 (크기 = (N,M))
- 컬러 영상 : RGB -> fr(x), fg(x), fb(x) 3channel로 구성
1.3. 영상 표시 방법
-
숫자 배열
-
지형 그래프
2. 컴퓨터 비전 문제 해결
2.1. 과학적 접근
Goal : 사람의 시각에 맞먹는 인공 시각을 만든다. (제약이 없는 상황)
- 사람의 시각원리를 분석해 컴퓨터로 모방
- 주요 관심사 : 뇌과학
-
지식표현, 학습 추론 ,창작등에 초점을 둔다.
- 단점:
- 3D -> 2D -> 3D 로 차원을 바꾸고 다시 변환시 3차원정보를 손실한다.
- 기하학전 변환, 광도 변환등 여러가지 변형이 발생하여 힘들다.
2.2. 공학적 접근
Goal : 한정된 범위 에서 특정한 임무를 달성하는 인공시각을 만든다.(제약이 있는상황)
- 특정상황에 맞는 실용 시스템 구축을 해야한다.
- 제약이 있는 상황이다 보니 많은 응용 현장에서 사용이 된다.
- 사람보다 뛰어난 경우가 존재한다.
ex) 엔진 실린더 정밀 측정, 칩 검사 등 ..
- 과학적 접근과 비슷한 단점이 존재하고 실용적으로 사용할정도로 성능을 끌어올리기 힘들다.
2.3. 계층적 처리
- 전처리
영상 처리
- 특징 추출
선분, 영역 , 텍스처 , 지역, 엣지 특징등을 검출하여 벡터 추출
- 해석
2.4. 시스템 설계
- 문제이해
합리적 제약 조건 수립이 필요하다.
ex) 얼굴 인식기.
- 크기가 일정한 정면 얼굴 -> 제작이 쉬움 + 보안 장치에 활용가능 + 사진분류 응용에는 어려움
- 자연 영상 속의 얼굴 -> 위와 반대 케이스
- 데이터베이스 수집
- 질,양적으로 모두 우수해야 고성능 모델을 제작 가능
- training set, test set 필요
- 수집 방법
- 직접수집 or 인터넷
-
알고리즘 설계 및 구현
-
성능평가