• : 한 장의 사진에 포함된 여러 물체의 영역과 이름을 픽셀 수준에서 지정 하는 작업을 시멘틱 분할이라고 한다.

  • SSD(물체감지) 에서는 BBox로 물체를 묶어 라벨을 붙였지만, 시맨틱 분할에서는 어디서부터 어디까지 픽셀 수준으로 어떤 물체인지 라벨을 붙인다.


사용 용도

  • 제조업 : 흠집 탐지
  • 의료 영상 : 병변 감지
  • 자율 주행 : 주변 환경 파악
  • 로봇 비전 : 객체와 지형 탐지 등 ..

input,output

  • input : 일반적으로 화상 데이터는 RGB를 포함한 3요소 or + 투명도를 합한 4요소의 배열로 포함된다.

  • output : 물체 클래스의 인덱스 값이 라벨 정보로 하나의 요소이다.


화상 표현 기법

  • 생삭 정보를 표현하는 컬러 팔레트 형식
  • 0부터 라벨 순서대로 대응하는 컬러 팔레트를 준비하고 RGB값을 대응 시킨다.

:: 컬러 팔레트의 한요소를 RGB값으로 표현이 가능하다.

  • ex)

라벨 : 3 ,(사람 클래스)의 컬러 팔레트의 값을 RGB = (192,129,114) 살구색을 라벨 : 4 (말 클래스)의 컬러 팔레트의 값을 RGB = (151,26,85) 핑크색을 한다고 가정하면 :: 출력 배열에서 배열값이 3인건 살구색, 4이건 핑크색으로 나타난다 (위의 사진 참고)

참조

  • 만들면서 배우는 파이토치 딥러닝, 오가와 타로 저, 박광수 옮김, 한빛미디어 (2021)