#컴퓨터의 물체 인식
-
과학과 놀자
얼굴로 스마트폰 잠금해제…어떻게 감지·구별하나
최근 휴대폰엔 암호나 지문 대신 얼굴을 인식해 잠금을 해제하는 페이스 아이디(Face ID) 기능이 있다. 또 많은 사람이 본인의 모습을 특색 있게 남기기 위해 눈, 코, 입의 위치를 인식하는 앱을 사용하기도 한다. 이러한 작업을 위해서는 컴퓨터, 즉 기계가 이미지 정보를 인식해 얼굴 영역을 파악하고 또 그에 더해 눈, 코, 입의 위치를 파악해야 한다.컴퓨터는 어떻게 우리 얼굴을 감지하는 것일까? 확실하게 말할 수 있는 것은 사람이 물체를 인식하는 것과 컴퓨터가 물체를 인식하는 방식은 다르다는 것이다.컴퓨터는 사진이나 이미지를 디지털화된 숫자로 인식한다. 조금 더 구체적으로 말하면, 우리가 가진 디지털 이미지는 이미지의 크기만한 행렬로 표현되며 (여기서 이미지의 크기란 우리가 아는 해상도이다), 각각의 포인트는 픽셀이라고 불린다. 이 픽셀은 총 3개의 RGB(Red, Green, Blue)값을 갖는다. 즉 컴퓨터는 이미지를 3차원 배열(가로×세로×RGB)로 인식한다.따라서 컴퓨터를 사람이 인식하는 것처럼 픽셀 수준이 아니라 영역 위주로 정보를 인식하게 하려면 추가적인 계산이나 방법을 필요로 하게 되는데, 이렇게 컴퓨터가 물체나 사람을 인식하고 이미지 속 상황을 해석해 내는 것을 컴퓨터 비전이라고 한다. 컴퓨터 비전 세부 태스크들은 크게 객체 분류(image classification), 객체 탐지(object detection), 의미론적 분할(semantic segmentation)로 나눌 수 있다.객체 분류란 보통 이미지 인식이라고도 불리며, 이미지 속에 있는 객체를 인식하여 그 객체가 어떤 클래스에 포함되는지를 파악하는 기술이다. 컴퓨터 비전 영역에서 가장 기초적인 분야다. 예를 들어 비행기 사진을 입력하였을 때 이것이 비행기 클