1. 컴퓨터 비전(Computer Vision)의 발전과 단순 인식의 한계 도전
인공지능이라는 기계의 눈을 밝히는 방법은 '컴퓨터 비전'(Computer Vision)을 통한 기술입니다. 컴퓨터 비전은 이미지나 동영상 분석방식을 통해 우리들이 알고 있는 시각적인 정보를 추출해 내는 기술을 말합니다. 컴퓨터가 인간들이 그렇듯 보고 이해할 수 있도록 만드는 기술입니다. 한마디로 인간의 '눈'이 되는 것입니다.
비전이라는 단어에서처럼 시각적인 단어를 유추할 수 있습니다. 컴퓨터를 이용하여 시각 기능을 갖는 기계를 통틀어 얘기합니다. 이미지 영상을 전처리 과정을 거쳐 컴퓨터가 식별가능한 부분으로 추출하여 분석이 진행됩니다. 그래서 어느덧 사물에 눈을 띄게 됐습니다. 컴퓨터 관점에서 이미지는 단순히 픽셀(Pixel)이라는 단순 화소의 조합으로만 여겨졌습니다. 각 화소는 특정 색들의 비트값으로 대변되는 방식으로 색깔을 식별했습니다. 딥러닝 이전에는 단순히 화소들의 조합을 통해 색감을 이해하는 수준이었습니다. 기존의 컴퓨터 비전 기술은 단순 픽셀조합에 대한 인식을 통해 진행하려고 하다 보니 별다른 소득이 없었습니다. 인간은 사물에 대해 위치, 크기, 방향과 더불어 조명이나 햇빛의 조망으로 물체를 식별해 내는 능력이 있는데 그에 비해 컴퓨터는 기존방식으로는 능력적으로 한계가 있었습니다.
2. 딥러닝(Deep Learning)이 컴퓨터 비전(Computer Vision)으로 발전
컴퓨터 비전(Computer Vision)의 비약적인 발전은 2012년 알렉스넷의 이미지넷 대회에서 우승한 이후부터입니다. 이런 대회를 토대로 표준 이미지 데이터베이스의 구축이 이뤄지는 등 세계 인구 5만 명이 참여하는 대형 프로젝트가 컴퓨터 비전 발전을 견인했습니다. 10억 장의 이미지에서 1,500만 장의 표준 이미지 선별하고 2만여 개의 카테고리로 분류 처리했습니다. 이런 표준 이미지 데이터베이스를 통해 표준환경에서 딥러닝 기술을 활용함으로써 획기적으로 발전했습니다. 알렉스넷은 8개의 층(Layer)으로 이뤄진 합성곱 신경망을 기반으로 개발되었으며, 층을 다수로 쌓기 위한 기술적 한계에 봉착하여 확장에는 실패했습니다. 이후 구글에서 발표한 '구글넷'은 합성곱 신경망 기반의 인셉션 아키텍처를 통해 이후 대회에서 우승을 차지했습니다. 이후 정교한 알고리즘이 발표되어 관련 컴퓨터 비전이 비약적으로 발전하게 됐습니다.
특히 인간의 얼굴 자체를 인식하는 안면인식기능으로 확대되면서 페이스북이 '딥페이스'(DeepFace)를 개발하면서 사진 속의 인물사진에서 본인을 추출하는 기능까지 발전하게 됐습니다.
3. 컴퓨터 비전(Computer Vision)의 확대 응용
합성곱 신경망을 기반으로 하는 현대의 컴퓨터 비전(Computer Vision)은 딥러닝(Deep Learning) 기술을 적용하는 분야 중에서 가장 심도 있고 깊이 있게 발전 확대되고 있습니다. 특히 테슬라를 선두로 자율주행 자동차 업계에서 가장 활용범위가 넓은 분야입니다. 자율주행은 전체 생산구조를 플랫폼 화하여 대량 생산이 가능한 산업분야입니다. 그리고 자동차에서는 다양한 카메라와 초음파, 레이저 및 라이다(LiDAR)까지 필요한 센서 덩어리입니다. 다양한 센서가 각자의 역할을 수행하며 차량 내외부의 환경적인 요소를 식별하고 그에 맞게 판단을 내리는 주요한 부분이라 컴퓨터 비전의 발전에 선두주자가 됐습니다. 차량에 대한 센서의 중요성은 인명사고와 직결되는 부분이라 관련 법령 및 법규에서도 상당한 안전성을 요청하는 기술적 수준이기 때문에 관련 기술개발에도 한계를 돌파하는 기술적 발전을 추진하고 있습니다.
딥러닝 자체는 위험을 감지하고 차선 변경 및 유턴등 주행에 대한 안정성 확보를 위해 관련 기술이 개발되고 있습니다. 드론 같은 경우도 여러 외부환경에 정확한 사물을 식별하고 위험을 감지하기 위해 컴퓨터 비전의 발전적 형태로 진화하고 있습니다. 향후 딥러닝 기반의 기술적 방법으로 건설업 및 보안업무에도 직접적으로 적용할 수 있는 계기가 마련될 거라 생각됩니다.
댓글