본문 바로가기
카테고리 없음

이미지 인식 알고리즘 공부

by 쭈잇 2019. 7. 1.

Contents

    반응형

    이미지 인식 분야에서 다루는 문제를 크게 3가지로 정의한다.

    1. Classification

    2. Detection

    3. Segmentation

     

     

    Classification

    주어진 이미지 안에 어느 특정한 클래스에 해당하는 사물이 포함되어 있는지 여부를 분류하는 모델을 만드는 것을 주요 목표

    (클래스란, 분류 대상이 되는 카테고리 하나하나를 지칭한다)

     

    * Classification 을 수행하기 전, 반드시 관심의 대상이 되는 클래스들을 미리 정해놓고 작업을 시작해야한다.

     

    주어진 이미지 안에 특정 클래스의 사물이 존재할 '가능성'을 나타내는 신뢰도 점수를 제출하도록 요구한다.

    즉, 주어진 이미지 안에 클래스 X의 사물이 있다라는 단정적인 결론 대신, 주어진 이미지 안에 클래스 X의 사물이 존재할 가능성이 sX, 클래스 Y의 사물이 존재할 가능성이 sY, ... 식의 결과물을 제출하도록 요구한다. 

     

     

     

     

    신뢰도 점수에 대한 해석 방법

    Classification 문제에서 분류의 대상이 되는 이미지에는 반드시 하나의 사물만이 포함되거나, 복수개의 서로 달느 사물들이 포함도리 수도 있다.

     

    반드시 하나의 사물만 포함되도록 전제하면 '단일 사물분류'문제로, 전체 클래스에 대한 신뢰도 점수 중 가장 큰 신뢰도 점수를 갖는 클래스를 고르면 된다.

     

    하지만, 이미지 상에 복수 개의 사물들이 포함되어 있을 수있는 경우는 다르다. '복수 사물 분류' 에서는 각 클래스마다 문턱값 (treshold) 을 미리 설정해 놓고, 주어진 이미지의 각 클래스별 신뢰도 점수가 문턱값보다 큰 경우에 한하여 해당 클래스에 포함되어 있을 것이라고 결론짓도록 한다.

     

    -> 문턱값을 넘은 신뢰도의 클래스들을 고른다.

     

    그렇다면 각 클래스이 문턱값은 어떻게 결정해야할까? 이는 어느 평가 척도를 사용하여 평가할지의 문제와 같이 엮어 고민해야하는 부분이다.

     

     

     

    평가척도

    정확도 (Accuracy)

     

    정확도 = 올바르게 분류한 이미지 수  /  전체 이미지 수

     

     

    복수 사물 분류에서는 정확도만으로는 판단하기 곤란해, 정밀도(precision) 재현율(recall) 등의 평가 척도를 사용한다.

    ( 다른 클래스와는 독립적으로, 하나의 클래스에 대하여 매겨지는 평가 척도이다.)

     

    어느 특정 클래스 C의 정밀도는, 

     

    클래스 c의 정밀도 = 올바르게 분류한 클래스 c이미지 수 / 클래스 c일 것으로 예측한 이미지 수

     

    클래스 c의 재현율 = 올바르게 분류한 클래스 c이미지수 / 전체 클래스 c 이미지수

     

     

    이렇게 각 클래스에 대한 정밀도와 재현율을 계산한 뒤, 이들 전체 대표값(representative value) 을 취하고, 이를 최종적인 평가 척도로 삼을 수 있다. 구체적으로 전체 C개 클래스에 대한 평균 정밀도 및 평균 재현율을 계산하고자 한다면, 아래와 같은 공식을 사용할 수 있다.

    ( 이때, '클래스 c이미지'란 클래스 c에 해당하는 사물을 포함하고 있는 이미지를 지칭한다)

     

     

     

    신뢰도 점수의 문턱값에 따른 평가 척도 수치의 변화 가능성

     

    복수 사물 분류 문제의 경우, 각 클래스 별로 신뢰도 점수에 대한 문턱값을 어떻게 결정해야하는지에 대한 이슈가 여전히 남아있다.

     

    예를 보자

    (편의상 주어진 이미지를 'car' 클래스로 예측하지 않은 경우를 not car 클래스라고 지칭한다)

    1) 'car' 클래스의 문턱값

     

     

     

     

    [참고]

    http://research.sualab.com/introduction/2017/11/29/image-recognition-overview-1.html

     

     

    반응형