Computer vision. 말 그대로, 컴퓨터가 인간의 시각적 인식 능력을 가지고 이미지를 분석하고 해석하는 기술 분야이다.
컴퓨터 비전의 목표는 디지털 이미지를 분석하여 의미 있는 정보를 추출하고, 이를 바탕으로 다양한 작업을 수행하는 것.
이를 수행하기 위해, 컴퓨터는 시각적 인식 능력을 가지고 이미지를 처리하고 해석하는 알고리즘을 사용하여 객체를 인식하거나 추적한다. 장면을 이해하거나, 3D 형태로 재구성하는 등의 작업도 수행한다.
컴퓨터 비전의 주요 기술에는,
이미지 처리, 객체인식, 패턴인식, 이미지 분류, 세그멘테이션이 있고 주로 의료, 자율 주행, 보안, 산업 자동화에 응용되어 쓰일 수 있다.
그 중 몇가지 모델에 대해 설명하자면,
객체 인식에서 널리 사용되는 딥러닝 모델 중 하나인 YOLO (You Only Look Once)
: 한 번의 신경망 패스만으로 이미지에서 객체를 탐지하고 그 위치를 예측하는 방식
장점
: 빠른속도, 다수의 객체를 탐지하고 분류하기 때문에 이미지 전반에 걸쳐 일관된 해석을 제공.
또한 이미지 전체 문맥을 고려하기 때문에 잘못된 탐지를 줄이는데 효과적이다.
단점
: 작은 객체를 탐지할때는 성능이 저하되고, 위치 예측의 정확도가 떨어질 수 있다. 그래서 높은 정확도가 요구되는 상황에서는 다른 객체 탐지 모델(R-CNN 계열 모델 등)과 비교했을 때 한계가 있을 수 있다.
객체 인식 분야에서 많이 사용되는 또 다른 모델인 Faster R-CNN(Faster Region-based Convolutional Neural Network)
: 이전 R-CNN 계열 모델들의 성능을 크게 향상. 속도와 정확도를 동시에 개선했다.

장점
: 작은 객체나 복잡한 장면에서도 비교적 높은 정확도 유지하고, 대규모 이미지 데이터셋에서 매우 안정적이고 일관된 성능을 보여준다. 특히 다양한 크기와 형태의 객체가 포함된 복잡한 장면에서도 잘 동작한다. 그래서 다양한 응용이 가능하다.
단점
: Faster R-CNN은 이전 R-CNN 계열 모델보다 빠르지만, 여전히 실시간 객체 탐지를 위한 모델로는 충분히 빠르지 않을 수 있다. 특히 YOLO와 같은 모델에 비해 처리 속도가 느린 편이므로 실시간 성능이 중요한 응용에서는 한계가 있을 수 있다.
또한 복잡한 구조를 가지고 있어 구현이 까다롭다.
상대적으로 작은 객체 탐지에 어려움을 겪을 수 있다. 특히 객체가 매우 작거나 여러 객체가 밀집해 있는 상황에서는 탐지 성능이 저하될 수 있다.

결론적으로, Faster R-CNN은 정확도가 중요한 애플리케이션에 적합하지만, 실시간 응용에는 YOLO와 같은 더 빠른 모델이 선호될 수 있다.
'데이터 분석일기 > deep learning' 카테고리의 다른 글
TensorFlow vs PyTorch (22) | 2024.01.15 |
---|---|
CNN (1) | 2023.11.11 |
ANN (1) | 2023.11.03 |
CNN (Convolutional Neural Network) (0) | 2023.10.26 |
Deep Learning 개요 (0) | 2023.10.24 |
Computer vision. 말 그대로, 컴퓨터가 인간의 시각적 인식 능력을 가지고 이미지를 분석하고 해석하는 기술 분야이다.
컴퓨터 비전의 목표는 디지털 이미지를 분석하여 의미 있는 정보를 추출하고, 이를 바탕으로 다양한 작업을 수행하는 것.
이를 수행하기 위해, 컴퓨터는 시각적 인식 능력을 가지고 이미지를 처리하고 해석하는 알고리즘을 사용하여 객체를 인식하거나 추적한다. 장면을 이해하거나, 3D 형태로 재구성하는 등의 작업도 수행한다.
컴퓨터 비전의 주요 기술에는,
이미지 처리, 객체인식, 패턴인식, 이미지 분류, 세그멘테이션이 있고 주로 의료, 자율 주행, 보안, 산업 자동화에 응용되어 쓰일 수 있다.
그 중 몇가지 모델에 대해 설명하자면,
객체 인식에서 널리 사용되는 딥러닝 모델 중 하나인 YOLO (You Only Look Once)
: 한 번의 신경망 패스만으로 이미지에서 객체를 탐지하고 그 위치를 예측하는 방식
장점
: 빠른속도, 다수의 객체를 탐지하고 분류하기 때문에 이미지 전반에 걸쳐 일관된 해석을 제공.
또한 이미지 전체 문맥을 고려하기 때문에 잘못된 탐지를 줄이는데 효과적이다.
단점
: 작은 객체를 탐지할때는 성능이 저하되고, 위치 예측의 정확도가 떨어질 수 있다. 그래서 높은 정확도가 요구되는 상황에서는 다른 객체 탐지 모델(R-CNN 계열 모델 등)과 비교했을 때 한계가 있을 수 있다.
객체 인식 분야에서 많이 사용되는 또 다른 모델인 Faster R-CNN(Faster Region-based Convolutional Neural Network)
: 이전 R-CNN 계열 모델들의 성능을 크게 향상. 속도와 정확도를 동시에 개선했다.

장점
: 작은 객체나 복잡한 장면에서도 비교적 높은 정확도 유지하고, 대규모 이미지 데이터셋에서 매우 안정적이고 일관된 성능을 보여준다. 특히 다양한 크기와 형태의 객체가 포함된 복잡한 장면에서도 잘 동작한다. 그래서 다양한 응용이 가능하다.
단점
: Faster R-CNN은 이전 R-CNN 계열 모델보다 빠르지만, 여전히 실시간 객체 탐지를 위한 모델로는 충분히 빠르지 않을 수 있다. 특히 YOLO와 같은 모델에 비해 처리 속도가 느린 편이므로 실시간 성능이 중요한 응용에서는 한계가 있을 수 있다.
또한 복잡한 구조를 가지고 있어 구현이 까다롭다.
상대적으로 작은 객체 탐지에 어려움을 겪을 수 있다. 특히 객체가 매우 작거나 여러 객체가 밀집해 있는 상황에서는 탐지 성능이 저하될 수 있다.

결론적으로, Faster R-CNN은 정확도가 중요한 애플리케이션에 적합하지만, 실시간 응용에는 YOLO와 같은 더 빠른 모델이 선호될 수 있다.
'데이터 분석일기 > deep learning' 카테고리의 다른 글
TensorFlow vs PyTorch (22) | 2024.01.15 |
---|---|
CNN (1) | 2023.11.11 |
ANN (1) | 2023.11.03 |
CNN (Convolutional Neural Network) (0) | 2023.10.26 |
Deep Learning 개요 (0) | 2023.10.24 |