소프트웨어 HOME > 보유기술 > 소프트웨어 > 사람검출 및 카운팅
1. 다통솔루션_DTS의 사람검출은 YOLO기반으로 개발
- Single NN을 통한 오브젝트의 영역 예측으로 기존 R-CNN, Fast R-CNN보다 빨라 실시간 카메라 영상 적용에 적합합니다.
- Full CNN 구조의 자체 개발 모델을 개발하여 정확성을 높였습니다.

2. 최종 레이어에서 Object Template Scale의 Anchors를 적용하여 검출에 최적화 된 검출기 개발
DTS People Detector는 Full CNN 구조기반으로 개발

Convolutional Neural Network(CNN)은 CONV, ReLU, POOL, Dropu-out을 번갈아서 적용하는 것을 말합니다.
Start with an image (width x height x depth)으로 구성되며, 이것은 32 x 32 x 3image로 나타낼 수 있고 3image의 '3' 은 red, green, blue로 표현 할 수 있습니다. (gray scale일 경우 1의 depth를 나타냅니다.)

결국은 Filter를 상징하는 Weight Sharing를 찾는 것이 Convolutional Neural Network(CNN)의 목적이라 할 수 있습니다. 왜냐하면 보통 Stride=1을 주기 때문에 다수의 필터들이 한칸씩만 옆으로 이동하면서 적용되므로 많은 weight들이 서로 공유하고 있는 형태가 됩니다. 따라서 사진처럼 인접한 Pixel들이 서로 관련성이 매우 높아야 합니다. Filter를 이미지에 적용(conv+ReLU)의 경우 Stride에 따라서 나오는 이미지의 크기가 달라지게 되고, Filter의 사이즈가 너무 작을경우 weight를 구하는 것은 의미가 없습니다. 출력크기 = 1+ (입력크기-필터크기) / stride 크기

Pooling (Sampling or Resizing) 기법중에서 가장 많이 사용하는 Max Pooling은 여러개의 값 중에서 가장 큰 값을 꺼내 모아 놓은 것을 말합니다. 이전에 Convolutional Layer에서는 Filter를 곱해서 새로운 출력 결과물을 만들어낼 수 있지만 이와 다르게 Polling는 단순하게 존재하는 값 중 하나를 선택합니다. (Max Pooling은 여기서 가장 큰 값을 선택)

[Figure 1] Detector 객체감지 구조
DTS의 객체감지 방식은 최종레이어에서 Object Template 형태와 Scale의 Anchors를 적용하여 객체(사람)검출에 최적화 할 수 있습니다.

최종 레이어에서 YOLOv2에는 13x13 그리드로 각 셀의 앵커를 사용하여 객체 위치를 예측하는 '영역'레이어가 있는데, 앵커는 객체 모양과 규모의 템플릿이 됩니다. 본 객체감지 방식의 경우 사람의 형태와 척도, 우리는 30,000 이미지의 데이터 세트를 사용하여 YOLOv2에 대한 4 개의 사용자 정의 앵커 (그림 2)를 생성합니다.
소프트웨어영상 전체보기 →
(주)다통솔루션_DTS의 모든 시스템은 고객사의 Needs에 맞게 Customizing이 가능하며,
보다 편리하게 사용할 수 있도록 오늘도 열심히 달리고 있습니다.
(주)다통솔루션  |   대표자 : 경규호  |   본사 : 경기도 성남시 수정구 복정로 76 동서울대학교 5호관 5313호  |   공장 : 강원도 춘천시 서면 안보리 352
사업자등록번호(법인사업자) : 206-86-93644  |   개인정보보호책임자 : 조태교  |   TEL : 1544-1930 (09:00 - 18:00)  |   FAX : 070-4015-2045
Copyright © 2017 DATONGSOLUTION CO.,Ltd All Rights Reserved.