Benchmarking SAR Target Detection Networks and Analysis of Degradation Depending on the Phase Error

Back, Minyoung; Ok, Jaewoo; Shin, Heesub

doi:10.5515/KJKIEES.2024.35.10.770

J. Korean Inst. Electromagn. Eng. Sci. 2024; 35(10):770-779

pISSN: 1226-3133, eISSN: 2288-226X

DOI: https://doi.org/10.5515/KJKIEES.2024.35.10.770

특집논문/SPECIAL EDITION

SAR 영상 탐지식별 네트워크 벤치마크 및 위상 오차에 의한 열화 분석

백민영^†

, 옥재우

, 신희섭

Benchmarking SAR Target Detection Networks and Analysis of Degradation Depending on the Phase Error

Minyoung Back^†

, Jaewoo Ok

, Heesub Shin

Author Information & Copyright ▼

^{LIG넥스원(주)}

^{LIG Nex1 Co., Ltd}

^†Corresponding Author: Minyoung Back (E-mail: minyoung.back@lignex1.com)

© Copyright 2024 The Korean Institute of Electromagnetic Engineering and Science. This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Jul 22, 2024; Revised: Aug 13, 2024; Accepted: Oct 07, 2024

Published Online: Oct 31, 2024

요 약

SAR 영상은 전천후 주야간 관측에 유리하지만 광학 영상에 비해 데이터 획득 및 분석이 어렵다는 단점이 있다. 지속적인 감시정찰 및 모니터링의 목적으로 SAR 영상의 활용과 더불어 딥러닝 연구에 대한 관심이 높아지면서 모델 구축을 위한 고품질의 학습 데이터셋에 대한 필요성 역시 높아지고 있다. 특히 SAR 영상에서의 탐지식별의 경우 육안 분석이 비교적 용이하고 라벨링의 난이도가 낮은 해상 선박에 대한 데이터셋이 대부분이고 그 외 표적에 대해서는 부족한 실정이다. 따라서 본 연구에서는 지상 군사 표적에 대한 탐지식별 데이터셋을 구축하고 활용해 보고자 하였다. 검증된 SAR 데이터셋 중 하나인 MSTAR 데이터셋을 기반으로 새로운 탐지 데이터셋을 구축하였고 다양한 탐지 모델을 적용해 데이터셋을 검증함과 동시에 지상 표적 탐지에 대한 벤치마크를 수행한 결과 전반적으로 mAP 0.8 이상의 좋은 탐지 성능을 도출하였다. 추가적으로, 구축한 탐지 모델을 실제 항공 SAR 영상 등에서 활용할 경우를 대비해 평가 영상에 위상 오차가 포함되는 경우에 대한 분석까지 수행하였다. 영상 및 탐지 성능 열화 관점에서 탐지 성능이 크게 하락하지 않는 위상 오차에 대한 허용 범위를 판단할 수 있었다. 이를 바탕으로 평가 영상 획득시 요동 제어를 위한 자료로 활용할 수 있고 이 외에 다양한 영상 오차를 고려하여 더욱 강건한 데이터셋 및 모델 구축에 대한 기반이 될 수 있을 것으로 기대한다.

Abstract

SAR images are more difficult to analyze and acquire than optical images; therefore, high-quality datasets for deep learning models are insufficient. In this study, a new detection dataset was generated based on the MSTAR dataset to train detection networks for ground military targets. To verify the dataset and analyze the performance of the ground target detection network in SAR images, various models were used to compare the detection ability, resulting in an overall good performance of mAP 0.8 or higher. In addition, we analyzed the performance change trends if phase errors were included in the test images. In terms of image and detection performance degradation, we determined an acceptable range for the phase error that did not significantly reduce the detection performance. This is expected to contribute to the creation of more robust networks when building SAR image datasets and models in the future.

Keywords: Synthetic Aperture Radar (SAR); Deep Learning; Detection; Synthetic Data; Phase Error

Ⅰ. 서 론

딥러닝은 데이터 기반의 연구로서 의미있는 연구를 수행하기 위해서는 양질의 데이터셋이 필수적이다. 하지만 SAR(synthetic aperture radar) 영상은 광학 영상에 비해 육안 분석이 어렵고 데이터 획득도 쉽지 않아 딥러닝 모델을 학습하기 위한 고품질의 데이터셋이 부족한 현황이다. 특히 탐지식별의 경우 비교적 라벨링이 용이한 해상 선박 데이터셋이 대부분이다. 본 연구에서는 지상 군사 표적에 대한 딥러닝 탐지식별 연구를 수행하기 위해 미국방부에서 탱크, 수송차, 로켓 런처, 불도저, 트럭 등 10개 클래스에 대해 구축한 MSTAR(moving and stationary target acquisition and recognition)^[1] 식별 데이터셋을 기반으로 새로운 탐지 데이터셋을 구축하였다. 이후 이를 검증하고 SAR 영상에서의 지상 표적 탐지 네트워크의 전반적인 성능을 확인하기 위해 다양한 모델들에 대한 벤치마크를 수행하였다. 또한 향후 실제 항공 SAR 영상에서의 활용을 고려하여 항공기 요동 및 시스템 내부 오차 등에 의해 발생할 수 있는 위상 오차에 따른 탐지 성능 변화 경향성을 분석하고자 하였다.

본 논문에서는 먼저 MSTAR 데이터셋의 합성을 통해 탐지 데이터셋을 구축한 방법에 대해 서술하였다. 배경과 표적으로 구성되는 탐지 데이터셋의 특성을 고려하여 다양한 표적 및 배경을 포함하며 둘 사이의 이질감을 줄이는 것을 목표로 하였다. 그렇게 구축된 데이터셋을 검증하기 위해 탐지 모델 학습 및 평가를 통한 벤치마크를 수행하였다. 가장 기본적인 탐지 모델부터 속도는 느리지만 정확도가 높은 2-stage 모델과 정확도는 떨어지지만 연산 효율이 좋은 1-stage 모델을 모두 포함하여 다양한 네트워크를 활용해 성능을 분석하였다. 추가적으로 정제된 데이터셋으로 학습 및 평가를 수행한 벤치마크 성능을 베이스라인으로 삼고 평가 영상에 위상 오차가 추가될 경우 탐지 성능이 열화되는 경향성을 확인하였다. 위상 오차의 성분 및 정도에 따른 성능 변화 뿐 아니라 서로 다른 탐지 모델 간의 성능 변화 차이 여부도 분석하였다. 해당 결과를 바탕으로 기구축 모델을 활용하여 실제 SAR 영상에서 지상 표적 탐지를 수행할 경우 평가 영상에서 허용 가능한 오차의 범위를 정의할 수 있었고 향후 SAR 영상 획득 실험시 항공기 요동 및 시스템 내부 오차 제어를 위한 자료로 활용할 수 있을 것으로 기대한다.

Ⅱ. SAR 탐지식별 데이터셋 구축

데이터 기반의 딥러닝 네트워크 연구를 수행하기 위해서는 양질의 데이터셋을 구축하는 것이 가장 중요한 부분이라고 볼 수 있다. 본 연구에서는 MSTAR 데이터셋을 기반으로 표적과 배경 영상을 합성하여 SAR 영상에서의 지상 표적 탐지 데이터셋을 구축하고자 하였다. 이번 장에서는 데이터셋을 생성하는 방법을 서술하고자 한다.

배경 영상에 표적을 합성하기 위해서 가장 먼저 표적 패치 영상에서 표적에 해당하는 부분을 분할하여 그에 대한 라벨 데이터를 생성하였다. 패치 영상 내 상위 3 % 밝기 영역은 표적으로, 하위 25 % 밝기 영역은 그림자로 정의^[2]하여 표적과 그림자의 위치에 대한 정보 및 표적의 클래스 등을 포함하고자 하였다. 이 때 MSTAR 데이터셋에 포함된 표적의 azimuth 각도를 기반으로 표적의 방향성까지 정의할 수 있었다. 영상에서 보여지는 방향이 유사하더라도 azimuth 각도에 따라 표적의 바운딩 박스 포인트 순서를 다르게 부여해 박스의 방향성을 지정할 수 있다. 그에 따라 표적의 azimuth 각도와 rotated 바운딩 박스의 각도가 유사하도록 라벨링 정보를 저장하였다.

다음으로 표적 영상과 배경 영상을 각각 학습과 평가셋의 3 대 1 비율로 분리하였다. 표적 영상의 경우 SOC (standard operating condition) 환경에서의 범용적인 활용 및 충분한 영상 수를 확보하기 위해 고각 15, 16, 17도의 표적을 사용하였다. 배경 영상으로는 MSTAR 데이터셋에 포함되어 있는 클러터 영상을 활용하였다. 다양한 배경을 포함하는 양질의 데이터셋을 생성하기 위해 오버랩을 포함하여 배경 영상을 약 500×500의 크기로 패치화하였다. 최종적으로 사용한 표적 및 배경 영상의 개수는 표 1과 같다.

표 1. | Table 1. 구축한 데이터셋의 표적 및 배경 영상 수 | The number of targets and background images.

	Train	Test
Target patches	4,742	1,577
Background	1,875	625
Synthesized targets	9,003	2,890

Download Excel Table

합성에 사용할 표적 영상 및 배경 영상을 준비한 후 배경 영상 내 표적이 위치할 수 있는 영역을 정의하고자 하였다. 빌딩이나 숲 등 표적이 위치할 수 없는 영역을 피하기 위해 배경 영상에서 일정 영역에 대해 반사계수의 표준편차가 임계치 이하인 영역으로 제한하였다. 해당 영역에서 무작위로 표적의 위치 선정 후 거리가 너무 가까운 경우는 제거하여 표적이 겹쳐서 나타나지 않도록 하였다(그림 1).

그림 1. | Fig. 1. 배경 영상 내 표적 위치 선정 과정 | Process to decide target locations.

Detector	mAP	Mean recalls	FPS [imgs/s]	CUDA memory [MB]
Faster RCNN	0.849	0.901	7.7	381
RoI transformer R50	0.859	0.908	7.1	533
RoI transformer swin-tiny	0.887	0.953	7.4	544
ReDet	0.768	0.758	6.2	546
FCOS	0.812	0.659	56.4	300
RTMDet large	0.867	0.917	41.8	389
RTMDet tiny	0.831	0.633	58.5	174

	Azimuth resolution [m]	PSLR [dB]	ISLR [dB]
Original	0.3919	−23.6549	−19.6612
2nd error	1.7837	−0.4207	−1.0776
3rd error	0.5919	−8.5041	−10.0035
4th error	0.5411	−17.4039	−14.2726
5th error	0.4507	−17.5649	−15.8569

Error ratio (deg)	2nd error	3rd error	4th error	5th error
0	0.7268	0.7268	0.7268	0.7268
30	0.7276	0.7260	0.7265	0.7267
60	0.7354	0.7189	0.7279	0.7252
90	0.7342	0.7185	0.7293	0.7186
120	0.7207	0.7177	0.7299	0.7173
150	0.7274	0.7175	0.7279	0.7173
180	0.7268	0.7183	0.7267	0.7160
210	0.7159	0.7168	0.7202	0.7164
240	0.7122	0.7047	0.7110	0.7160
270	0.7021	0.7033	0.7182	0.7145
300	0.6889	0.6999	0.7085	0.7058
330	0.6816	0.6983	0.7057	0.7052
360	0.6554	0.6798	0.7028	0.7030
390	0.6404	0.6755	0.6998	0.7043
420	0.6196	0.6653	0.7005	0.7035
450	0.5830	0.6629	0.6913	0.7033
480	0.5673	0.6365	0.6821	0.7013
510	0.5374	0.6315	0.6799	0.6968
540	0.5078	0.6205	0.6709	0.6944
570	0.4862	0.6101	0.6611	0.6842
600	0.4508	0.5954	0.6558	0.6688

Error ratio (deg)	2nd error			3rd error
Error ratio (deg)	Faster RCNN	RTMDet large	RoI trans. swin-tiny	Faster RCNN	RTMDet large	RoI trans. swin-tiny
0	0.7268	0.8466	0.8952	0.7268	0.8466	0.8952
30	0.7276	0.8462	0.8957	0.7260	0.8463	0.8962
60	0.7354	0.8549	0.8967	0.7189	0.8459	0.8956
90	0.7342	0.8554	0.8895	0.7185	0.8458	0.8961
120	0.7207	0.8549	0.8951	0.7177	0.8456	0.8889
150	0.7274	0.8544	0.8872	0.7175	0.8455	0.8890
180	0.7268	0.8541	0.8864	0.7183	0.8457	0.8875
210	0.7159	0.8453	0.8845	0.7168	0.8449	0.8856
240	0.7122	0.8441	0.8819	0.7047	0.8355	0.8850
270	0.7021	0.8341	0.8791	0.7033	0.8347	0.8841
300	0.6889	0.7996	0.8686	0.6999	0.8336	0.8818
330	0.6816	0.7981	0.8476	0.6983	0.8328	0.8810
360	0.6554	0.7871	0.8344	0.6798	0.8316	0.8715
390	0.6404	0.7666	0.8051	0.6755	0.8240	0.8703
420	0.6196	0.7365	0.7926	0.6653	0.8218	0.8686
450	0.5830	0.7314	0.7765	0.6629	0.7967	0.8500
480	0.5673	0.7177	0.7458	0.6365	0.7940	0.8404
510	0.5374	0.6601	0.7220	0.6315	0.7865	0.8296
540	0.5078	0.6427	0.6917	0.6205	0.7844	0.8267
570	0.4862	0.6029	0.6668	0.6101	0.7753	0.8072
600	0.4508	0.5753	0.6339	0.5954	0.7394	0.7896

SAR 영상 탐지식별 네트워크 벤치마크 및 위상 오차에 의한 열화 분석

요 약

Abstract

Ⅰ. 서 론

Ⅱ. SAR 탐지식별 데이터셋 구축

Ⅲ. SAR 탐지식별 모델 벤치마크

Ⅳ. 위상 오차에 따른 영상 및 탐지 성능 변화 분석

Ⅴ. 결 론

Acknowledgements

References

Notes