Comparative Study on Anomaly Detection Models to Infer Workers’ Walking Hazards using Video Keypoint Detection

Taeyoon Kim; Sungjoo Hwang; Siyeon Kim

doi:10.55785/JCAR.5.1.8

Preview

Journal of Construction Automation and Robotics. 31 March 2026. 8-16
https://doi.org/10.55785/JCAR.5.1.8

Comparative Study on Anomaly Detection Models to Infer Workers’ Walking Hazards using Video Keypoint Detection

CCTV 영상 키포인트 감지 기반의 건설 현장 작업자 보행 위험 추론을 위한 이상치 탐지 모델 비교 연구

Taeyoon Kim¹

Sungjoo Hwang²^*

Siyeon Kim³

김 태윤¹

황 성주²^*

김 시연³

¹Ph.D. Student, Department of Architectural & Urban Systems Engineering, Ewha Womans University

²Corresponding Author, Member, Associate Professor, Department of Architectural & Urban Systems Engineering, Ewha Womans University

³Postdoctoral Research Fellow, School of Construction Management Technology, Purdue University

¹이화여자대학교 건축도시시스템공학과 박사과정

²교신저자 ‧ 종신회원 ‧ 이화여자대학교 건축도시시스템공학과 부교수

³퍼듀대학교 건설관리기술학부 박사후 연구원

^{*Corresponding Author}

License (open-access, http://creativecommons.org/licenses/by-nc/4.0/):

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

ABSTRACT

Construction sites are high-risk environments where changing obstacles pose dangers of falls and collisions for workers. Traditional safety management, relying on visual inspections or wearable sensors, faces practical limitations such as equipment costs and worker resistance. To address these issues, this study proposes using existing CCTV infrastructure and video-based keypoint detection technology to detect walking abnormalities. We define the spatiotemporal correlation between the left and right ankle coordinates as a feature and compare the performance of four anomaly detection methods (Z-score, IQR, Mahalanobis Distance, LSTM Autoencoder). The results show that statistical methods often produce false positives due to a lack of temporal context, while the LSTM Autoencoder model performed best with an F1-score of 83.1%. This study demonstrates the feasibility of building an intelligent safety management system that identifies potential walking hazards through video analysis alone, without additional equipment.

Keywords

Construction Safety

Keypoint Detection

Anomaly Detection

Gait Analysis

LSTM Autoencoder

건설 현장은 시시각각 변화하는 비정형적 장애물로 인해 작업자에게 전도, 충돌, 낙상 위험을 초래하는 고위험 환경이다. 기존 육안 점검이나 웨어러블 센서 기반의 안전 관리는 추가 장비 비용과 착용 거부감 등 실무적 한계에 직면해 있다. 이를 극복하기 위해 본 연구는 기존 CCTV 인프라와 영상 기반 키포인트 감지 기술을 활용하여 작업자 안전을 위한 보행 이상을 탐지하는 방법론을 제안한다. 건설현장 대체 환경에서 작업자의 좌우 발목 좌표 간 시공간적 상관관계를 특징으로 정의하고, 통계 및 기계학습을 포함한 4가지 이상치 탐지 기법(Z-score, IQR, Mahalanobis Distance, LSTM Autoencoder)의 성능을 비교 분석하였다. 실험 결과, 통계 기반 기법들은 시계열적 맥락을 반영하지 못해 오검출이 잦았던 반면, LSTM Autoencoder 모델은 F1-score 83.1%로 가장 우수한 성능을 입증하였다. 또한, 본 연구는 별도의 장비 도입 없이 영상 분석만으로 작업자의 신체 반응을 파악하여, 잠재적 보행 위험 구역을 식별하는 지능형 안전 관리 시스템의 구축 가능성을 확인하였다.

키워드

건설 안전

키포인트 감지

이상치 탐지

보행 분석

LSTM 오토인코더

MAIN

1. 서 론
2. 선행연구
3. 연구 방법
3.1 데이터 수집 및 처리
3.2 키포인트 좌표 검출
3.3 이상치 탐지 방법
4. 연구 결과
4.1 이상치 탐지 성능 비교
4.2 실제 현장 적용성 확인
5. 결 론

1. 서 론

건설 현장은 자재 적치, 임시 구조물 설치, 장비 이동 및 각종 케이블 노출 등으로 인해 보행 환경이 시시각각 변화하는 고위험 공간이다. 이러한 비정형적 장애물은 현장 작업자의 보행 불안정성을 유발하며, 이는 전도, 충돌, 낙상 사고로 이어질 위험이 크다. 기존의 안전 관리는 관리자의 육안 점검이나 사후 분석에 의존해 왔으나, 최근에는 웨어러블 장치를 활용한 실시간 모니터링 기술이 대안으로 제시되고 있다(Ibrahim et al., 2025). 하지만 웨어러블 기반 방식은 추가적인 장비 도입 비용, 유지보수의 어려움, 작업자의 착용 거부감 등으로 인해 실제 현장 전면에 도입하기에는 현실적인 한계가 존재한다.

이러한 문제를 해결하기 위해 기존에 설치된 CCTV 인프라를 활용한 영상 분석 기술이 주목받고 있다. CCTV 기반 모니터링은 별도의 장착 기기 없이도 광범위한 공간을 지속적으로 관찰할 수 있다는 장점이 있다. 최근 딥러닝 기술의 발전으로 보행자 탐지 및 궤적 분석을 통해 보행 불편 요인을 추론하는 연구가 수행되고 있으나(Kanu-Asiegbu et al., 2021; Kim et al., 2024), 단순 객체 추적 방식은 발걸음의 미세한 변화나 하체 움직임을 정교하게 포착하는 데 어려움이 있다.

본 연구는 이러한 한계를 극복하기 위해 CCTV 영상 기반의 키포인트 감지 기술을 활용하여, 작업자의 좌우 발목 좌표 간 상관관계 변화를 분석함으로써 보행 이상을 탐지하는 방법론을 고찰한다. 본 연구에서 정의하는 이상치는 작업자가 평탄한 환경에서 걷는 규칙적인 보행 주기에서 벗어나, 보폭의 급격한 변화, 발목의 교차, 혹은 멈춤 등이 발생하는 비정상적인 거동 패턴을 의미한다. 건설 현장의 특성을 고려할 때, 이러한 보행 데이터의 이상치는 자재 적치물이나 노출된 케이블과 같은 물리적 장애물에 대한 작업자의 무의식적인 회피 또는 균형 상실 반응으로 볼 수 있다. 이를 바탕으로 본 논문은 기초 연구로서, 다중 작업자 환경에서의 추적 안정성을 확보하는 전처리 과정을 기술하고, 통계 및 머신러닝 기반의 다양한 이상치 탐지 기법들을 비교 분석하여 건설 현장의 보행 위험 구역 추론에 가장 적합한 방법을 식별하고자 한다.

2. 선행연구

CCTV 기반 모니터링은 특정 개인이 아닌 공간 전체를 대상으로 한다는 점에서 광범위한 현장 관리를 가능하게 하며, 최근 딥러닝 기법을 활용한 보행 이상 감지 연구가 활발히 진행되고 있다. 이러한 비지도 학습 기반의 접근 방식은 명시적으로 정의하거나 라벨링하기 어려운 건설 현장의 불규칙한 작업자 행동을 식별하는 데 효과적이다. 특히 정상적인 보행 패턴을 기준으로 학습된 모델이 예측 오차를 발생시키는 지점을 식별함으로써 비정상적인 움직임을 감지할 수 있다. Kanu-Asiegbu et al.(2021)은 보행자 궤적 예측 모델을 통해 이상 징후를 감지하는 방법론을 제안하였으며, Kim et al.(2024)은 구간별 보행 궤적의 이상 밀도를 분석하여 보행 불편 요인을 추론하였다. 그러나 대다수의 기존 연구는 단일 지점 기반의 궤적 추적에 의존하고 있어, 장애물 조우 시 발생하는 미세한 하체 반응이나 발걸음 단위의 움직임 변화를 포착하는 데에는 한계가 있다.

연구는 이러한 한계를 극복하기 위해 키포인트 감지(Keypoint Detection) 기술을 도입하여 보행 장애물에 대한 작업자의 신체적 반응을 정밀하게 분석하고자 한다. 키포인트 감지는 영상 프레임 내에서 관절과 같은 해부학적 랜드마크를 식별하고 위치를 추정하는 컴퓨터 비전 기술로, 인체의 자세와 동적 움직임을 정밀하게 수치화할 수 있다(Li et al., 2023). 관련 분야에서 Wang et al.(2021)은 하체 관절의 움직임을 추적하여 재활 경과를 모니터링하는 모델을 제시하였고, Li et al.(2023)은 키포인트 감지와 LSTM 모델을 결합하여 높은 정확도의 보행자 자세 인식을 구현하였다.

하지만 기존 연구들은 주로 단순 행동 분류나 자세 추정의 정확도 향상에 초점을 맞추고 있다. 따라서 본 연구는 건설 현장의 물리적 보행 위험 구역을 식별하기 위한 기초 단계로서, 작업자의 좌우 발목 좌표 간 시공간적 상관관계를 분석하고 이를 최적의 이상치 탐지 알고리즘과 통합하여 그 유효성을 검증하고자 한다.

3. 연구 방법

Fig. 1은 본 연구의 프레임워크를 나타낸다. 먼저 영상 데이터에서 키포인트를 감지해 보행자 좌표를 추출한 뒤, 좌우 발목 간의 시공간적 변위를 계산하여 보행 패턴 특징을 도출한다. 이후 보행 이상 식별을 위해 통계 기반 기법인 Z-score, IQR 그리고 Mahalanobis Distance와 딥러닝 기반의 모델인 LSTM Autoencoder를 적용하여 탐지 성능을 비교 분석한다. 정상 보행 패턴과의 편차를 기준으로 각 방법론을 평가하며, 이를 통해 보행자의 불안정한 궤적이나 멈춤 등의 이상 거동을 가장 정확하게 포착하는 최적의 알고리즘을 선정한다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F1.jpg

Figure 1

Research Framework

3.1 데이터 수집 및 처리

본 연구는 건설현장 대체 환경에서 보편적인 참가자 대상으로 수집된 총 46개의 보행 영상 데이터셋을 활용하였다. 전체 데이터 중 정상 보행 영상 데이터 5개를 학습용으로 사용하였으며, 나머지 41개를 테스트용으로 활용하였다. 검증용 데이터는 정상 보행 24개와 의도적인 장애물 배치를 통해 수집된 비정상 보행 17개로 구성되었다.

보행자의 신체 관절 좌표를 추출하기 위해 딥러닝 기반 키포인트 검출 알고리즘인 OpenPose를 활용하였다(Cao et al., 2017). 비록 최근 들어 보다 가볍고 효율적인 최신 알고리즘들이 다수 제안되고 있으나, OpenPose는 다중 객체 환경에서의 관절 추출 안정성과 현장 작업자 자세 추정의 신뢰성이 선행연구를 통해 검증된 바 있다(Lee et al., 2023). 영상데이터에 키포인트 검출 알고리즘을 적용하여 프레임 단위로 보행자의 신체 관절 좌표를 추출하였다. 추출된 좌표 중 좌우 발목 좌표를 중심으로 보행 움직임을 분석하였으며, 특히 좌우 발목 좌표 간의 관계에 주목하였다.

3.2 키포인트 좌표 검출

추출된 하체 키포인트를 활용하여 보행자의 보행 특성을 분석하기 위해 좌우 발목의 x, y 좌표 변화를 시계열로 시각화하였다. Fig. 2는 시간에 따른 발목 좌표의 변화를 나타낸다. 상단 그래프는 x 좌표의 변화를, 하단 그래프는 y 좌표의 변화를 의미하며, 파란색 실선은 왼발, 빨간색 실선은 오른발의 궤적을 나타낸다. 장애물을 마주한 구간은 노란색 점선 박스로 표시하였다.

Fig. 2(a)와 같이 장애물이 없는 정상 보행 상태에서는 좌우 발목의 x좌표 간격이 비교적 일정하게 유지되었다. 반면, Fig. 2(b)의 장애물을 마주했을 때, 좌우 발목 x좌표 간격이 불규칙해지거나 교차하는 등 전형적인 보행 주기에서 벗어난 패턴이 관찰되었다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F2.jpg

Figure 2

Time series of left and right ankle coordinates with x-coordinates (top) and y-coordinates (bottom) trajectories: (a) Normal walking, (b) Abnormal walking

보행 이상 식별의 변별력을 높이기 위해, 본 연구에서는 좌우 발목 좌표의 상대적 관계를 변수화하여 분석하였다. Fig. 3에서는 좌우 발목 좌표 간 좌표 차이를 시각화하였다. 보라색 선의 그래프는 x좌표의 차이를, 초록색 선의 그래프는 y좌표의 차이를 나타낸다. Fig. 3(a)는 정상 보행, Fig. 3(b)는 이상 보행 경우의 좌우 발복 좌표 차이를 나타낸다. 장애물을 마주한 구간은 노란색 점선 박스로 표시하였다.

이러한 시공간적 좌표 관계의 변화는 건설 현장 내 보행 장애물 구간을 탐지하기 위한 핵심적인 특징으로 활용되며, 본 연구에서는 이를 바탕으로 이상치 탐지 방법들의 성능을 비교 분석하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F3.jpg

Figure 3

Time series of coordinate differences between left and right ankles with dx(top) and dy(bottom) trajectories: (a) Normal walking, (b) Abnormal walking

3.3 이상치 탐지 방법

본 연구에서는 좌우 발목의 x좌표 차이를 바탕으로 작업자의 보행 이상을 자동으로 식별하기 위해 통계 및 머신러닝 기반의 네 가지 이상치 탐지 방법을 비교 분석하였다. 실험은 수집된 46개의 데이터셋 중 정상 데이터 5개를 학습용으로, 나머지 41개를 테스트용으로 구분하여 수행하였다. 각 방법의 성능 비교를 위해 통계적 지표인 Z-score, IQR, Mahalanobis Distance와 시계열 딥러닝 모델인 LSTM Autoencoder를 적용하였다.

3.3.1 Z-score 기반 탐지

Z-score는 데이터가 평균으로부터 표준편차의 몇 배만큼 떨어져 있는지를 나타내는 척도이다. 본 연구에서는 보행 데이터의 좌우 발목 x좌표 차이를 정규화한 후, ∣Z∣> 3에 해당하는 값을 이상치로 분류하였다. Fig. 4(a)는 정상 데이터에 대해, Fig. 4(b)는 이상 데이터에 대해 Z-score 기반 이상치 탐지 방법을 적용한 것의 예시이다. ∣Z∣=3에 해당하는 값을 빨간색 점선으로, 장애물을 마주한 구간을 노란색 점선 박스로 표시하였다.

이를 바탕으로 학습용 정상 데이터에서 산출된 이상치 비율의 평균(µ) 0.01%와 표준편차(σ) 0.01%를 바탕으로 임계값을 µ + 2σ인 값인 0.037%으로 설정하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F4.jpg

Figure 4

Z-Score Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

3.3.2 IQR 기반 탐지

IQR 방식은 데이터의 사분위수를 활용하여 분포의 변동성을 측정한다. 제1사분위수(Q1)와 제3사분위수(Q3)의 차이인 IQR의 1.5배 범위를 벗어나는 지점을 이상치로 간주한다. Fig. 5(a)는 정상 데이터에 대해, Fig. 5(b)는 이상 데이터에 대해 IQR 기반 이상치 탐지 방법을 적용한 것의 예시이다. Q3에 해당하는 값을 Upper Bound의 빨간색 점선으로, Q1에 해당하는 값을 Lower Bound의 빨간색 점선으로 표시하였다. 장애물을 마주한 구간은 노란색 점선 박스로, 이상치로 분류된 값은 빨간색 점으로 표시하였다.

이를 바탕으로 학습용 정상 데이터에서 산출된 이상치 비율의 평균(µ) 0.08%와 표준편차(σ) 0.09%를 바탕으로 임계값을 µ + 2σ인 값인 0.262%로 설정하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F5.jpg

Figure 5

IQR Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

3.3.3 Mahalanobis Distance 기반 탐지

Mahalanobis Distance는 변수 간의 상관관계를 고려한 다변량 거리 측정 방식이다. 단순 유클리드 거리와 달리 데이터의 분포 형태를 반영하므로, 좌우 발목 좌표 차이의 상관적 변화를 포착하는 데 용이하다. 카이제곱 분포의 99% 신뢰 구간을 기준으로 임계값을 설정하였다. Fig. 6(a)는 정상 데이터에 대해, Fig. 6(b)는 이상 데이터에 대해 Mahalanobis Distance 기반 이상치 탐지 방법을 적용한 것의 예시이다. 임계값을 빨간색 점선, 이상치로 분류된 값은 빨간색 점, 그리고 장애물을 마주한 순간을 노란색 박스로 표시하였다.

이를 바탕으로 학습용 정상 데이터에서 산출된 이상치 비율의 평균(µ) 0.02%와 표준편차(σ) 0.01%를 바탕으로 임계값을 µ + 2σ인 값인 0.041%로 설정하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F6.jpg

Figure 6

Mahalanobis Distance Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

3.3.4 LSTM Autoencoder 기반 탐지

딥러닝 기반의 LSTM Autoencoder는 시계열 데이터의 비선형적 패턴과 시간적 종속성을 학습하는 데 효과적인 성능을 보인다(Darban et al., 2022). 본 모델은 입력된 데이터를 저차원으로 압축한 후 다시 복원하는 과정을 거친다. 정상 패턴으로 학습된 모델은 이상 데이터 입력 시 재구성 오차(Reconstruction Error)가 크게 발생한다(Githinji and Maina, 2023). LSTM Autoencoder의 이상치 탐지를 위한 임계값은 모델 학습 단계에서 각 프레임에 대한 평균절대오차(mean absolute error, MAE)을 계산하고, 이 분포의 평균(µ) 과 표준편차(σ)를 바탕으로 임계값을 µ + 2σ으로 설정하였다. Fig. 7(a)는 정상 데이터에 대해, Fig. 7(b)는 이상 데이터에 대해 LSTM Autoencoder 기반 이상치 탐지 방법을 적용한 것의 예시이다. 임계값을 초록색 점선, 이상치를 빨간색 그리고 장애물을 마주한 구간을 노란색 점선 박스로 표시하였다.

이를 바탕으로 학습용 정상 데이터에서 산출된 이상치 비율의 평균(µ) 0.43%와 표준편차(σ) 0.62%를 바탕으로 임계값을 µ + 2σ인 값인 1.668%로 설정하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F7.jpg

Figure 7

LSTM Autoencoder Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

4. 연구 결과

4.1 이상치 탐지 성능 비교

Fig. 8는 통계 기반 이상치 탐지 방법의 Z-score, IQR, Mahalanobis distance와 LSTM Autoencoder 기반 이상치 탐지 방법의 성능을 Accuracy, Precision, Recall, F1-score 지표를 기준으로 비교한 결과를 나타낸 것이다. Accuracy 측면에서 LSTM 기반 방법이 82.9%로 가장 높은 성능을 보였으며, IQR 방법이 61.0%, Z-score 방법이 58.5%, Mahalanobis distance 방법이 46.3% 순으로 나타났다. Precision 비교 결과에서 LSTM 기반 방법이 84.1%로 가장 높은 값을 기록하였으며, IQR 방법은 63.1%, Mahalanobis distance 방법은 44.1%, Z-score 방법은 34.2%로 나타났다. Recall 측면에서 LSTM 기반 방법이 82.9%로 가장 높은 탐지 성능을 보였으며, IQR 방법은 61.0%, Z-score 방법은 58.5%, Mahalanobis distance 방법은 46.3%로 나타났다. F1-score 비교에서도 LSTM Autoencoder 기반 방법이 83.1%로 가장 우수한 성능을 보였으며, IQR 방법이 51.7%, Mahalanobis distance 방법이 44.8%, Z-score 방법이 43.2%로 나타났다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F8.jpg

Figure 8

Performance comparison of anomaly detection methods

Fig. 9은 통계 기반 이상치 탐지 방법의 Z-score, IQR, Mahalanobis distance와 LSTM 기반 이상치 탐지 방법의 분류 결과를 혼동행렬로 나타낸 것이다. 그림 Fig. 9(a)는 Z-score 기반 방법의 경우이다. 정상 데이터 24개를 모두 정상으로 분류하여 정상 데이터에 대해서는 높은 정확도를 보였으나, 이상 데이터 17개를 모두 정상으로 분류하여 이상 보행을 전혀 탐지하지 못하는 결과를 보였다. Fig. 9(b)는 IQR 기반 방법의 경우이다. 정상 데이터 24개 중 23개를 정상으로, 1개를 이상으로 분류하였으며, 이상 데이터 17개 중 2개를 이상으로 탐지하였다. Z-score 방법에 비해 일부 이상 보행을 탐지하는 성능을 보였지만 여전히 상당수의 이상 데이터를 정상으로 분류하는 경향을 보였다. Fig. 9(c)는 Mahalanobis distance 기반 방법이다. 정상 데이터 24개 중 15개를 정상으로, 9개를 이상으로 분류하였으며, 이상 데이터 17개 중 4개를 이상으로 탐지하였다. 다변량 거리 기반 방법이기 때문에 단변량 통계 방법보다 데이터 분포를 더 반영할 수 있지만, 정상 데이터를 이상으로 오분류하는 경우가 비교적 많이 발생하였다. Fig. 9(d)는 LSTM 기반 이상치 탐지 방법으로 정상 데이터 24개 중 19개를 정상으로 분류하였으며, 이상 데이터 17개 중 15개를 이상으로 탐지하였다. 이는 다른 통계 기반 방법들에 비해 이상 보행 패턴을 효과적으로 식별할 수 있음을 보여준다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F9.jpg

Figure 9

Confusion Matrix Comparison: (a) Z-score, (b) IQR, (c) Mahalanobis, (d) LSTM Autoencoder

Fig. 10은 각 이상치 탐지 방법에 대해 테스트 용의 정상과 이상 데이터들에서 계산된 이상치 비율의 분포를 boxplot 형태로 나타낸 것이다. 각 그래프에서 초록색 박스는 이상 데이터, 주황색 박스는 정상 데이터들의 이상치 데이터를 나타낸다. 그리고 학습데이터들의 이상치 비율 평균(µ)과 표준편차(σ)를 이용하여 설정한 임계값(µ + 2σ)을 빨간색 점선으로 표시하였다. Fig. 10(a)는 Z-score 기반 방법을 적용한 것으로 이는 정상 데이터와 이상 데이터의 이상치 비율 분포가 상당 부분 겹치는 경향을 보였으며, 대부분의 데이터가 임계값 이하에 위치하는 것을 확인할 수 있다. Fig. 10(b)는 IQR 기반 방법을 적용한 것으로 일부 이상 데이터에서 높은 이상치 비율 값이 관찰되었으나, 전체적으로 정상 데이터와 이상 데이터의 분포가 명확하게 분리되지 않는 경향을 보였다. 특히 일부 이상 데이터만 임계값을 초과하는 형태를 보여 이상 탐지 성능이 제한적임을 확인할 수 있다. Fig. 10(c)는 Mahalanobis distance 기반 방법을 적용한 것으로 정상 데이터와 이상 데이터 간 이상치 비율 분포의 차이가 크지 않으며, 두 분포가 상당 부분 겹치는 경향을 보였다. 반면, Fig. 10(d)는 LSTM Autoencoder 기반 방법을 적용한 것으로 이상 데이터의 이상치 비율 분포가 정상 데이터보다 명확하게 높은 값을 보이며, 상당수의 이상 데이터가 임계값을 초과하는 것을 확인할 수 있다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F10.jpg

Figure 10

Box Plots of Anomaly Ratio Distribution for Abnormal (Green) and Normal (Orange): (a) Z-score, (b) IQR, (c) Mahalanobis Distance, (d) LSTM Autoencoder

4.2 실제 현장 적용성 확인

본 연구의 실험은 통제된 환경 내 일반인 보행 데이터를 활용하여 이상치 탐지 모델의 성능을 비교 검증하였다. 이에 더해 실제 건설 현장 환경에서의 적용 가능성을 예비적으로 검토하기 위해, 실제 건설 작업자 1건에 대하여 동일한 키포인트 감지 기술을 적용하였다. Fig. 11은 현장 영상데이터에 키포인트 감지 기술을 적용한 것이다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F11.jpg

Figure 11

Application of Keypoint Detection on Real Construction Worker Videos

분석 결과, 작업복 및 안전화를 착용한 상태에서도 좌우 발목 좌표의 검출이 정상적으로 이루어짐을 확인하였다. Fig. 12는 추출된 좌우 발목 좌표를 시각화한 것이다. 상단 그래프는 x 좌표의 변화를, 하단 그래프는 y좌표의 변화이며, 파란색 선의 그래프는 왼발, 빨간색 선의 그래프는 오른발의 궤적을 나타낸다. 장애물을 마주한 구간은 노란색 점선 박스로 표시하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F12.jpg

Figure 12

Time series of left and right ankle coordinates with x-coordinates (top) and y-coordinates (bottom) trajectories

Fig. 13은 좌우 발목 좌표 간의 차이를 시각화한 것이다. 보라색 선의 그래프는 x좌표의 차이를, 초록색 선의 그래프는 y좌표의 차이를 나타낸다. 장애물을 마주한 구간은 노란색 점선 박스로 표시하였다.

https://cdn.apub.kr/journalsite/sites/ksarc/2026-005-01/N0410050102/images/ksarc_05_01_02_F13.jpg

Figure 13

Time series of coordinate differences between left and right ankles with dx (top) and dy (bottom) trajectories

추출된 좌우 발목 좌표 및 좌표 간의 차이를 시각화한 결과, 일반인 대상 데이터와 유사하게 장애물을 마주한 구간에서 보행 패턴의 변화가 발견되었다. 해당 적용성 확인 단계에서 별도의 장비 부착 없이 기존 CCTV 영상 분석만으로도 실제 현장 작업자의 보행 특성을 추출하고 분석할 수 있음을 확인하였다.

5. 결 론

본 연구는 건설 현장 내 비정형적 보행 장애물로 인한 작업자의 안전사고 위험을 선제적으로 예방하기 위해, CCTV 영상과 키포인트 감지 기술을 융합한 보행 이상 탐지 방법론을 제안하고 그 타당성을 검증하였다. 특히 본 논문은 단일 지점 추적에 의존하던 기존 연구의 한계를 극복하고자 좌우 발목 좌표 간의 상대적 시공간 관계를 특징량으로 정의하였으며, 이를 기반으로 4가지 이상치 탐지 방법의 분류 성능을 비교 분석하였다.

분석 결과, 단순 통계 기반 방법의 Z-score와 IQR 및 다변량 분석 기법인 Mahalanobis Distance 기반 방법은 보행 데이터의 시계열적 맥락을 충분히 반영하지 못하여 정상 보행 내의 미세한 변동을 이상치로 오검출라는 빈도가 높았다. 반면, 시계열 데이터의 장기 의존성 학습에 특화된 LSTM Autoencoder 모델은 보행 패턴의 변화에 효과적으로 대응하였으며, Accuracy 82.9%, Precision 84.1%, Recall 82.9%, F1-score 83.1%로 가장 높은 탐지 성능을 보였다. 또한, 이상치 비율 분포 분석에서도 LSTM Autoencoder 기반 방법이 정상 보행과 이상 보행 간의 분포 차이를 비교적 명확하게 구분하는 경향을 보였다.

본 연구의 결과는 웨어러블 장비의 전면 도입이 어려운 건설 환경에서, 기존에 설치된 CCTV 인프라만을 활용하여 작업자의 하체 움직임 반응을 분석함으로써 보행 위험 구역을 자동으로 추론할 수 있다는 가능성을 확인하는 데 의의가 있다.

다만, 본 연구는 몇 가지 한계점을 지닌다. 첫째, 이상치 탐지 성능 비교에 있어 시계열 맥락을 반영하지 않는 통계 기법과 시계열 처리에 특화된 LSTM Autoencoder를 비교하여, LSTM의 우수성이 예상 가능한 방향으로 도출된 측면이 있다. 본 연구의 이상치 탐지 방법 선정은 작업자의 보행 이상 감지에 시간적 연속성의 고려가 필수적임을 실증하기 위한 목적으로 이루어졌다. 향후 연구에서는 최신 딥러닝 이상치 탐지 기법들을 비교하여 연구 결과의 객관성을 높일 필요가 있다. 둘째, 본 연구에서는 보행 위험 추론 프레임워크의 유효성을 우선적으로 검증하기 위해 안정성이 입증된 OpenPose를 채택하였다. 하지만 이상치 데이터를 공간적으로 누적하여 특정 구간의 장애물 유무나 위험도를 파악하기 위해서는 방대한 데이터 처리의 효율성이 필수적이다. 따라서 향후에는 경량화되고 정확도가 향상된 최신 알고리즘을 적용하여 대용량 데이터의 연산 속도를 개선하고 시스템을 고도화할 필요가 있다. 셋째, 본 연구는 통제된 환경에서 일반인을 대상으로 수집된 데이터를 활용하였다. 따라서 향후 연구에서는 실제 건설 현장의 복잡한 다중 작업자 환경을 반영하고, 안전화 및 작업복 착용 상태에서의 키포인트 추출 성능에 대한 검증이 필요하다. 아울러 다중 카메라 환경에서의 데이터 병합 및 집단 감지 기술로 시스템을 고도화한다면, 건설 현장에서 작업자의 보행 안전을 향상시키고 잠재적인 위험 구역을 사전에 식별할 수 있는 지능형 안전 관리 시스템 구축에 기여할 것으로 기대된다.

Acknowledgements

본 연구는 과학기술정보통신부의 재원으로 한국연구재단의 지원을 받아 수행되었음(과제번호 RS-2023-00210164).

References

Cao, Z., Simon, T., Wei, S. E., and Sheikh, Y. (2017). Realtime multi-person 2D pose estimation using part affinity fields. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), IEEE, Honolulu, HI, USA, pp. 7291–7299. https://doi.org/10.1109/CVPR.2017.143

10.1109/CVPR.2017.143

Darban, Z. Z., Webb, G. I., Pan, S., Aggarwal, C. C., and Salehi, M. (2022). Deep learning for time series anomaly detection: A survey. arXiv Preprint arXiv:2211.05244. https://doi.org/10.1145/3691338

10.1145/3691338

Githinji, S., and Maina, C. (2023). Anomaly detection on time series sensor data using deep LSTM-autoencoder. 2023 IEEE AFRICON, 1–6. https://doi.org/10.1109/AFRICON55910.2023.10293676

10.1109/AFRICON55910.2023.10293676

Ibrahim, K., Simpeh, F., and Adebowale, O. J. (2025). Benefits and challenges of wearable safety devices in the construction sector. Smart and Sustainable Built Environment, 14(1), pp. 50–71. https://doi.org/10.1108/SASBE-12-2022-0266

10.1108/SASBE-12-2022-0266

Kanu-Asiegbu, A. M., Vasudevan, R., and Du, X. (2021). Leveraging trajectory prediction for pedestrian video anomaly detection. In 2021 IEEE Symposium Series on Computational Intelligence (SSCI) (pp. 01–08). IEEE. https://doi.org/10.1109/SSCI50451.2021.9660004

10.1109/SSCI50451.2021.9660004

Kim, S., Kim, T., Ham, Y., and Hwang, S. (2024). Feasibility of anomaly detection for inferring pedestrian discomfort in response to environmental factors using pedestrian footstep data. Available at SSRN 4942717. https://dx.doi.org/10.2139/ssrn.4942717

10.2139/ssrn.4942717

Lee, J., Kim, T., Beak, S., Moon, Y., and Jeong, J. (2023). Real-Time Pose Estimation Based on ResNet-50 for Rapid Safety Prevention and Accident Detection for Field Workers. Electronics, 12(16), 3513. https://doi.org/10.3390/electronics12163513

10.3390/electronics12163513

Li, X., Du, H., and Wu, X. (2023). Algorithm of Pedestrian Pose Recognition Based on Keypoint Detection. In 2023 8th IEEE International Conference on Network Intelligence and Digital Content (IC-NIDC) (pp. 122–126). IEEE. https://doi.org/10.1109/IC-NIDC59918.2023.10390775

10.1109/IC-NIDC59918.2023.10390775

Wang, C., Li, Y., Xiong, Z., Luo, Y., and Cao, Y. (2021). Lower body rehabilitation dataset and model optimization. In 2021 IEEE International Conference on Multimedia and Expo (ICME) (pp. 1–6). IEEE. https://doi.org/10.1109/ICME51207.2021.9428432

10.1109/ICME51207.2021.9428432

Journal of Construction Automation and Robotics ISSN:2800-0552(Print) 2951-116X(Online) 건설자동화·로보틱스 논문집

Preview

Comparative Study on Anomaly Detection Models to Infer Workers’ Walking Hazards using Video Keypoint Detection

ABSTRACT

MAIN

Figure 1

Research Framework

Figure 2

Time series of left and right ankle coordinates with x-coordinates (top) and y-coordinates (bottom) trajectories: (a) Normal walking, (b) Abnormal walking

Figure 3

Time series of coordinate differences between left and right ankles with dx(top) and dy(bottom) trajectories: (a) Normal walking, (b) Abnormal walking

Figure 4

Z-Score Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

Figure 5

IQR Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

Figure 6

Mahalanobis Distance Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

Figure 7

LSTM Autoencoder Based Anomaly Detection: (a) Normal Walking, (b) Abnormal Walking

Figure 8

Performance comparison of anomaly detection methods

Figure 9

Confusion Matrix Comparison: (a) Z-score, (b) IQR, (c) Mahalanobis, (d) LSTM Autoencoder

Figure 10

Box Plots of Anomaly Ratio Distribution for Abnormal (Green) and Normal (Orange): (a) Z-score, (b) IQR, (c) Mahalanobis Distance, (d) LSTM Autoencoder

Figure 11

Application of Keypoint Detection on Real Construction Worker Videos

Figure 12

Time series of left and right ankle coordinates with x-coordinates (top) and y-coordinates (bottom) trajectories

Figure 13

Time series of coordinate differences between left and right ankles with dx (top) and dy (bottom) trajectories

Acknowledgements

References