1Ph.D. Candidate, Department of Urban Big Data Convergence, University of Seoul, Republic of Korea
2Research Fellow, Korea Institute for Health and Social Affairs, Republic of Korea
3Director, Data Business Development Division, CryptoLab Inc, Republic of Korea
4Professor, Department of Urban Big Data Convergence, University of Seoul, Republic of Korea
Correspondence to Hosik Choi, choi.hosik@uos.ac.kr
Volume 1, Number 1, Pages 109-123, December 2024.
Journal of Data Forensics Research 2024;1(1):125-133. https://doi.org/10.12972/JDFR.2024.1.1.8
Received on November 27, 2024, Revised on December 23, 2024, Accepted on December 23, 2024, Published on December 31, 2024.
Copyright © 2025 Author(s).
This is an Open Access article distributed under the terms of the Creative Commons CC BY 4.0 license (https://creativecommons.org/licenses/by/4.0/).
This study examines the effectiveness of Geographic Information System (GIS) and Social Network Analysis (SNA) techniques in COVID-19 epidemiological investigations and explores their potential application in police investigations. From April 27, 2020, to July 25, 2021, a total of 188,848 confirmed cases were analyzed using 185,925,365 mobile phone base station communication records (S1AP), 50,224 credit card transactions, and 800,499 QR code records. GIS analysis identified the movements and contact points of confirmed cases, while SNA visualized the relationships between confirmed cases and predicted transmission paths through cluster analysis. The results showed that frequent regional movement was a major factor in the spread of infections, and the consistency between the transmission routes identified in the in-depth epidemiological investigation confirmed the accuracy and reliability of the analysis. This study highlights how data forensics—as demonstrated through the use of GIS and SNA—can become a valuable investigative tool in criminal investigations. Specifically, it can enhance efficiency and speed in solving cases such as voice phishing, drug trafficking, organized crime, and violent crimes. However, the study notes limitations such as the accuracy constraints of cell tower-based data (e.g., S1AP) and the incomplete information available for SNA, which can affect the precision of the analysis. In conclusion, the adoption of data forensics in police investigations can improve investigative efficiency and play a crucial role in the prompt resolution of cases.
Data Forensics, Geographic Information System (GIS), Social Network Analysis (SNA), Location-Based Analysis, Base Station and GPS Tracking
코로나바이러스감염증-19(이하 코로나19)는 2019년 12월 중국에서 최초로 보고된 후 전 세계적으로 확산되었다. 이에 따라 세계보건기구(WHO)는 2020년 1월 30일에 국제 공중보건 비상사태(Public Health Emergency of International Concern, PHEIC)를 선포하였고[1], 같은 해 3월 11일에 세계적 대유행(pandemic)을 선언했다[2]. 우리나라는 2020년 1월 20일 첫 확진자가 발생한 이후 2023년 2월 28일까지 총 30,513,721명의 확진자가 보고되었다[3,4].
감염병의 확산을 방지하기 위해 감염병 역학조사는 확진자의 발생 규모를 파악하고 감염원을 추적하는 중요한 활동으로 자리 잡았다. 또한, 감염병 예방접종 후 발생하는 이상반응이나 발병 원인이 불분명한 감염병의 원인을 규명하기 위한 필수 절차로 활용되고 있다[5]. 그러나 전통적인 역학조사는 주로 확진자의 진술에 의존하여 진행되었기 때문에 기억 오류와 비협조적인 태도로 인해 여러 한계에 직면해왔다.
코로나19 팬데믹을 계기로 이러한 한계를 극복하기 위해 정보통신기술(ICT)이 역학조사에 적극 도입되었다. 감염병의 예방 및 관리에 관한 법률을 근거로, 확진자의 카드 사용 내역, 통화 기록 등 다양한 데이터를 활용하여 감염경로를 추적할 수 있게 되었다[6]. 특히, 대규모 집단사례의 역학조사에서는 경찰청과 협력하여 지리정보시스템(Geographic Information System, GIS)[7], 폐쇄회로텔레비전(CCTV) 분석[8], 사회연결망분석(Social Network Analysis, SNA)[9] 등 다양한 범죄수사 기법이 도입되었다. 이러한 기술들은 확진자와 접촉자의 노출 위험을 평가하고 감염원과 감염경로를 파악하는 데 큰 역할을 했다.
본 연구는 범죄수사에 유용하게 사용될 수 있는 GIS와 SNA 기법을 결합한 데이터 포렌식 분석이 역학조사에 어떻게 기여하고 검증되었는지 구체적으로 설명하고자 한다. 특히, 데이터 포렌식 분석을 통해 교통이 발달한 현대 사회에서 빈번한 지역 이동이 감염 확산의 주요 원인임을 확인하며, 지표환자와 집단 간 접점을 정밀하게 파악한 사례를 제시한다. 이를 통해 스마트폰의 위치정보(Global Positioning System, GPS), 은행 기록, 내비게이션 기록(Tmap), 구글 타임라인 등 다양한 위치 기반 데이터와 가족, 교우, 직장동료, SNS 친구 등 관계형 데이터를 통합해 분석한다면, 보이스피싱, 마약, 조직폭력배, 강력범죄 등 조직범죄 수사에서도 유용하게 활용될 수 있음을 제언한다.
가족관계, 직장 정보, 소유 차량 정보, 은행 정보와 같은 추가 데이터를 활용한 정밀한 데이터 포렌식 기법은 범죄 수사에 있어 중요한 수사기법으로 자리 잡을 가능성이 크다.
본 연구는 이러한 분석기법의 정확성과 신뢰성을 입증하며, 범죄 수사에서의 데이터 포렌식 활용 방안을 제시하고자 한다.
(집단사례 인지) A광역시 ○○○보건소에서는 2020.6.24 첫 증상 후 6.27 확진된 감염경로 불명 사례(유○○, 지표환자)를 보고하였다. 이후 확진자의 휴대폰의 기지국 교신정보(S1AP)를 이용한 이동동선 조사 중 A광역시 ○○구 소재 종교시설 방문력을 확인하였으며, 해당 종교시설 종사자 등 총 13명이 확진되었음을 확인하였다. 이에 A광역시 확진자의 역학조사 정보 중 다수가 해당 종교시설의 행사에 참석한 방문력이 확인됨에 따라 공동 노출 및 전파에 의한 집단사례로 인지되었다. 이에 종교행사 간 대규모 전파가 우려되어 향후 추가전파 차단 및 예방을 위한 신속한 방역조치를 시행하고자 모든 관련 확진자들을 대상으로 심층 역학조사를 실시하였다.
(심층 역학조사) 확진자 및 참석자들의 진술을 기반으로 모든 동선을 조사한 결과, 일부 접점을 확인하였으나 일부 대상자들의 진술 거부로 인해 동선 노출 및 위험평가가 제한되었다. 이에 GIS 및 SNA를 활용하여 동선추적, 선행확진자들과의 접점 및 공동 노출 장소 등을 조사하였고 이를 바탕으로 확진자 재조사 및 현장역학조사를 실시하였다.
(GIS 분석) 휴대전화 기지국 교신정보(S1AP)를 이용한 동선추적은 일반적으로 휴대전화의 원활한 통신을 위해 가장 가까운 기지국에게 초당 1회씩 위치신호를 전송하고 있으며, 휴대전화와 기지국 간 연결성을 확인하는 일련의 절차이다(Figure 1). S1AP의 정확도는 기지국 주소 < S1AP < GPS 순이다.
ArcGIS Pro(Esri, Ver 10.4, 미국) 프로그램에서 확진자 13명의 휴대전화 기지국 교신정보를 이용한 동선을 확인하여 중첩되는 장소를 확인하였다.
확진자 13명의 휴대전화 동선의 중첩지역 및 동선을 분석한 결과 몇몇 확진자들이 A광역시 ○구에 위치한 C오피스텔 내 방문판매점에 자주 방문하는 동선이 확인되었으며, 전국 확진자 휴대전화 기지국 교신정보를 대조한 결과 B광역시 ○구에 위치한 D방문판매점 관계자가 그 오피스텔에 방문한 동선도 확인되었다. D방문판매점은 본 사례 이전 이미 집단감염 사례로 조사중인 곳이였다. (Figure 2).
추가 감염자 확인을 위해 지도에 전체 감염자의 휴대전화 동선을 투영하고 위 C오피스텔 반경 300미터 이내 30분 이상 체류한 중첩되는 감염자를 교차(Intersect)확인한 바, 다수의 감염자가 C오피스텔에 방문하였고 그 중에는 다른 방문판매업자, 노인요양시설, 종교단체 신도 등이 포함되어 있었다(Figure 3).
(사회연결망 분석) IBM i2 Analyst’s Notebook프로그램을 이용한 사회연결망 분석은 사회구성원간의 관계에 분석의 초점을 맞추어 이들 관계의 패턴으로부터 의미있는 시사점을 도출하는 기법으로, 개인과 집단들 간의 관계를 개체와 링크로서 모델링하여 그 위상구조, 확산/진화과정을 계량적으로 분석하는 방법이다.
사회연결망 분석 프로그램인 i2 Ver 9.1.1(IBM. 2018)에 반영된 상호 간 연관성(betweenness centrality), 근접성(closeness centrality)의 분석 원리는 네트워크상 사회적 관계의 중심성을 개체들간에 매개, 즉 다리(Bridge) 역할을 하는지, 서로 거리가 가깝고 먼지 여부를 척도로 중요성을 측정한다.
GIS 분석 결과를 i2프로그램을 통해 13명 중 일부 확진자들의 접점을 분석한 바, B광역시 지역의 선행 확진자들과 특정 지점에서 접촉횟수가 월등히 높은 점을 확인하였다(Figure 3).
이에 지표환자 및 접점이 높은 선행확진자들에 대한 재조사 결과, 특정 건물에서 잦은 모임을 한 것으로 조사되었으며, 또한 타 지역 확진자와의 접점도 확인되었다(Figure 3).
타 지역 확진자들의 거주지 보건소 협조를 통해 심층역학조사 결과, 본 모임과 관련된 다수의 확진자 및 추가 전파사례를 확인하였으며, 미지의 집단사례와의 연관성이 있음을 확인하였다(Figure 4).
(결과) 본 사례조사는 지표환자 확진 및 집단발생 인지 후 관련 집단사례의 마지막 환자 발생까지 총 23일이 소요되었으며, 총 141명의 확진자와 12건의 집단사례를 확인하였으며 총 5차 전파 후 종료되었다(Figure 5).
감염병 확진자에 대한 역학조사는 확진자 발생 시 감염원을 추적하고 추가 감염 확산을 방지하기 위해 필수적인 과정이다. 역학조사의 단계는 ① 확진자 발생 보고 및 신고, ② 유관기관 상황 전파 및 공유, ③ 기초 역학조사, ④ 필요 시 카드 정보와 휴대폰 위치 추적을 통한 심층 역학조사, ⑤ 위험도 평가를 통한 접촉자 조사·분류·조치, ⑥ 추적 관리로 이루어진다.
이와 유사하게, 경찰의 범죄수사도 비슷한 절차를 따른다. ① 피해자 신고 또는 지구대의 사건 발생 보고, ② 중요 범죄 발생 시 유관기관 상황 전파 및 공유, ③ CCTV 등을 활용한 기초 조사, ④ 카드 정보와 휴대폰 위치 추적 등을 통한 피의자 추적, ⑤ 피의자 검거 및 조사, ⑥ 사건 송치로 이루어져, 감염병 역학조사와 경찰의 범죄 수사 사이에는 흐름과 절차의 유사성이 존재한다.
코로나19 대응에서는 이러한 유사성을 활용해 경찰의 범죄수사 기법을 역학조사에 도입했다. 특히 지리정보시스템(GIS) 분석과 사회연결망분석(SNA)은 감염경로를 추적하는 데 매우 유용한 도구로 활용되어 그 정확성과 신뢰성이 검증되었다. 이 기법들은 감염경로와 감염원을 효과적으로 추적하며, 방역조치를 함으로써 감염 확산을 신속히 차단하는 데 중요한 역할을 했다. GIS 분석은 S1AP 정보를 사용해 감염자의 이동 동선을 추적하며, 이를 통해 주요거점(Hot spot) 탐색, 위험 지역 예측, 특정 장소 방문자 확인과 같은 작업이 이루어졌다. 이번 연구에서는 GIS 분석을 통해 확진자들의 단일 시설 방문을 확인했으며, 특정 행사 참석으로 인한 추가 전파를 밝혀냈다. 또한, 타 지역의 동선을 분석하여 미지의 집단 감염 사례와의 연관성도 파악할 수 있었다. GIS는 감염자의 진술 검증뿐 아니라 감염경로를 명확히 하는 데 강력한 도구로 기능했다.
박유진 등[10]이 보고한 바에 따르면 COVID-19 감염 확산을 억제하기 위해 GIS(지리 정보 시스템)를 활용한 위치 기반 접촉 추적이 한국 서울의 유흥업소와 같은 장소에서의 감염 경로를 효과적으로 추적할 수 있으며 전통적인 종이 기반의 역학조사 방법과 더불어 GIS와 GPS 데이터를 사용해 감염자들의 위치를 분석하고, 유흥업소 근처의 고위험 지역을 시각적으로 나타내어 추가 확산을 방지했다고 정확성과 신뢰도를 인정하였다.
SNA 분석은 다양한 데이터를 통합해 개인과 집단 간의 관계를 시각화하고, 클러스터링 분석을 통해 미분류 사례에서 잠재적 감염 그룹을 예측하는 데 효과적이다. 이번 연구에서는 SNA 분석을 통해 확진자와 선행 확진자가 중복된 지역을 신속히 식별하고, 감염 전파도를 작성하여 추가 감염을 차단하는 데 기여했다.
그러나 GIS와 SNA 분석에도 한계가 있다. S1AP 데이터 등 기지국 정보는 기후 조건, 건물 배치, 기지국 위치, 통신망 종류 등 다양한 외부 요인의 영향을 받아 도심 지역에서 약 300m, 시외 지역에서 약 500m의 오차가 발생할 수 있어 확진자 간 접촉 강도를 정량적으로 평가하기 어렵다. 또한, SNA 분석에서 감염자의 직장, 가족관계, 친구관계 등의 추가 정보가 부족할 경우 데이터베이스 구축이 제한되어 분석의 정확도가 떨어질 수 있다. 이러한 한계를 극복하기 위해 스마트폰, 구글 타임라인, 스마트워치, 드론 비행 경로, WiFi 로그, 은행 거래 내역, 내비게이션 기록(Tmap) 등 다양한 GPS 기반 데이터와 SNS 친구, 직장, 가족 등 관계형 데이터 등 많은 데이터들을 통합하여 오차를 최소화하고 정확도를 높이는 것이 필요하다.
이러한 분석은 경찰의 범죄 수사에 중요한 시사점을 제공한다. 현재 대한민국 경찰은 위와 같은 GIS 분석 기법이나 도구가 거의 없으며, IBM i2 Analyst’s Notebook을 통해 통화 및 계좌 내역의 단순 연관성을 SNA(Social Network Analysis)라 부르며 분석할 뿐이다. 특히 IBM i2 Analyst’s Notebook에 내장된 제한적인 GIS 기능조차 충분히 활용하지 못하는 등 데이터 포렌식 분야에 대한 이해가 부족한 실정이다.
범죄 수사에서 GIS와 SNA 기법은 보이스피싱, 마약, 조직폭력, 안보 관련 수사 등에서 매우 유용하게 활용될 수 있다. 예를 들어, 휴대전화 발신 기지국 분석, 조직 범죄에서 특정 시간대의 자주 방문한 장소와 이동 경로, 보이스피싱 사건에서 인출책이 사용하는 휴대전화 발신 기지국 통화 내역이나 데이터 사용 내역과 CD 인출 장소의 일치 여부, 패턴 분석, 점조직 간 연결점 특정, 재난 관리 등에도 아주 유용하게 사용될 수 있고, 높은 정확도와 신뢰성을 제공한다. 특히 GPS 정보, 은행 거래 내역, 내비게이션 기록(Tmap), 구글 타임라인, 스마트워치 GPS, WiFi 접속 기록 등 다양한 데이터를 통합하면 기지국 반경의 오차범위를 줄일 수 있어 GIS와 SNA 기법을 통한 데이터 포렌식의 정밀도가 한층 높아질 것이다.
나아가, 가족관계, 직장 정보, 소유 차량 정보, 은행 정보 등의 관계형 데이터를 추가로 수집해 분석하면 연관관계 분석 범위가 대폭 넓어질 수 있는 등 데이터 포렌식을 이용한 범죄 수사기법은 더욱 정교해질 수 있다. 경찰의 범죄 수사와 감염병 역학조사의 흐름이 유사한 만큼, GIS와 SNA 기법은 감염병 대응뿐만 아니라 범죄 수사에서도 핵심적인 도구로 확장되어야 하며, 이를 통해 보다 신속하고 정확한 수사가 가능할 것이므로 앞으로 경찰 수사에서는 데이터 포렌식을 적극 도입하고 발전시켜, 미래의 범죄 예방과 해결에 중요한 역할을 수행해야 할 것이다.
[1] World Health Organization (WHO). 2020. Coronavirus disease (COVID-19). Geneva: WHO. Available at: https://www.who.int/emergencies/diseases/novel-coronavirus-2019/events-as-they-happen accessed on 2024. 11. 26.
[2] World Health Organization (WHO). 2020. WHO Director-General’s opening remarks at the media briefing on COVID-19-11 March 2020. Geneva: WHO. Available at: https://www.who.int/director-general/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19—11-march-2020 accessed on 2024. 11. 26.
[3] Kim JY, Choe PG, Oh Y, et al. 2020. The first case of 2019 novel coronavirus pneumonia imported into Korea from Wuhan, China: implication for infection prevention and control measures. J Korean Med Sci, 35(5), e61.
[4] COVID-19 Central Disaster and Safety Countermeasures Headquarters. 2023. Coronavirus Infection COVID-19 Central Disaster Safety Task Force Meeting Materials, March 3, 2023 (Fri) (코로나바이러스감염증-19 중앙재난안전대책본부 회의 자료, 2023.3.3.(금)).
[5] Infectious Disease Control and Prevention Act (Act No. 18893, June 10, 2022), Article 2 (Definitions) (감염병의 예방 및 관리에 관한 법률(법률 제18893호, 2022.6.10.) 제2조 (정의)).
[6] Infectious Disease Control and Prevention Act (Act No. 18893, June 10, 2022), Article 76-2 (Request for Information Provision and Information Verification, etc.) (감염병의 예방 및 관리에 관한 법률(법률 제18893호, 2022.6.10.) 제76조의2 (정보 제공 요청 및 정보 확인 등)).
[7] Gale SL, Magzamen SL, Radke JD, et al. 2011. Crime, neighborhood deprivation, and asthma: a GIS approach to define and assess neighborhoods. Spat Spatiotemporal Epidemiol, 2(2), 59-67.
[8] Milliet Q, Delémont O, Sapin E, et al. 2015. A methodology to event reconstruction from trace images. Sci Justice, 55(2), 107-17.
[9] Leone M, Lapucci E, Davoli M, et al. 2019. Social network analysis to characterize women victims of violence. BMC Public Health19, 494.
[10] Park YJ, Ryu BY, Park EJ, et al. 2024. Tracing the Untraceables: A Joint Outbreak Investigation With Law Enforcement Using a Geographic Information System. Health Security Volume 22(3), Mary Ann Liebert, Inc. Available at: https://doi.org/10.1089/hs.2023.0082