AI 연구원들은 Zoom 오디오를 통한 키 입력 감지 정확도가 93%라고 주장합니다.
홈페이지홈페이지 > 소식 > AI 연구원들은 Zoom 오디오를 통한 키 입력 감지 정확도가 93%라고 주장합니다.

AI 연구원들은 Zoom 오디오를 통한 키 입력 감지 정확도가 93%라고 주장합니다.

Jul 06, 2023

케빈 퍼디 - 2023년 8월 7일 오후 6시 17분(UTC)

세 명의 연구원은 키 입력을 기록하고 딥 러닝 모델을 훈련함으로써 개별 키의 사운드 프로필을 기반으로 원격 키 입력을 해석하는 데 있어 90% 이상의 정확도를 달성했다고 주장합니다.

영국 연구자인 Joshua Harrison, Ehsan Toreini 및 Marhyam Mehrnezhad는 A Practical Deep Learning-Based Acoustic Side Channel Attack on Keyboards(전체 PDF) 논문에서 유비쿼터스 기계 학습, 마이크 및 화상 통화의 세 가지 요소가 "더 큰 위협을 제시한다"고 주장합니다. 그 어느 때보다 키보드에." 특히 노트북은 커피숍, 도서관, 사무실 등 조용한 공공 장소에서 종이 노트에 키보드를 녹음하는 데 더 취약합니다. 그리고 대부분의 노트북에는 모델 전반에 걸쳐 유사한 음향 프로필을 갖춘 균일한 비모듈식 키보드가 있습니다.

대상에 대한 물리적 접근 없이 VoIP 통화를 키로깅하려는 이전 시도는 2017년 Skype에 비해 상위 5위 정확도 91.7%, 2018년 VoIP 통화 정확도 74.3%를 달성했습니다. 키 입력 해석의 출력을 "숨겨진 마르코프 모델"과 결합합니다( 가능성이 더 높은 다음 문자 결과를 추측하고 "hrllo"를 "hello"로 수정할 수 있는 HMM)는 이전의 한 부채널 연구에서 정확도가 72%에서 95%로 증가한 것을 확인했습니다. 이는 도트 매트릭스 프린터에 대한 공격이었습니다. 코넬 연구원들은 자신들의 논문이 오디오 부채널 공격을 전파하기 위해 self-attention 레이어를 포함한 신경망 기술의 최근 대대적인 변화를 활용한 최초의 논문이라고 믿고 있습니다.

연구원들은 2021년형 MacBook Pro를 사용하여 "지난 2년 동안의 모델과 잠재적으로 미래의 모델과 스위치 디자인이 동일한 키보드를 갖춘" 노트북인 노트북을 사용하여 36개의 키를 각각 25번씩 입력하여 모델을 훈련시켰습니다. 각 키와 관련된 파형에 대해 그들은 첫 번째 테스트를 위해 키보드의 오디오를 녹음하기 위해 17cm 떨어진 iPhone 13 mini를 사용했습니다. 두 번째 테스트에서는 Zoom의 소음 억제 기능을 가장 낮은 수준으로 설정하고 MacBook에 내장된 마이크를 사용하여 Zoom을 통해 노트북 키를 녹음했습니다. 두 테스트 모두에서 93% 이상의 정확도를 달성할 수 있었으며, 전화로 녹음된 오디오 가장자리는 95~96%에 가까웠습니다.

연구원들은 키의 위치가 오디오 프로필을 결정하는 데 중요한 역할을 하는 것 같다는 점에 주목했습니다. 대부분의 잘못된 분류는 키가 한두 개 정도 떨어져 있는 경향이 있다고 그들은 썼습니다. 이 때문에 대규모 언어 자료와 키 입력의 대략적인 위치를 고려할 때 잘못된 키를 수정하기 위한 두 번째 기계 강화 시스템의 가능성이 강력해 보입니다.

이러한 종류의 공격을 완화하려면 어떻게 해야 합니까? 이 논문에서는 몇 가지 방어책을 제안합니다.

개인적으로 저는 이것을 다양한 스위치 유형을 갖춘 기계식 키보드 컬렉션을 유지하려는 충동에 대한 검증으로 여기지만 연구원들은 그러한 전략에 대해 특별한 언급을 하지 않았습니다.

민감한 컴퓨터 데이터에 대한 사운드 기반 부채널 공격은 연구에서 가끔 발견되지만 공개된 위반 사례에서는 거의 발견되지 않습니다. 과학자들은 컴퓨터 소리를 사용하여 PGP 키를 읽고 기계 학습 및 웹캠 마이크를 사용하여 원격 화면을 "봅니다". 그러나 부채널 공격 자체는 실질적인 위협입니다. 미국이 유럽 동맹국을 감시했던 2013년 "드롭마이어(Dropmire)" 스캔들은 전선, 무선 주파수 또는 소리를 통한 일종의 부채널 공격과 관련되었을 가능성이 높습니다.