미국에서 전화할 때 “대통령, 폭탄, 알라”를 언급하면 무슨 일이 일어날까?

05.02 15:20 | 조회수 3,505
김진수
(주)그로들
1998년 윌스미스가 출연한 영화 ‘에너미 오브 스테이트’에 이런 장면이 등장합니다. 국가 정보 기관에서 쫓기고 있는 주인공이 어디론가 전화를 걸려고 하자 조력자가 말리면서 이렇게 말합니다. “국가안보국 지하 전체에 메인프레임이 설치돼 있어. 만약 자네가 와이프랑 통화하면서 ‘대통령’, ‘폭탄’ 또는 ‘알라’라는 말을 하면 즉시 컴퓨터가 통화를 자동으로 기록하고 마킹을 해놓지. 그게 벌써 20년 전부터 있었던 일이야” 영화 속에 등장하는 국가안보국은 실제 존재하는 미국의 NSA(National Security Agency)를 의미합니다. 이 영화 때문에 그간 베일에 가려져 있던 이 기관의 존재가 세상에 까발려지게 됐습니다. CIA가 휴민트를 통한 첩보활동을 주로 한다면 NSA는 첨단기술을 이용해 암호해독과 정보수집을 전담하는 조직입니다. (흥미로운 점은 도산 안창호 선생의 장녀인 안수산 여사가 비밀 정보 분석요원으로 NSA에서 근무했습니다) 그런데 영화 속에서 등장한 저 대사는 진실일까요? 어린 나이에 이 영화를 흥미진진하게 보던 저도 저 말이 사실인지 무척 궁금했습니다. 이 설정이 단지 영화 속 시나리오에 불과할까요? 아니면 진짜 사실일까요? 이후에 세계를 뒤흔든 몇가지 사건을 통해서 우리는 진위여부를 추측할 수 있습니다. 2013년 에드워드 스노든이라는 전직 CIA 요원은 NSA에서 전세계 규모의 방대한 사찰행위가 진행되고 있음을 폭로 했습니다. 이 때 미국은 적성국은 물론 프랑스, 독일 등의 우방국 정상의 휴대폰을 도청한 것으로 드러나 외교적 이슈가 됐습니다. 심지어 대한민국 청와대도 NSA에 의해 도청 당한 것으로 추정되고 있습니다. 이러한 행적을 볼 때, NSA는 기술적으로 가능하기만 하다면 인권이나 민주주의 원칙을 무시하고 전국민 아니 전세계인의 휴대폰을 감청하고자 했을 듯합니다. 911 테러 이후에 이러한 행위는 더욱 과감해졌습니다. 그렇다면 과연 어떤 기술로 그것이 가능했을까요? 전화통화에서 ‘폭탄’ ‘대통령’ 등의 단어를 캐치하려면 여러가지 기술이 필요합니다. 먼저 휴대폰 통신을 통해 전송되는 암호화된 패킷데이터를 탈취하고 다시 해독할 수 있어야 합니다. 그 다음 해당 음성을 텍스트로 전환한 후, 그 문장 중에 ‘폭탄’ ‘대통령’이라는 단어가 있는지를 필터링해야 합니다. 여기에서 잠시 음성을 텍스트로 전환하는 부분인 음성인식의 방법에 대해 조금 살펴보겠습니다. - 음성은 기계적 장치인 센서를 통해 사운드 웨이브 파일로 추출됩니다. 이 때 음성데이터는 주파수 형태로 읽혀집니다 - 복잡한 파형의 모양을 띄는 주파수를 자세히 살펴보면 발화된 음소(ㄱ, ㄴ, ㅏ, ㅑ 등의 소리 단위) 에 따라 규칙적인 특징을 나타납니다 - 사전에 미리 음소별 벡터특징을 모델링해 놓고, 센서를 통해 들어오는 파형과 맞춰보며 어떤 음소인지를 추측해 냅니다. (음향모델) - 음소가 파악되면 미리 구축해둔 단어장 DB을 한번 더 거쳐서 단어로 특정합니다. - 그 다음 음성을 문장으로 뽑아냅니다. 이 때 수학적 확률로 문장이 만들어집니다. 음향모델을 통해 “엄마, 아빠 사탕해요”라는 분석이 됐다고 해도 앞 뒤 문맥을 볼 때 사탕이 아니라 사랑일 확률이 높기 때문에 “엄마, 아빠 사랑해요”라는 문장을 표시합니다. (언어모델) 21세기 들어, 이제서야 겨우 음성인식이 꽃을 피우고 있는데, 20년 전에(영화 속 대사에 따르면 40년 전) 이런 기술이 과연 가능했을까라는 의문이 듭니다. 그렇지만 왠지 가능했을 것 같기도 합니다. NSA는 전세계 모든 기업과 기관을 통틀어서 뛰어난 수학자를 가장 많이 채용하는 곳이라고 합니다. (미국에서 수학천재가 본인의 직업을 안 밝히면 NSA 요원입니다^^) 음성인식은 확률통계가 매우 중요하며 알고리즘이 기술의 핵심입니다. 법제도를 준수하고, 수익을 달성해야 하는 사기업과 달리 리소스의 제약없이 최고급 인력으로 음성인식 알고리즘을 연구했다면 40년 전에라도 미리 설정한 몇가지 단어가 포함된 통화파일을 짚어 내는 정도의 기술은 충분히 구현 가능했을 듯합니다. 자료를 찾아보니 이미 1980년 초에 도스 PC에 돌아가는 음성인식 프로그램(드래곤 딕테이트)이 상용화 돼서 낱말 단위의 인식과 표현이 가능했다고 합니다. NSA라면 그 당시에 민간기업의 수준을 훌쩍 뛰어넘는 기술을 확보했을 수 있습니다. 제 맘대로의 결론이지만 어린 나에게 궁금증을 안겼던 “에너미 오브 스테이트”의 저 대사는 거의 진실에 가깝다고 판단됩니다. 물론 전국민의 통화를 한꺼번에 모니터링한 것은 아니고 특정 집단이나 타겟에 대해 사찰을 했을 것으로 추측됩니다. 원래 아주 긴 글을 작성하려고 했는데 오늘은 밤이 깊어서 여기서 끊도록 하겠습니다. 반응이 좋다면 시리즈로 ‘국가기관 또는 빅브라더 기업의 사찰 가능성’에 대한 글을 몇가지 더 올려보도록 하겠습니다. 참 아래 이미지는 NSA의 본사(?) 건물입니다. 풍문에 의하면 저 건물 지하에는 슈퍼 컴퓨터가 있습니다. 읽어 주셔서 감사합니다.
첨부 이미지
51
checkbox-off
닉네임으로 등록
등록
전체 댓글 0
등록순최신순
대표전화 : 02-556-4202
06235 서울시 강남구 테헤란로 134, 5층
(역삼동, 포스코타워 역삼) (대표자:최재호)
사업자등록번호 : 211-88-81111
통신판매업 신고번호: 2016-서울강남-03104호
| 직업정보제공사업 신고번호: 서울강남 제2019-11호
| 유료직업소개사업 신고번호: 2020-3220237-14-5-00003
Copyright 2019. Drama & Company All rights reserved.