/
Cyber Resilience

AI에 커뮤니케이션 문제가 있는 이유

언어는 내 머릿속에 있는 생각이나 아이디어를 가능한 한 완전하고 정확하게 전달하기 위한 도구이며, 그 목적은 놀라울 정도로 간단합니다. 대부분의 도구와 마찬가지로 언어라는 도구도 사용자마다 다양한 방식으로 사용할 수 있습니다.  

언어에 능통하다고 해서 성공이 보장되는 것은 아닙니다. 새로운 기술은 새로운 어휘를 의미합니다. 그리고 새로운 어휘는 그 어휘를 일관성 있게 사용하지 못한다는 것을 의미합니다. 그리고 현재 시장에서 AI 관련 기술만큼 새롭거나 더 큰 것은 없습니다.

컨텍스트의 중요성

언어는 대화의 양측이 문맥과 정의에 동의할 때만 작동합니다. 구어체로 표현하자면, 양쪽이 "같은 페이지에 있을 때" 언어가 가장 잘 통한다는 뜻입니다. 기술 업계에서 이러한 유형의 잘못된 커뮤니케이션의 대표적인 예는 엔지니어링과 마케팅 간의 커뮤니케이션입니다. 사실 이것은 만화 스트립 딜버트의 유머의 기본 전제가 될 정도로 매우 흔한 이야기입니다.

마케팅과 엔지니어링이 어떻게 충돌하는지에 대한 딜버트 만화
사진 제공: Scott Adams 경유 Popverse

엔지니어의 목표는 아이디어를 정확하게 전달하는 것이기 때문에 문제는 사실 아주 간단합니다. 마케팅은 소통을 위한 것이기도 하지만 정확성은 부차적으로 중요합니다. 주요 목표는 영향력을 행사하는 것입니다. 정확도가 낮은 단어가 마케터로부터 더 좋은 반응을 얻으면 정확도가 낮은 단어가 사용됩니다. 당연히 엔지니어가 마케팅 자료를 통해 배우려고 할 때 단절(즉, 잘못된 의사소통)이 발생합니다.

오해의 또 다른 일반적인 원인은 두 그룹이 같은 단어에 대해 서로 다른 정의를 내리는 경우입니다. 어떤 경우에는 호환되지 않더라도 두 가지가 모두 맞는 경우도 있습니다. 이에 대한 완벽한 예는 "이론"이라는 단어입니다. 과학자, 엔지니어 또는 수학자에게 '이론'이라는 단어는 비전문가의 개념과는 상당히 다른 매우 정확한 정의를 가지고 있습니다. 윌리엄 브릭스는 수학 통계학 박사 학위를 받은 과학자로, 2012년에 이 주제에 대해 다음과 같은 통찰력을 제시했습니다:

"그런데 저는 어떤 지적 모델을 '이론'이라고 부르는 것을 매우 싫어합니다. 과학에서 모델은 어떤 시스템이나 프로세스에 대한 설명적이고 예측적인 설명입니다. 가설은 원칙적으로 위조가 가능한 모델, 즉 모델을 반증할 수 있는 증거를 명확하게 제시할 수 있는 모델입니다. 이론은 지금까지 틀렸다는 것을 증명하려는 모든 시도에서 살아남은 가설입니다."

비과학자들의 머릿속에는 '이론'과 '가설'의 정의가 혼재되어 있기 때문에 과학자와 비과학자 간의 커뮤니케이션은 해결하기 까다로운 문제입니다. 즉, 과학자의 생각이나 아이디어를 비과학자의 머릿속에 완전하고 정확하게 옮기는 것은 어렵습니다. 보다 일반적인 의미에서, 서로 다른 그룹이 서로 소통하는 데 어려움을 겪는 좋은 예입니다.

이 문제를 해결하려면 어떻게 해야 하나요?

기술 소비자로서 이러한 '사일로 간' 커뮤니케이션은 고객과 공급업체 간 또는 고객과 조직 내 다른 그룹 간 등 일상적인 과제입니다. 서두에서 언급했듯이 AI 관련 기술은 시장에 처음 등장한 기술이기 때문에 많은 부정확성과 오해의 소지가 있습니다.

이 문제를 해결하려면 먼저 정확하고 정밀한 데이터 소스가 필요합니다. 영업팀, 계정 관리자, 영업 엔지니어는 고객이 제품을 구매하도록 유도하는 역할을 합니다. 마케팅 용어로 소통하는 법을 배웁니다. 대부분의 영업 엔지니어와 의외로 많은 수의 어카운트 매니저가 엔지니어링 출신이라는 점도 장점입니다. 마케팅 어휘를 버리고 엔지니어링 용어로 전환하는 '괴짜 모드'로 전환하는 것은 어렵지 않습니다. 이 시점에서 그들이 사용할 엔지니어링 용어의 정의를 아는 것이 중요합니다.

AI는 1950년대 중반부터 컴퓨터 과학의 한 분야로 존재해 왔습니다. 이처럼 어휘는 기술 세계에서 확립되어 있습니다. 하지만 이 모든 것이 지난 몇 년 동안 소비자에게는 새로운 개념이었기 때문에 소비자 대상 미디어에서 사용되는 단어의 정의는 다소 "모호"합니다. "인공 지능", "머신 러닝", "대규모 언어 모델", "GPT", "생성 AI", "딥 러닝", "신경망", "ChatGPT" 등의 용어를 접해 보셨을 것입니다. 이를 이해해 보겠습니다.

AI의 두 가지 기본 범주

'물리학'이라는 용어와 마찬가지로 AI 또는 인공 지능은 그 자체로 '사물'이 아닙니다. 오히려 다른 많은 분야가 존재하는 우산과도 같습니다. AI라는 우산 아래 초기 연구 분야를 제외하면, 오늘날 AI에는 통계 기반 AI와 신경망 기반 AI라는 두 가지 기본 유형이 있습니다.

머신 러닝

통계 기반 AI는 ML 또는 머신 러닝으로 더 잘 알려져 있습니다. 기본적으로 ML은 솔루션을 설명하는 하나 이상의 방정식으로 구성된 모델을 만든 다음, 모델에 정답과 오답을 제공하여 긍정 및 부정 강화를 통해 해당 모델을 '훈련'하는 것입니다. 이 훈련은 기본적으로 컴퓨터가 각 방정식의 각 변수에 대한 계수를 검색하고, 새로운 값을 변수에 대입하면 원하는 답을 도출하는 방식입니다.

이것이 지능이라고 하기에는 너무 단순하게 들린다면, 여러분만 그런 생각을 하는 것은 아닙니다. 일반적으로 ML은 AI 우산 아래에서 '하위' 과학으로 간주되는 것이 일반적입니다. ML의 '인텔리전스'로서의 지위는 논란의 여지가 있지만, 도구로서의 힘은 그렇지 않습니다. ML은 여러 가지 어려운 작업에서 탁월한 성능을 발휘합니다.

ML은 다양한 용도로 사용할 수 있지만, 그 유용성을 정의하는 단 하나의 사용 사례를 꼽으라면 저는 "그룹화"를 선택하겠습니다. ML은 서로 '닮은' 사물을 찾는 데 매우 강력합니다. 휴대폰에 있는 반려견의 모든 사진을 찾을 수 있습니다. 또는 사진에서 렌즈의 초점을 맞출 지점으로 사용할 사람의 얼굴을 찾기도 합니다. 보안에 대해 이야기하고 있으므로 네트워크에서 유사한 트래픽 패턴을 가진 서버 그룹을 찾은 다음, 해당 서버 중 하나의 트래픽이 갑자기 이전보다 줄어들어(즉, 기준선에서 벗어나는 경우) 잠재적으로 위반을 나타내는 경우 알림을 보내는 것이 유용할 수 있습니다.

모든 NTP 서버, 모든 Redis 데이터베이스 또는 패치되지 않은 오래된 버전의 Windows를 실행하는 네트워크의 모든 컴퓨터를 찾는 등 수십 가지의 다른 용도로 사용할 수 있습니다.

제품에 AI가 사용된다는 문구가 있다면 사용 중인 특정 기술이 ML일 가능성이 높습니다. 다른 AI 기술에 비해 ML은 가장 예측 가능하고, 가장 잘 이해되며, 가장 쉽게 구현할 수 있는 기술입니다. 또한 보안 분야에서 흔히 발생하는 많은 문제를 훌륭하게 해결합니다. 또한 ML 모델(공급업체가 수행하는 부분)을 학습시키는 데는 광범위한 컴퓨팅 리소스가 필요하지만, 일단 학습된 ML 모델(제품을 구매한 후 사용자가 수행하는 부분)을 사용하는 데는 다른 어떤 애플리케이션보다 더 많은 컴퓨팅 성능이 필요하지 않다는 점도 주목할 필요가 있습니다.

딥 러닝

보통 사람들은 'AI'라는 용어를 들으면 딥러닝을 기반으로 한 솔루션을 떠올릴 것입니다. 하지만 딥러닝을 정의하기 전에 먼저 신경망에 대해 이야기할 필요가 있습니다.

컴퓨터의 기본 구성 요소는 NAND 게이트입니다. 컴퓨터 로직을 사용하면 다른 모든 유형의 게이트, 즉 모든 컴퓨터를 NAND 게이트로 구축할 수 있습니다. 실제로 아폴로 우주선에 탑재된 컴퓨터는 대형 신발 상자 크기였으며 약 14,000개의 낸드 게이트가 들어 있었습니다.

NAND 게이트는 단순한 구조입니다. 가장 간단한 형태의 NAND 게이트는 두 개의 입력과 하나의 출력으로 구성됩니다. 두 입력이 모두 높음('켜짐' 또는 논리 1)이면 출력은 낮음('꺼짐' 또는 논리 0)이 됩니다. 다른 입력 조합(낮음/낮음, 낮음/높음 또는 높음/낮음)은 높은 출력을 생성합니다. 간단합니다. 하지만 모든 컴퓨터는 이 저급한 논리 구조에서 만들어집니다.

뇌의 기본 구성 요소 또는 "처리 단위"는 뉴런입니다. 뉴런은 낸드 게이트보다 훨씬 더 복잡하지 않습니다. 일반적으로 수백 개의 입력과 하나의 출력을 통해 전기화학적으로 통신합니다. 뉴런의 로직은 NAND 게이트(일반적으로 온/오프 로직 게이트가 아닌 아날로그 임계값 함수)보다 복잡하지만, 소프트웨어에서 쉽게 모델링할 수 있습니다.

뉴런이 서로 '연결'된 그룹을 신경망이라고 합니다. 뉴럴 네트워크는 재미있는 호기심을 자극하지만, 뉴런이 여러 층으로 연결되어 각 뉴런이 하나 이상의 다른 뉴런을 대량으로 공급할 때 진정한 힘을 발휘합니다. 이것이 바로 딥러닝입니다. 공식적으로 딥러닝은 "하나 이상의 계층을 포함하는 신경망"으로 정의됩니다.

흥미로운 점은 신경망이 1943년에 발명되어 1958년에 처음 구현된 퍼셉트론의 후손이라는 점입니다. 퍼셉트론은 심각한 한계가 있었지만 기본 개념은 건전했고 1987년 뉴럴 넷으로 발전했습니다. 다시 말해, 우리는 35년 이상 오늘날의 놀라운 AI 기술의 기반이 되는 기본 구성 요소를 갖추고 기본 아이디어를 이해해왔지만 최근까지 AI의 발전은 빙하처럼 더디게 진행되었습니다.

부족한 것은 컴퓨팅 성능이었습니다. 인간의 뇌에는 약 1,000억 개의 뉴런이 있습니다. 이러한 뉴런 사이에는 약 100조 개의 연결이 존재합니다. 컴퓨터 성능은 초기부터 기하급수적으로 성장해 왔지만, 최근에는 각각 수천 개의 프로세서 코어를 갖춘 매우 강력한 컴퓨터 그래픽 코프로세서가 등장하면서 의미 있는 수의 뉴런으로 신경망을 구축할 수 있게 되었습니다. 이를 이해하기 위해 몇 가지 수치를 제시해 보겠습니다.

제가 처음 프로그래밍을 본격적으로 시작했던 1986년, 세계에서 가장 강력한 슈퍼컴퓨터는 Cray X-MP/48이었습니다. 당시 이 기계의 가격은 약 2천만 달러, 지금 돈으로 환산하면 약 5500만 원에 달했습니다. 식당의 대형 냉장고 크기 정도였고, 에어컨을 켠 상태에서 정사각형 주택 한 채에 해당하는 약 350㎾의 전기를 사용했습니다. 몇 년 전 출시된 라즈베리 파이 제로는 미화 5달러의 가격으로 이러한 시스템과 거의 동일한 성능을 가졌습니다. 주머니에 넣고 다니다가 화면이 깨지면 쓰레기통에 버리는 아이폰이나 고급형 Android 휴대폰 한 대는 1986년 전 세계 모든 슈퍼컴퓨터를 합친 것만큼이나 강력한 성능을 발휘합니다. 동네 대형 마트를 방문하면 아이폰 수백 대와 맞먹는 기계를 구입할 수 있습니다.  

AI의 컴퓨터 과학 측면에서는 엄청난 발전이 이루어졌지만, 오늘날 AI 솔루션의 놀라운 능력을 이끌어낸 것은 컴퓨터 성능의 놀라운 증가와 훨씬 더 많은 수의 뉴런을 시뮬레이션할 수 있는 능력입니다.

딥러닝을 기반으로 구축된 솔루션

ML을 제외한 거의 모든 현재 AI 기술은 딥러닝을 기반으로 합니다. 제너레이티브 AI는 오늘날 AI의 '놀라운' 요소를 만들어내는 시스템을 광범위하게 분류한 것입니다. 생성형 AI는 다른 입력 데이터의 스타일로 새로운 결과물을 합성하는 기능입니다. 청각(음성, 소리, 음악), 시각(그림, 영화, 그림) 또는 텍스트(단어, 문장, 문단, 시, 가사 등)가 될 수 있습니다. 이 결과물은 완전히 독창적이거나 특정 아티스트의 스타일로 제작될 수 있습니다(즐겨 찾는 검색 엔진에서 믹스어랏 경의 '베이비 갓 백'을 부르는 엘비스의 목소리나 베르메르 스타일의 코기 그림 등을 찾아볼 수 있어야 합니다).

사진 크레딧: 케이시 리키

대규모 언어 모델은 인간의 언어에 특화된 생성 AI 시스템입니다. 아주 큰 바위 밑에 사는 사람이 아니라면 ChatGPT에 대해 들어보셨을 것입니다. ChatGPT는 AutoAI의 GPT라는 제품 위에 있는 웹 인터페이스입니다. ChatGPT는 사용자의 프롬프트와 질문을 기반으로 수수께끼에서 놀라움에 이르는 다양한 결과물을 만들어내는 놀라운 시스템입니다. ChatGPT는 자녀의 수학 숙제(또는 독후감 작성)를 대신해주고, 이야기를 써주고, 소프트웨어를 분석해주고, 파이썬으로 코드를 작성하는 데 도움을 줍니다. ChatGPT의 출력은 쉽게 지능적인 것으로 볼 수 있습니다(이 출력이 실제로 지능을 나타내는지 여부는 이 글의 범위를 벗어납니다). 물론, 이 결과물은 향후 5년 안에 기술이 어디로 나아갈지 보여줄 수 있을 만큼 인텔리전스에 근접해 있습니다.

보안 분야의 딥 러닝

지금까지 보안 제품에 신경망 기반 AI 솔루션이 통합된 사례는 거의 없었습니다. 물론 0은 아니지만, 공급업체가 이 기술을 도입하기까지 아직 넘어야 할 과속 방지턱이 몇 가지 있습니다.

'동기 부여'라는 용어를 조금 자유롭게 사용해도 된다면, 현 세대 대규모 언어 모델의 첫 번째 책임은 '동기 부여'가 사용자를 만족시키는 결과물을 생성하는 데 있다는 점입니다. 사용자를 만족시키는 출력이 반드시 올바른 출력은 아니라는 사실을 깨닫기 전까지는 이것은 꽤 좋은 것처럼 들립니다. LLM은 사용자가 만족하는 한 틀린 것에 대해 전적으로 만족합니다. 사실, 정답을 맞히는 것은 LLM의 부차적인 고려 사항이라고 말하는 것도 정확하지 않을 것입니다. LLM의 결과물이 정확하다면 이는 행복한 사고에 가깝고 LLM의 실질적인 관심사는 아닙니다. 이는 LLM 지원 시를 작성할 때는 괜찮지만 보안 정책을 지원할 때는 문제가 될 수 있습니다.

둘째, LLM은 말하자면 여전히 '손에서 벗어날' 수 있습니다. 필요에 따라 LLM은 업무에 꼭 필요한 것보다 훨씬 더 폭넓은 지식과 데이터로 교육을 받습니다. 사실, 때로는 직원을 고용하는 것과 같은 방식으로 LLM을 사용하는 것이 유용할 때도 있습니다. 필요한 업무를 수행하기 위해 고용된 직원은 해당 업무 외의 생활 경험도 분명히 있을 것입니다. 실수한 직원처럼, 현재의 LLM 구현은 안전한 대화 주제를 벗어날 수 있습니다.

LLM은 매우 최근의 기술이며, 많은 똑똑한 사람들이 이러한 문제를 해결하기 위해 노력하고 있습니다. 이 문제는 의심할 여지없이 내년 정도에 해결될 것입니다. 그렇게 되면 자연어 인터페이스, 이슈의 자동 우선순위 지정, 이전에 해결된 이슈의 상호 참조, 이슈 해결을 위한 제안 등 다양한 새로운 제품 기능을 기대할 수 있습니다. 지금부터 12~18개월 후, 다음과 같은 이메일을 보낼 수 있는 제품이 시장에 나오지 않는다면 놀랄 것입니다:

사용자 여러분. 오늘 아침 04:53:07부터 댈러스 데이터센터의 다음 네 대의 시스템에서 새로 발표된 CVE-20240101과 일치하는 특성을 가진 비정상 트래픽이 감지되었습니다: [...] 이 네 대의 시스템에는 모두 공급업체 패치 XXX가 없었고 두 대에는 CVE-20240101을 완화하는 패치 YYY도 없습니다. 이 서버들은 중복 데이터베이스 서버였고 장애 조치에 충분한 용량을 사용할 수 있었기 때문에 일시적으로 네트워크에서 연결이 끊어졌습니다. 이러한 시스템을 자동으로 다시 이미지화, 패치 및 복원하려면 >여기를 클릭하세요여기를 클릭하세요<.

이러한 각 요소는 적어도 연구 단계에서는 이미 존재합니다. LLM은 CVE(일반적인 취약점 및 노출)의 영문 텍스트를 구문 분석할 수 있습니다. 이들은 해당 CVE의 데이터를 실제 네트워크 트래픽과 비교할 수 있습니다. 네트워크 볼륨과 용량을 분석할 수 있습니다. 시스템의 설치된(또는 누락된) 소프트웨어와 구성을 분석할 수 있습니다. 또한 시스템 재구축과 구성 및 데이터 복원을 자동화하는 Ansible 스크립트를 생성할 수 있습니다. 조각을 맞추기만 하면 됩니다.

끝으로

소셜 미디어와 뉴스의 세계에서 우리는 언어(따라서 커뮤니케이션)가 의도적으로 덜 정확해지는 역사를 목격하고 있습니다. 우리는 버네이즈와 오웰의 교훈이 실제로 구현되는 것을 지켜보고 있습니다. 하지만 기술의 세계에서는 아직 이러한 도전에 직면하지 않았습니다. 우리는 여전히 정확하고 정확하게 말할 수 있습니다. 올바른 어휘력을 갖추는 것은 중요한 부분입니다.

관련 주제

No items found.

관련 문서

2023년 12월의 주요 사이버 보안 뉴스 기사
Cyber Resilience

2023년 12월의 주요 사이버 보안 뉴스 기사

사이버 보안 기술 부족 속에서 관리하는 방법, 사이버 복원력이 ROI와 연계되는 이유, ZTS를 사용하여 클라우드 보안 격차를 해결하는 방법에 대해 알아보세요.

DORA 준비: 2명의 사이버 보안 규정 준수 전문가가 전하는 인사이트
Cyber Resilience

DORA 준비: 2명의 사이버 보안 규정 준수 전문가가 전하는 인사이트

BT의 사이버 보안 담당 상무이사인 Tristan Morgan과 Evelyn Partners의 디지털 서비스 파트너인 Mark Hendry로부터 DORA 규정 준수에 대한 인사이트를 얻으세요.

바이든 대통령의 사이버 보안 행정명령이 연방 기관에 의미하는 것
Cyber Resilience

바이든 대통령의 사이버 보안 행정명령이 연방 기관에 의미하는 것

바이든 대통령의 사이버 보안 행정 명령은 정부 기관의 복원력을 높이고 위험을 줄이는 것을 목표로 합니다.

AI를 믿어서는 안 됩니다: 이를 이해하는 것이 혁신적일 수 있는 이유
Cyber Resilience

AI를 믿어서는 안 됩니다: 이를 이해하는 것이 혁신적일 수 있는 이유

Illumio의 CTO이자 공동 창립자가 AI "기술 경계(" )가 생각보다 작다고 믿는 이유와 이것이 AI를 사용하는 방식에 어떤 영향을 미치는지 알아보세요.

차세대 방화벽의 역사와 과제
Cyber Resilience

차세대 방화벽의 역사와 과제

차세대 방화벽(NGFW)의 원동력, 복잡성으로 인한 과제, 향후 혁신 가능성에 대해 알아보세요.

마이크로세분화 환경에서 NGFW 기능 사용 살펴보기
Cyber Resilience

마이크로세분화 환경에서 NGFW 기능 사용 살펴보기

마이크로세그멘테이션 환경에서 NGFW 기능을 구현할 수 있는 가능성에 대한 Illumio의 연구에 대해 자세히 알아보세요.

위반 가정.
영향 최소화.
복원력 향상.

제로 트러스트 세분화에 대해 자세히 알아볼 준비가 되셨나요?