/
Cyber Resilience

AI がコミュニケーションに問題を抱える理由

言語はツールであり、その目的は非常に単純で、私の頭の中の考えやアイデアを可能な限り完全かつ正確にあなたの頭に移すことです。ほとんどのツールと同様に、言語ツールは、さまざまなユーザーがさまざまな方法で使用する可能性があります。  

言語を習得したからといって、成功が保証されるわけではありません。新しいテクノロジーは新しい語彙を意味します。そして、新しい語彙は、その語彙の使用の一貫性が低下することを意味します。そして、市場ではAI関連テクノロジーほど新しく、大きなものはありません。

すべてはコンテキストに関するものです

言語は、会話の双方が文脈と定義について同意している場合にのみ機能します。もっと口語的に言えば、言語は双方が「同じページ」にある場合に最も効果的です。技術の世界では、この種の誤解の典型的な例は、エンジニアリングとマーケティングの間のものです。実際、それは非常に一般的であるため、漫画ストリップ「ディルバート」のユーモアの基本的な前提となっています。

マーケティングとエンジニアリングの意見の相違についてのディルバートの漫画
写真提供:スコット・アダムス経由 Popverse

問題は実際には非常に単純で、エンジニアの目標はアイデアを正確に伝えることです。マーケティングはコミュニケーションでもありますが、正確さは二の次です。主な目標は影響を与えることです。精度の低い単語がマーケターからより良い応答を得た場合、精度の低い単語が使用されます。当然のことながら、エンジニアがマーケティング資料から学ぼうとするときに断絶(つまり、コミュニケーションの誤り)が生じます。

誤解のもう一つの一般的な原因は、同じ単語の定義が異なる2つのグループです。場合によっては、互換性はありませんが、両方が正しいこともあります。その好例が「理論」という言葉です。科学者、エンジニア、数学者にとって、「理論」という言葉は非常に正確な定義を持っており、非技術者の定義とはまったく異なります。ウィリアム・ブリッグスは数理統計学の博士号を持つ科学者で、2012年にこのテーマについて次のような洞察を提供しました。

「ところで、何かの知的モデルを『理論』と呼ぶのは私のイライラです。科学では、モデルは、あるシステムまたはプロセスの説明的で予測的な記述です。仮説とは、原理的に反証できるモデル、つまり、モデルを反証する証拠を明確に述べることができるモデルです。理論とは、これまでのところ、それが間違っていることを証明しようとするすべての試みを乗り越えてきた仮説です。」

非科学者の心の中で「理論」と「仮説」の定義が混同されると、科学者と非科学者の間のコミュニケーションは解決するのが難しい問題になります。つまり、科学者の考えや考えを非科学者の頭に完全かつ正確に移すことは難しい。より一般的な意味では、これは、異なるグループが互いにコミュニケーションをとるのが困難である良い例です。

どうすればこれを修正できるでしょうか?

テクノロジーの消費者として、このような「サイロを越えた」コミュニケーションは、お客様とベンダーの間、またはお客様と組織内の他のグループ間の間であっても、日常的な課題です。冒頭で述べたように、AI 関連テクノロジーは市場にとって新しいものであるため、多くの不正確さや誤解の原因となっています。

これを修正するには、まず、正確で正確なデータのソースが必要です。営業チーム、アカウントマネージャー、セールスエンジニアは、製品を購入するよう影響を与える仕事をしています。彼らはマーケティング用語でコミュニケーションをとるように教えられています。あなたが求めているのは、ほとんどのセールスエンジニアと驚くほど多くのアカウントマネージャーがエンジニアリングのバックグラウンドを持っているということです。彼らを「オタクモード」に陥らせ、マーケティングの語彙を捨ててエンジニアリングの話に切り替えるのは難しくありません。その時点で、使用するエンジニアリング用語の定義を知ることが重要です。

AI は 1950 年代半ばからコンピューター サイエンスの分野として存在しています。そのため、語彙は技術的な世界で確立されています。しかし、これらはすべてここ数年の消費者にとって新しいものであるため、消費者向けメディアで使用される単語の定義は少し「あいまい」です。「人工知能」、「機械学習」、「大規模言語モデル」、「GPT」、「生成AI」、「ディープラーニング」、「ニューラルネット」、「ChatGPT」などの用語に出くわしたことがあるでしょう。これらを理解しましょう。

AI の 2 つの基本的なカテゴリ

「物理学」という用語と同様に、AI または人工知能はそれ自体が実際には「物」ではありません。むしろ、他の多くの分野が存在する傘です。AI の傘下にある初期の研究手段を割り引くと、今日の AI には、統計ベースの AI とニューラル ネットワーク ベースの AI の 2 つの基本的なタイプがあります。

機械学習

統計ベースの AI は、ML または機械学習としてよく知られています。基本的に、ML は、解を記述する 1 つ以上の方程式で構成されるモデルを作成し、モデルに正解と不正解を与えることで、正と負の強化を使用してそのモデルを「トレーニング」することです。このトレーニングは基本的に、各方程式の各変数の係数をコンピューター支援で検索するものであり、新しい値が変数に差し込まれると、望ましい答えが得られます。

これが知性とは言えないほど単純に聞こえるかもしれませんが、その意見を持っているのはあなただけではありません。ML は、AI の傘下では「劣った」科学と見なされるのが一般的です。ML の「知性」としての地位については議論の余地がありますが、ツールとしての力はそうではありません。ML は多くの困難なタスクに優れています。

ML はさまざまな用途に使用できますが、その有用性を定義する唯一のユースケースを 1 つ選ばなければならないとしたら、私は「グループ化」を選択します。ML は、互いに「似ている」ものを見つけるのに非常に強力です。これは、携帯電話であなたの犬のすべての写真を見つけることかもしれません。または、レンズの焦点を合わせるポイントとして使用する写真内の人物の顔を見つけます。セキュリティについて話しているので、ネットワーク内で同様のトラフィックパターンを持つサーバーのグループを見つけ、それらのサーバーの1つからのトラフィックが突然以前のようになくなった場合(つまり、ベースラインからの逸脱)に通知し、侵害を示す可能性がある場合に役立つ場合があります。

他にも、すべての NTP サーバー、すべての Redis データベース、またはパッチが適用されていない古いバージョンの Windows を実行しているネットワーク内のすべてのマシンを見つけるなど、数十の用途が考えられます。

製品が AI を使用していると読んだ場合、使用されている特定のテクノロジーは ML である可能性があります。他の AI テクノロジーと比較して、ML は最も予測可能で、最もよく理解され、実装が最も簡単です。また、セキュリティ分野に共通する多くの問題もうまく解決します。また、ML モデル (ベンダーが行う部分) のトレーニングには膨大なコンピューティング リソースが必要ですが、トレーニング後の ML モデル (製品を購入した後に行う部分) を使用すると、他のどのアプリケーションよりも多くのコンピューティング能力を必要としないことも注目に値します。

ディープラーニング

一般の人が「AI」という言葉を聞いたとき、おそらくディープラーニングに基づくソリューションを思い浮かべているでしょう。ただし、ディープラーニングを定義する前に、まずニューラルネットについて説明する必要があります。

コンピュータの基本的な構成要素は NAND ゲートです。コンピュータロジックを使用すると、他のタイプのゲート、つまり任意のコンピュータをNANDゲートで構築できます。実際、アポロ宇宙船のコンピューターは大きな靴箱ほどの大きさで、約14,000個のNANDゲートを含んでいました。

NANDゲートは単純な生き物です。最も単純な形式では、NANDゲートには2つの入力と1つの出力があります。両方の入力がハイ(「オン」またはロジック1)の場合、出力はロー(「オフ」またはロジック0)になります。他の入力の組み合わせ(ロー/ロー、ロー/ハイ、またはハイ/ロー)は、高出力になります。簡単。しかし、この低い論理構造から、すべてのコンピュータは構築されます。

脳の基本的な構成要素または「処理ユニット」はニューロンです。ニューロンはNANDゲートほど複雑ではありません。これらは、複数の入力 (通常は数百) と 1 つの出力を介して電気化学的に通信します。ニューロンのロジックはNANDゲート(通常はオン/オフロジックゲートではなくアナログしきい値関数)よりも複雑ですが、これはソフトウェアで簡単にモデル化できます。

ニューロンのグループが「配線」されたのがニューラルネットです。ニューラルネットは楽しい好奇心ですが、その真の力は、ニューロンの層が接続され、各ニューロンが1つまたは複数の他のニューロンに大量に栄養を与えるときに実現されます。これがディープラーニングです。正式には、ディープラーニングは「複数の層を含むニューラルネットワーク」と定義されています。

興味深いのは、ニューラルネットは1943年に発明され、1958年に初めて実装されたパーセプトロンの子孫であることです。パーセプトロンには重大な限界がありましたが、基本的なコンセプトは健全であり、1987年にニューラルネットに進化しました。言い換えれば、私たちは35年以上にわたって、今日の素晴らしいAIテクノロジーの基盤となる基本的な構成要素と基本的なアイデアを理解してきましたが、AIの進歩は近年まで氷河期でした。

欠けていたのは計算能力でした。人間の脳にはおよそ1,000億個のニューロンがあります。これらのニューロンの間には、およそ100兆個の接続があります。コンピュータの能力は、その誕生以来指数関数的に成長してきましたが、それぞれ数千のプロセッサコアを備えた非常に強力なコンピュータグラフィックスコプロセッサが最近登場して初めて、意味のある数のニューロンを持つニューラルネットワークを構築することが可能になりました。これを大局的に理解するために、いくつかの数字を捨ててみましょう。

私がプログラミングに本格的に取り組み始めた1986年、世界で最も強力なスーパーコンピュータはCray X-MP/48でした。このマシンの価格は当時約$20M米ドル、または今日のお金で約$55M米ドルでした。レストランのウォークイン冷蔵庫ほどの大きさで、約350kwの電力を使用し、エアコンを上げた家の一棟分の電力を消費した。Raspberry Pi Zero は、数年前にリリースされたときの価格は 5 米ドルで、これらのシステムの 1 つとほぼ同じパフォーマンスを備えていました。ポケットに入れて持ち歩き、画面を壊したときにゴミ箱に捨てる 1 台の iPhone またはハイエンド Android スマートフォンは、1986 年に世界中のすべてのスーパーコンピューターを合わせたのと同じくらい強力です。地元の大型店に行くと、数百台の iPhone に相当するマシンが手に入るかもしれません。  

AI のコンピューター サイエンス面では大きな進歩が見られましたが、今日の AI ソリューションの驚くべき能力につながったのは、コンピューターの能力の驚くべき向上と、これまで以上に多くのニューロンをシミュレートする能力です。

ディープラーニングに基づいて構築されたソリューション

ML 以外では、現在の他のほぼすべての AI テクノロジーはディープラーニングに基づいています。生成 AI は、今日の AI で「すごい」要素を生み出すシステムの広範な分類です。生成 AI は、多くの場合、他の入力データのスタイルで新しい出力を合成する機能です。これは、聴覚 (音声、音、音楽)、視覚 (写真、映画、絵)、またはテキスト (単語、文、段落、詩、歌詞など) の場合があります。この出力は完全にオリジナルである場合もあれば、特定のアーティストのスタイルで行われた場合もあります (お気に入りの検索エンジンでは、ミックス・ア・ロット卿の「ベイビーズ・ゴット・バック」を歌うエルヴィスの声や、フェルメール風のコーギーの絵の例が表示されるはずです)。

写真提供: ケイシー・リッキー

大規模言語モデルは、人間の言語に特化した生成 AI システムです。非常に大きな岩の下に住んでいる人でない限り、ChatGPT について聞いたことがあるでしょう。ChatGPT は、GPT と呼ばれる AutoAI の製品上にある Web インターフェースです。ChatGPT は、ユーザーからのプロンプトや質問に基づいて、不可解なものから驚くべきものまで、さまざまな出力を生成する注目すべきシステムです。ChatGPT は、お子様の数学の宿題 (または読書見文の作成) を喜んで行ったり、ストーリーを書いたり、ソフトウェアを分析したり、Python でコードを書くのを手伝ったりします。ChatGPT の出力は、簡単にインテリジェントであると見なすことができます (ただし、この出力が本当にインテリジェンスを表しているかどうかは、この記事の範囲を超えています)。確かに、この出力は、今後5年間でテクノロジーがどこへ向かうかを示すのに十分な情報に近いものです。

セキュリティにおけるディープラーニング

これまでのところ、ニューラルネットワークベースのAIソリューションをセキュリティ製品に統合することはほとんどありませんでした。確かにゼロではありませんが、ベンダーがこのテクノロジーの導入を約束する前に、まだいくつかのスピードバンプを乗り越えなければなりません。

「動機」という用語について少し自由に考えてみると、現世代の大規模言語モデルの最初の責任は、その「動機」がユーザーを満足させる出力を生み出すことであるということです。これはかなり良いことのように聞こえますが、ユーザーを満足させる出力が必ずしも正しい出力であるとは限らないことに気付くまでは。LLM は、ユーザーが満足している限り、間違っても完全に満足します。実際、LLM にとって正しいことが二次的な考慮事項であるとさえ言っても正確ではありません。LLM の出力がたまたま正確であれば、それはむしろ幸せな偶然であり、LLM にとっては本当の関心事ではありません。これは、LLM 支援詩を書く場合は問題ありませんが、セキュリティ ポリシーを支援する場合は問題になる可能性があります。

第二に、LLM はいわば依然として「手に負えなくなる」可能性があります。必然的に、LLM は、使用に厳密に必要なよりもはるかに幅広い知識とデータを使用してトレーニングされます。実際、LLMは従業員を雇うのと同じように使うと考えると便利な場合があります。あなたがやるべき仕事をするために雇われた従業員は、確かにその仕事以外の人生経験を持っています。誤った従業員のように、現在の LLM 実装は、安全な会話のトピックの外に導かれる可能性があります。

LLMはごく最近の技術であり、これらの問題は多くの非常に賢い人々によって取り組まれています。それらは間違いなく来年かそこらで解決されるでしょう。それが完了すると、自然言語インターフェイス、問題の自動優先順位付け、以前に解決された問題の相互参照、問題解決の提案など、さまざまな新製品機能が期待できます。今から12ヶ月から18ヶ月後、次のようなメールを送ってくれる製品が市場に出回っていなかったら驚くでしょう。

親愛なるユーザー。今朝 04:53:07 から、新しくリリースされた CVE-20240101 に一致する特性を持つ異常なトラフィックが、ダラスのデータセンター内の次の 4 台のマシンから検出されました。これらの 4 台のマシンはすべてベンダー パッチ XXX を欠いており、2 台には CVE-20240101 を緩和するパッチ YYY もありません。これらは冗長データベース サーバーであり、フェイルオーバーに十分な容量が使用可能であったため、これらのマシンは一時的にネットワークから切断されました。これらのシステムを自動的に再イメージ化、パッチ適用、復元するには >ここここ< をクリックしてください。

この各部分は、少なくとも研究段階では、今日すでに存在しています。LLMは、CVE(一般的な脆弱性と露出)の英語テキストを解析できます。そのCVE内のデータを実際のネットワークトラフィックと比較することができます。ネットワークのボリュームと容量を分析できます。システムにインストールされている (および不足している) ソフトウェアと構成を分析できます。また、Ansible スクリプトを生成して、システムの再構築と構成とデータの復元を自動化できます。ピースを組み立てるだけです。

最後に

ソーシャルメディアとニュースの世界では、言語(したがってコミュニケーション)が意図的に精度を低下させられるにつれて、歴史が展開するのを見守っています。私たちは、バーネイズとオーウェルの教訓を実際に実装するのを見ています。しかし、テクノロジーの世界では、私たちはまだこれらの課題に直面していません。私たちはまだ正確かつ正確に話す自由があります。適切な語彙を持つことは、その重要な部分です。

関連トピック

No items found.

関連記事

2023年12月のトップサイバーセキュリティニュース
Cyber Resilience

2023年12月のトップサイバーセキュリティニュース

サイバーセキュリティのスキル不足の中での管理方法、サイバーレジリエンスがROIに結びついている理由、ZTSを使用してクラウドセキュリティのギャップを解決する方法を学びます。

DORAの準備:2人のサイバーセキュリティコンプライアンス専門家からの洞察
Cyber Resilience

DORAの準備:2人のサイバーセキュリティコンプライアンス専門家からの洞察

BTのサイバーセキュリティ担当マネージングディレクターであるTristan Morgan氏と、Evelyn PartnersのデジタルサービスパートナーであるMark Hendry氏から、DORAコンプライアンスのナビゲートに関する洞察を得ることができます。

バイデン大統領のサイバーセキュリティ大統領令が連邦政府機関にとって何を意味するか
Cyber Resilience

バイデン大統領のサイバーセキュリティ大統領令が連邦政府機関にとって何を意味するか

バイデン大統領のサイバーセキュリティ大統領令は、政府機関の回復力を高め、リスクを軽減することを目的としています。

AI は信頼すべきではない: それを理解することが変革をもたらす理由
Cyber Resilience

AI は信頼すべきではない: それを理解することが変革をもたらす理由

イルミオのCTO兼共同創設者が、AIの「技術境界」が見た目よりも小さいと考えている理由と、それがAIの使用方法にどのように影響しているかをご覧ください。

次世代ファイアウォールの歴史と課題
Cyber Resilience

次世代ファイアウォールの歴史と課題

次世代ファイアウォール(NGFW)の推進力、複雑さに関する課題、将来のイノベーションの可能性について学びます。

マイクロセグメンテーション環境におけるNGFW機能の使用の探求
Cyber Resilience

マイクロセグメンテーション環境におけるNGFW機能の使用の探求

マイクロセグメンテーション環境にNGFW機能を実装する可能性に関するイルミオの研究の詳細をご覧ください。

違反を想定します。
影響を最小限に抑えます。
レジリエンスを高めます。

ゼロトラストセグメンテーションについて詳しく知る準備はできていますか?