概要
ディープラーニング (深層学習) は、人間の脳をヒントに開発されたアルゴリズムを使用してコンピュータにデータを処理する方法を教える人工知能 (AI) 技法です。ディープラーニングでは、人間の知識の獲得方法を模して開発されたアルゴリズムを使い、データから特徴を抽出するようコンピュータに学習させます。
ディープラーニングとは?意味をわかりやすく解説
ディープラーニング (deep learning) は人工知能と機械学習 (AI/ML) を使用して、大量のデータを収集、分析、解釈するデータサイエンティストを支援します。ディープラーニングのプロセスはディープ・ニューラル・ラーニングやディープ・ニューラル・ネットワークとも呼ばれ、観測を通じてコンピュータに学習させるもので、人間が知識を獲得する方法を模しています。
人間の脳には相互につながる多数の神経があり、脳が情報 (またはデータ) を処理するときに情報の伝達役として機能します。このニューロンは電気信号と化学的物質による信号を使用して相互に通信し、脳のさまざまな部分と情報をやりとりします。
人工ニューラルネットワーク (ANN) はディープラーニングの基盤となるアーキテクチャで、この生体現象に基づいています。ただし、この現象はノードと呼ばれるソフトウェアモジュールから作成される人工ニューロンで形成されています。これらのノードは数理計算 (脳の場合は化学的信号) を使用して情報の通信と転送を行います。このシミュレーションされたニューラルネットワーク (SNN) は、データポイントをクラスタリングし、予測することでデータを処理します。
ディープラーニングを、入力レイヤーから始まって出力レイヤーで終わるフローチャートの一種と考えるとよいでしょう。この 2 つのレイヤーに挟まれているのが「隠れレイヤー」で、さまざまなレベルで情報を処理し、新しいデータを次々と受け取りながら動作を調整し、適応させます。ディープラーニングモデルには数百もの隠れレイヤーがあり、そのそれぞれがデータセット内の関係とパターンを見つけるために機能しています。
複数のノードで構成される入力レイヤーから始めて、データがモデルに流れ込み、分類されてから次のレイヤーに進みます。データが各レイヤーを進む経路は、各ノードで設定された計算に基づきます。その後データが各レイヤーを通過し、その中で観測を取り込み、結果としてデータの出力となる最終分析が作成されます。
Red Hat のリソース
ディープラーニング向けアプリケーション
ディープラーニングを活用するアプリケーションはすでに私たちの日常生活に溶け込んでおり、多数の業界で使用されています。生成 AI は今や多数の AI ツールの原動力となっていますが、それを可能にしているのがディープラーニングです。
ディープラーニングのユースケースは進化を続けていますが、現在利用されている最も代表的な 3 大テクノロジーは、コンピュータビジョン、音声認識、自然言語処理 (NLP) です。
- コンピュータビジョン:コンピュータはディープラーニング技法を使用して、人間と同じ方法で画像を理解できます。これにより、自動コンテンツモデレーション、顔認識、画像分類が可能になります。
- 音声認識:ピッチ、トーン、言語、アクセントのすべてを、ディープラーニングモデルを利用して分析できます。カスタマーエクスペリエンスの向上に使用できるほか、リアルタイムの文字起こしが必要となる場合に、アクセシビリティの面からも有用です。
- 自然言語処理 (NLP):コンピュータはディープラーニング・アルゴリズムを使用して、テキストデータやドキュメントを分析し、インサイトを収集します。長い文章の要約、センチメント (肯定的または否定的なコメントなど) を示す主なフレーズのインデックス化、自動バーチャルアシスタントやチャットボット向けインサイトの生成の機能において、支援になります。NLP の領域は広範で、人間の言語を理解し生成するための大規模言語モデル (LLM) の開発と適用が含まれます。
ディープラーニングの原則を活用する業界の事例をいくつか紹介します。
- カスタマーサービス:チャットボット、バーチャルアシスタント、ダイアルイン・カスタマーサービス・ポータルでは、音声認識などのツールを利用しています。
- 金融サービス:予測分析によって、アルゴリズムによる株取引を促進し、融資承認のビジネスリスクを評価し、不正行為を検出し、信用および投資ポートフォリオの管理を支援します。
- 医療:医療記録のデジタル化により、医療診断の必要性を示す危険信号を自動的に検出するように学習させて、画像認識アプリケーションで医用画像スペシャリストをサポートできます。HCA Healthcare が予測分析を使用して、敗血症の検出に対する標準化されたデジタルアプローチを確立した方法をご覧ください。
- メディアおよびエンターテインメント:オンラインショッピングからメディア・ストリーミング・サービスまで、ディープラーニングはユーザーのアクティビティの追跡や個別化されたお勧めの開発に使用されています。
- 産業自動化:工場や倉庫において、ディープラーニング・アプリケーションによって、機械から安全な距離をとっていない人間や物があることを自動的に検出したり、品質管理や予防保守で支援したりすることができます。
- 自動運転車:自動車の研究者はディープラーニングを使用して、停止標識、信号、横断歩道、歩行者などの物体を検出するよう、自動車をトレーニングできます。
- 法執行:音声認識、コンピュータビジョン、自然言語処理 (NLP) により、大量のデータの分析を支援し、時間とリソースを節約できます。
- 航空および軍事:広大な地理的領域を監視するために、ディープラーニングを使用して物体を検出し、対象領域を遠隔から特定し、隊にとって安全な区域と危険な区域を確認できます。
ディープラーニングと機械学習の関係
ディープラーニングは機械学習の特化された形態で、取り扱うデータの種類や学習する手法において区別されます。
従来の機械学習アルゴリズムには、モデルに取り込む前にデータセットの前処理という形で、何らかの手作業が必要です。これにより、特定の特徴が入力データから定義されてラベル付けされ、機械学習モデルに取り込む前に表形式にまとめられます。逆にディープラーニング・アルゴリズムではこのレベルの前処理は不要で、テキスト文書、ピクセルデータの画像、オーディオデータのファイルなどの構造化されていないデータを理解することができます。
ディープラーニングは、大量のデータがあって対象に対する背景知識がない場合、または複雑で時間がかかる作業がある場合に、従来の機械学習よりも向いているといえます。
「バイアス」と「バリアンス」に対する検討事項
私たちは、ディープラーニングが人工ニューラルネットワーク内で相互に通信するノードの構造を利用して機能することを知っています。ANN を作成するには、モデルおよび提供するデータに計算とパラメーターを導入する必要がありますが、これらの計算がバイアスとバリアンスに対応するように注意が必要です。
機械学習の分野では、バイアスとは、ターゲット機能を学習しやすくするために、データについてモデルが仮定や汎化を行う程度を指します。バイアスが高いと、情報の処理においてモデルが単純化を行い、(誤りへの) ショートカットを作成することになります。
バリアンスは、各データポイントの平均からの隔たり、すなわちデータセット内の分散の統計的な測定値を指します。バイアスとは異なり、バリアンスは、モデルがトレーニングデータの影響をどの程度受けるかを示します。バリアンス (感度) が高いと、細部に注意が行き過ぎて、データセットの根底にあるパターンを見逃してしまいます。
教師あり学習では、バリアンスが高すぎてバイアスが低すぎる場合をオーバーフィッティングと言います。バイアスが高くてバリアンスが低い場合は、アンダーフィッティングと言います。完璧な適合を作り出すのは困難で、この現象を一般にバイアスとバリアンスのトレードオフと呼んでいます。
パラメーターは境界を定義し、ディープラーニング・アルゴリズムが処理する必要がある膨大な量のデータから有意義な成果を引き出すには境界が重要です。このことから、多くの場合、オーバーフィッティングとアンダーフィッティングをパラメーターを増減させて訂正できることになります。
人間が関与するバイアスへの対処
ディープラーニング・モデルが統計的に偏りのあるデータや母集団を正確に反映しないデータでトレーニングされると、結果が損なわれます。残念なことに、今ある人間の偏見が人工知能に反映されることがよくあり、差別的なアルゴリズムや偏りのある出力を招くリスクを生じさせています。
組織では生産性やパフォーマンスの向上に AI を活用しようとし続けていますが、バイアスを最小化するための戦略を適用することが不可欠です。これは包括的な設計プロセスと、収集したデータを代表する多様性を入念に検討することから始まります。
ブラックボックスとは
「ブラックボックス」は、AI プログラムがニューラルネットワーク内でタスクを実行し、どのような処理が行われているのかを外部から見ることはできない状態を指します。この状況では、データサイエンティストやアルゴリズムを作成したエンジニアでさえも、モデルが特定の出力にどのようにして至ったかを誰も正確に説明できません。ブラックボックスモデルでは解釈が困難なので、特に医療、刑事司法、金融などの業界では、リスクの高い意思決定に使用すると有害な結論が導かれかねません。
クラウドでのディープラーニングのメリットとは
ディープラーニングモデルは、人手を介さなくてもより複雑なコンピューティング・タスクを実行できますが、それと同時に、より多くの処理能力、十分なインフラストラクチャ、大規模なトレーニングデータのセットが必要です。クラウド・コンピューティングでは、チームは GPU (グラフィックス処理装置) や CPU (中央処理装置) のクラスタなど、複数のプロセッサーに同時にアクセスでき、複雑な数理演算を実行するには最適な環境となります。
ディープラーニングモデルをクラウドで設計、開発、トレーニングすると、開発チームはすばやく正確にワークロードを拡張して分散でき、同時に運用コストを削減できます。
エッジ上のディープラーニングと機械学習
クラウドで作業すると、エッジ上で機械学習を利用する可能性が生まれます。パブリッククラウド・リソースに接続されたエッジコンピューティングのハブを確立すると、情報をリアルタイムで取得して分析し、サプライチェーンのステータス更新から災害避難場所の情報まで、さまざまな運用を支援できます。
Red Hat のサポート内容
Red Hat は、チームが AI アプリケーションと機械学習 (ML) モデルを透明性と制御性をもって構築し、デプロイするための共通の基盤を提供します。
Red Hat® OpenShift® AI は、独自のユースケースと独自のデータを使用して、AI モデルのトレーニング、プロンプトチューニング、ファインチューニング、提供ができるプラットフォームです。
大規模な AI デプロイメント向けに、Red Hat OpenShift は AI ワークロードに適したスケーラブルなアプリケーション・プラットフォームを提供しており、一般的なハードウェア・アクセラレーターへのアクセスを完備しています。
Red Hat はまた、他のオープンソースソフトウェアの実用性を向上させるために、Red Hat Ansible® Lightspeed (および IBM watsonx Code Assistant) をはじめとする独自の Red Hat OpenShift AI ツールを使用しています。このサービスにより、自動化チームは Ansible コンテンツをより効率的に学習、作成、保守できるようになります。ユーザーによって入力されたプロンプトを受け入れ、IBM watsonx 基盤モデルと対話して推奨するコード情報を生成し、これが Ansible Playbook を作成するために使用されます。
また、Red Hat の統合パートナーにより、オープンソース・プラットフォームと連携するよう構築された、信頼できる AI ツールのエコシステムへの扉が開かれます。
Red Hat 公式ブログ
Red Hat のお客様、パートナー、およびコミュニティのエコシステムに関する最新の情報を入手しましょう。