セクションを選択

ディープラーニングとは

URL をコピー

ディープラーニングは、人間の脳をヒントに開発されたアルゴリズムを使用してコンピュータにデータを処理する方法を教える人工知能 (AI) 技法です。 

ディープラーニングは人工知能と機械学習 (AI/ML) を使用して、大量のデータを収集、分析、解釈するデータサイエンティストを支援します。ディープラーニングのプロセスはディープ・ニューラル・ラーニングやディープ・ニューラル・ネットワークとも呼ばれ、観測を通じてコンピュータに学習させるもので、人間が知識を獲得する方法を模しています。 

人間の脳には相互につながる多数の神経があり、脳が情報 (またはデータ) を処理するときに情報の伝達役として機能します。このニューロンは電気信号と化学的物質による信号を使用して相互に通信し、脳のさまざまな部分と情報をやりとりします。 

人工ニューラルネットワーク (ANN) はディープラーニングの基盤となるアーキテクチャで、この生体現象に基づいています。ただし、この現象はノードと呼ばれるソフトウェアモジュールから作成される人工ニューロンで形成されています。これらのノードは数理計算 (脳の場合は化学的信号) を使用して情報の通信と転送を行います。このシミュレーションされたニューラルネットワーク (SNN) は、データポイントをクラスタリングし、予測することでデータを処理します。

ディープラーニングを、入力レイヤーから始まって出力レイヤーで終わるフローチャートの一種と考えるとよいでしょう。この 2 つのレイヤーに挟まれているのが「隠れレイヤー」で、さまざまなレベルで情報を処理し、新しいデータを次々と受け取りながら動作を調整し、適応させます。ディープラーニングモデルには数百もの隠れレイヤーがあり、そのそれぞれがデータセット内の関係とパターンを見つけるために機能しています。 

複数のノードで構成される入力レイヤーから始めて、データがモデルに流れ込み、分類されてから次のレイヤーに進みます。データが各レイヤーを進む経路は、各ノードで設定された計算に基づきます。その後データが各レイヤーを通過し、その中で観測を取り込み、結果としてデータの出力となる最終分析が作成されます。

ディープラーニングを活用するアプリケーションはすでに私たちの日常生活に溶け込んでおり、多数の業界で使用されています。ディープラーニングのユースケースは進化を続けていますが、現在利用されている最も代表的な 3 大テクノロジーは、コンピュータビジョン、音声認識、自然言語処理 (NLP) です。 

  • コンピュータビジョン:コンピュータはディープラーニング技法を使用して、人間と同じ方法で画像を理解できます。これにより、自動コンテンツモデレーション、顔認識、画像分類が可能になります。 
  • 音声認識:ピッチ、トーン、言語、アクセントのすべてを、ディープラーニングモデルを利用して分析できます。カスタマーエクスペリエンスの向上に使用できるほか、リアルタイムの文字起こしが必要となる場合に、アクセシビリティの面からも有用です。
  • 自然言語処理 (NLP):コンピュータはディープラーニング・アルゴリズムを使用して、テキストデータやドキュメントを分析し、インサイトを収集します。長い文章の要約、センチメント (肯定的または否定的なコメントなど) を示す主なフレーズのインデックス化、自動バーチャルアシスタントやチャットボット向けインサイトの生成の機能において、支援になります。 
     

ディープラーニングの原則を活用する業界の事例をいくつか紹介します。

  • カスタマーサービス:チャットボット、バーチャルアシスタント、ダイアルイン・カスタマーサービス・ポータルでは、音声認識などのツールを利用しています。 
  • 金融サービス:予測分析によって、アルゴリズムによる株取引を促進し、融資承認のビジネスリスクを評価し、不正行為を検出し、信用および投資ポートフォリオの管理を支援します。
  • 医療:医療記録のデジタル化により、医療診断の必要性を示す危険信号を自動的に検出するように学習させて、画像認識アプリケーションで医用画像スペシャリストをサポートできます。HCA Healthcare が予測分析を使用して、敗血症の検出に対する標準化されたデジタルアプローチを確立した方法をご覧ください。 
  • メディアおよびエンターテインメント:オンラインショッピングからメディア・ストリーミング・サービスまで、ディープラーニングはユーザーのアクティビティの追跡や個別化されたお勧めの開発に使用されています。
  • 産業自動化:工場や倉庫において、ディープラーニング・アプリケーションによって、機械から安全な距離をとっていない人間や物があることを自動的に検出したり、品質管理や予防保守で支援したりすることができます。 
  • 自動運転車:自動車の研究者はディープラーニングを使用して、停止標識、信号、横断歩道、歩行者などの物体を検出するよう、自動車をトレーニングできます。
  • 法執行:音声認識、コンピュータビジョン、自然言語処理 (NLP) により、大量のデータの分析を支援し、時間とリソースを節約できます。 
  • 航空および軍事:広大な地理的領域を監視するために、ディープラーニングを使用して物体を検出し、対象領域を遠隔から特定し、隊にとって安全な区域と危険な区域を確認できます。 

ディープラーニングは機械学習の特化された形態で、取り扱うデータの種類や学習する手法において区別されます。

従来の機械学習アルゴリズムには、モデルに取り込む前にデータセットの前処理という形で、何らかの手作業が必要です。これにより、特定の特徴が入力データから定義されてラベル付けされ、機械学習モデルに取り込む前に表形式にまとめられます。逆にディープラーニング・アルゴリズムではこのレベルの前処理は不要で、テキスト文書、ピクセルデータの画像、オーディオデータのファイルなどの構造化されていないデータを理解することができます。 

ディープラーニングは、大量のデータがあって対象に対する背景知識がない場合、または複雑で時間がかかる作業がある場合に、従来の機械学習よりも向いているといえます。

私たちは、ディープラーニングが人工ニューラルネットワーク内で相互に通信するノードの構造を利用して機能することを知っています。ANN を作成するには、モデルおよび提供するデータに計算とパラメーターを導入する必要がありますが、これらの計算がバイアスとバリアンスに対応するように注意が必要です。 

機械学習の分野では、バイアスとは、ターゲット機能を学習しやすくするために、データについてモデルが仮定や汎化を行う程度を指します。バイアスが高いと、情報の処理においてモデルが単純化を行い、(誤りへの) ショートカットを作成することになります。 

バリアンスは、各データポイントの平均からの隔たり、すなわちデータセット内の分散の統計的な測定値を指します。バイアスとは異なり、バリアンスは、モデルがトレーニングデータの影響をどの程度受けるかを示します。バリアンス (感度) が高いと、細部に注意が行き過ぎて、データセットの根底にあるパターンを見逃してしまいます。 

教師付き学習では、バリアンスが高すぎてバイアスが低すぎる場合をオーバーフィッティングと言います。バイアスが高くてバリアンスが低い場合は、アンダーフィッティングと言います。完璧な適合を作り出すのは困難で、この現象を一般にバイアスとバリアンスのトレードオフと呼んでいます。 

パラメーターは境界を定義し、ディープラーニング・アルゴリズムが処理する必要がある膨大な量のデータから有意義な成果を引き出すには境界が重要です。このことから、多くの場合、オーバーフィッティングとアンダーフィッティングをパラメーターを増減させて訂正できることになります。 

人間が関与するバイアスへの対処 

ディープラーニング・モデルが統計的に偏りのあるデータや母集団を正確に反映しないデータでトレーニングされると、結果が損なわれます。残念なことに、今ある人間の偏見が人工知能に反映されることがよくあり、差別的なアルゴリズムや偏りのある出力を招くリスクを生じさせています。 

組織では生産性やパフォーマンスの向上に AI を活用しようとし続けていますが、バイアスを最小化するための戦略を適用することが不可欠です。これは包括的な設計プロセスと、収集したデータを代表する多様性を入念に検討することから始まります。 

ブラックボックスとは

「ブラックボックス」は、AI プログラムがニューラルネットワーク内でタスクを実行し、どのような処理が行われているのかを外部から見ることはできない状態を指します。この状況では、データサイエンティストやアルゴリズムを作成したエンジニアでさえも、モデルが特定の出力にどのようにして至ったかを誰も正確に説明できません。ブラックボックスモデルでは解釈が困難なので、特に医療、刑事司法、金融などの業界では、リスクの高い意思決定に使用すると有害な結論が導かれかねません。 

ディープラーニングモデルは、人手を介さなくてもより複雑なコンピューティング・タスクを実行できますが、それと同時に、より多くの処理能力、十分なインフラストラクチャ、大規模なトレーニングデータのセットが必要です。クラウド・コンピューティングでは、チームは GPU (グラフィックス処理装置) や CPU (中央処理装置) のクラスタなど、複数のプロセッサーに同時にアクセスでき、複雑な数理演算を実行するには最適な環境となります。

ディープラーニングモデルをクラウドで設計、開発、トレーニングすると、開発チームはすばやく正確にワークロードを拡張して分散でき、同時に運用コストを削減できます。 

エッジ上のディープラーニングと機械学習

クラウドで作業すると、エッジ上で機械学習を利用する可能性が生まれます。パブリッククラウド・リソースに接続されたエッジコンピューティングのハブを確立すると、情報をリアルタイムで取得して分析し、サプライチェーンのステータス更新から災害避難場所の情報まで、さまざまな運用を支援できます。 

Red Hat® OpenShift® は包括的な自動化機能を備えたアプリケーション・プラットフォームであり、データサイエンティストの能力を高め、インテリジェントなアプリケーションを開発することでさまざまな業界の組織がビジネスやミッションクリティカルな取り組みを迅速化する支援をすることで知られています。

Red Hat OpenShift での AI/ML は、自己管理型 Red Hat OpenShift または AI/ML クラウドサービスによって、AI/ML のワークフローと AI を活用したインテリジェント・アプリケーションの提供を迅速化します。

DevOps と GitOps の原則を適用することで、ソフトウェア開発プロセス、本番環境のロールアウト、監視、再トレーニング、再デプロイに ML モデルを統合する反復プロセスを自動化および単純化して、継続的な予測精度の向上を実現します。Red Hat OpenShift には、データセンター、パブリッククラウド・コンピューティング、エッジコンピューティング全体で一貫した方法で機械学習の運用 (MLOps) を可能にする主要な機能が含まれています。 

関連資料

記事

ステートフルとステートレス

あるものがステートフルかステートレスかは、別の何かとの通信の状態が記録される期間と、その情報をどのように保存する必要があるかによって決まります。

記事

Quarkus とは

Quarkus は、Java 仮想マシン (JVM) およびネイティブコンパイルのために作成された Kubernetes ネイティブの Java スタックで、Java をコンテナに最適化します。

記事

サーバーレスとは

サーバーレスは、開発者がサーバーを管理する必要なくアプリケーションを構築および実行できるようにするクラウドネイティブ開発モデルです。

クラウドネイティブ・アプリケーションの詳細はこちら

製品

統合されたテスト済みのサービス一式を備えたエンタープライズ・アプリケーション・プラットフォームであり、ユーザーの選ぶインフラストラクチャを使ってアプリケーションを市場に投入するために活用できます。

リソース

トレーニング

無料のトレーニング

Developing Cloud-Native Applications with Microservices Architectures