바로 가기

딥러닝이란?

URL 복사

딥러닝은 컴퓨터가 인간의 뇌에서 영감을 얻은 알고리즘을 사용하여 데이터를 처리하도록 가르치는 인공지능(AI) 기술입니다. 

딥러닝은 인공지능과 머신 러닝(AI/ML)을 사용하여 데이터 과학자들이 많은 양의 데이터를 수집, 분석, 해석할 수 있게 지원합니다. 딥 뉴럴 러닝 또는 딥 뉴럴 네트워킹이라고도 하는 딥러닝 프로세스는 컴퓨터가 인간이 지식을 얻는 방식을 모방하여 관찰을 통해 학습하도록 가르칩니다. 

인간의 뇌는 상호 연결된 많은 뉴런을 포함하고 있으며 이러한 뉴런은 뇌가 정보(또는 데이터)를 처리할 때 정보 전달자 역할을 합니다. 이 뉴런들은 서로 통신하고 뇌의 다른 영역 간에 정보를 전달하기 위해 전기 자극과 화학 신호를 사용합니다. 

딥 러닝의 기본 아키텍처인 인공 신경망(ANN)은 이러한 생물학적 현상을 기반으로 하지만, 노드라고 하는 소프트웨어 모듈로 만들어진 인공 뉴런에 의해 형성됩니다. 이러한 노드는 (뇌의 화학 신호 대신) 수학적 계산을 사용하여 정보를 전달하고 전송합니다. 이 시뮬레이션 신경망(SNN)은 데이터 포인트를 클러스터링하고 예측하여 데이터를 처리합니다.

딥러닝을 입력 레이어에서 시작하여 출력 레이어로 끝나는 흐름도의 한 유형으로 생각하면 도움이 될 수 있습니다. 이 두 레이어 사이에는 다양한 수준의 정보를 처리하고 새로운 데이터를 지속적으로 수신할 때 동작을 조정하는 '숨겨진 레이어'가 있습니다. 딥러닝 모델에는 수백 개의 숨겨진 레이어가 있을 수 있으며, 각 레이어는 데이터세트 내의 관계와 패턴을 발견하는 데 관여합니다. 

여러 노드로 구성된 입력 레이어에서부터 시작하여 데이터는 모델에 도입되고 적절히 분류된 후에 다음 레이어로 이동합니다. 데이터가 각 레이어를 통과하는 경로는 각 노드에 설정된 계산을 기반으로 합니다. 결국 데이터는 각 레이어를 통과하면서 관측치를 수집하여 그 과정에서 궁극적으로 데이터의 출력 또는 최종 분석을 생성합니다.

딥러닝을 활용하는 응용 분야는 이미 우리의 일상에 통합되어 있으며 다양한 산업에서 사용되고 있습니다. 딥러닝 활용 사례는 계속해서 진화하고 있지만, 오늘날 사용되는 가장 인기 있는 기술 중 3가지는 컴퓨터 비전, 음성 인식, 자연어 처리(NLP)입니다. 

  • 컴퓨터 비전: 컴퓨터는 인간과 같은 방식으로 이미지를 이해하기 위해 딥러닝 기술을 사용합니다. 즉, 자동화된 콘텐츠 조정, 얼굴 인식, 이미지 분류를 수행합니다. 
  • 음성 인식: 음조, 어조, 언어, 억양은 모두 딥러닝 모델을 통해 분석됩니다. 이 기능은 고객 경험을 개선하는 데 사용될 수 있을 뿐만 아니라 실시간 전사가 필요한 경우 접근성 관점에서도 도움이 됩니다.
  • 자연어 처리(NLP): 컴퓨터는 딥러닝 알고리즘을 사용하여 텍스트 데이터와 문서에서 인사이트를 분석하고 수집합니다. 이는 긴 문서를 요약하고, 감정을 나타내는 주요 구문(예: 긍정적 또는 부정적 의견)을 인덱싱하고, 자동화된 가상 도우미 및 챗봇에 대한 인사이트를 생성하는 기능에 도움이 될 수 있습니다. 
     

여러 업계에서 딥러닝 원칙을 활용하는 방식은 다음 예에서 찾아볼 수 있습니다.

  • 고객 서비스: 챗봇, 가상 도우미 및 전화 연결 고객 서비스 포털은 음성 인식과 같은 툴을 사용합니다. 
  • 금융 서비스: 예측 분석을 통해 주식의 알고리즘 거래를 주도하고, 대출 승인에 대한 비즈니스 리스크를 평가하고, 부정행위를 감지하고, 신용 및 투자 포트폴리오를 관리를 돕습니다.
  • 의료 서비스: 의료 기록 디지털화를 통해, 이미지 인식 애플리케이션은 잠재적인 의료 진단을 나타내는 위험 신호를 자동으로 감지하는 방법을 학습하여 의료 영상 전문가를 지원할 수 있습니다. HCA Healthcare가 예측 분석을 사용하여 패혈증 감지에 대한 표준화된 디지털 접근 방식을 확립하는 방법을 확인하세요. 
  • 미디어 및 엔터테인먼트: 온라인 쇼핑에서 미디어 스트리밍 서비스에 이르기까지 딥러닝은 사용자 활동을 추적하고 개인화된 권장 사항을 개발하는 데 사용되고 있습니다.
  • 산업 자동화: 공장과 창고에서 딥러닝 애플리케이션을 활용하여 사람이나 물체가 기계에서 안전하지 않은 거리 내에 있을 때 자동으로 감지하거나 품질 제어 또는 예측 유지보수를 지원할 수 있습니다. 
  • 자율주행 차량: 자동차 연구원들은 자동차가 정지 신호, 신호등, 횡단보도, 보행자와 같은 대상을 감지하도록 훈련하는 데 딥러닝을 사용합니다.
  • 법 집행: 음성 인식, 컴퓨터 비전 및 자연어 처리(NLP)는 대량의 데이터 분석을 지원하므로 시간과 리소스를 절약할 수 있습니다. 
  • 항공우주 및 군사: 넓은 지리적 영역을 모니터링하는 사람들은 딥러닝을 사용하여 물체를 감지하고, 멀리서 관심 지역을 식별하고, 부대를 위해 안전한 영역인지 여부를 확인할 수 있습니다. 

딥러닝은 머신 러닝의 전문화된 형태로서, 작업하는 데이터 유형과 학습 방법으로 차별화됩니다.

고전적인 머신 러닝 알고리즘은 모델에 도입되기 전에 데이터 세트를 사전 처리하는 사람의 개입이 필요합니다. 즉, 특정 기능이 입력 데이터에서 정의되고 레이블이 지정된 다음 머신 러닝 모델에 도입되기 전에 테이블로 구성됩니다. 반대로, 딥러닝 알고리즘은 이러한 수준의 사전 처리가 필요하지 않으며 텍스트 문서, 픽셀 데이터 이미지 또는 오디오 데이터 파일과 같은 비정형 데이터를 이해할 수 있습니다. 

데이터의 양이 많거나, 주제에 대한 배경지식이 부족하거나, 복잡하고 시간이 오래 걸리는 태스크가 있는 경우, 고전적인 머신 러닝보다 딥 러닝을 선호할 수 있습니다.

딥러닝은 인공 신경망 내에서 서로 통신하는 노드 구조를 활용하여 작동합니다. ANN을 생성하려면 데이터를 입력할 때 모델에 계산값과 매개 변수를 함께 넣어야 하며, 이러한 계산값에 편향과 분산이 반영되도록 예방 조치를 취해야 합니다. 

머신 러닝의 맥락에서 편향은 목표 기능을 더 쉽게 학습하기 위해 모델이 데이터에 대해 가정하거나 일반화하는 정도를 나타냅니다. 편향이 높다는 것은 모델이 정보를 처리할 때 단순화하여 (오류로 향하는) 지름길을 생성하는 것을 의미합니다. 

분산은 각 데이터 포인트가 평균에서 얼마나 떨어져 있는지를 가리키는 측정값 또는 데이터 세트에서 숫자들 간 산포를 통계적으로 측정한 값을 말합니다. 편향과 반대로 분산은 모델이 훈련 데이터에 얼마나 민감한지를 나타냅니다. 분산 또는 민감도가 높다는 것은 모델이 세부 사항에 과도하게 주의를 기울이고 데이터 세트의 기본 패턴을 놓치고 있음을 의미합니다. 

지도 학습에서 분산이 너무 높고 편향이 너무 낮으면 과대적합이라고 합니다. 편향이 높고 분산이 낮으면 이를 과소적합이라고 합니다. 완벽한 적합치를 만드는 것은 어려울 수 있으며, 이러한 현상을 일반적으로 편향-분산 균형이라고 합니다. 

매개 변수는 경계를 정의하며, 경계는 딥러닝 알고리즘이 처리해야 하는 방대한 양의 데이터를 이해하는 데 중요합니다. 따라서 과대적합과 과소적합은 각각 더 적은 수와 더 많은 수의 매개 변수를 사용하여 수정할 수 있는 경우가 많습니다. 

인간 관련 편향 처리

딥러닝 모델이 통계적으로 편향된 데이터로 학습하거나 모집단의 정확한 표현을 제공하지 않는 경우 출력에 결함이 있을 수 있습니다. 안타깝게도 사람의 편견이 인공지능에 전달되어 차별적인 알고리즘과 편향 출력에 대한 위험을 초래할 때가 많습니다. 

조직이 생산성과 성과 향상을 위해 AI를 지속적으로 활용하는 만큼, 편향을 최소화하기 위한 전략 마련이 중요해졌습니다. 이를 위해서는 우선 포용성 있는 설계 프로세스를 갖추고 수집된 데이터 내 대표성을 지닌 다양성을 더욱 신중하게 고려해야 합니다. 

블랙박스란 무엇인가요?

'블랙박스'는 인공지능(AI) 프로그램이 신경망 내에서 태스크를 수행하지만 작업을 표시하지는 않는 경우를 말합니다. 그러면 알고리즘을 만든 데이터 과학자와 엔지니어를 포함한 어느 누구도 모델이 특정 출력에 도달한 방법을 정확하게 설명할 수 없는 시나리오가 만들어집니다. 블랙박스 모델을 해석할 능력이 부족하기 때문에 이 기능이 특히 의료, 사법 제도, 금융 등의 분야에서 고위험 의사 결정에 사용되는 경우 폐해를 초래할 수 있습니다. 

딥러닝 모델은 사람 개입 없이 더 복잡한 컴퓨팅 태스크를 수행할 수 있지만, 이는 더 많은 처리 능력, 충분한 인프라 및 더 큰 교육 데이터 세트가 필요하다는 것을 의미합니다. 클라우드 컴퓨팅을 사용하는 팀은 GPU(그래픽 처리 장치) 및 CPU(중앙 처리 장치) 클러스터와 같은 여러 프로세서에 동시에 액세스할 수 있으므로 복잡한 수학적 연산을 수행하기에 이상적인 환경이 조성됩니다.

개발 팀은 클라우드에서 딥러닝 모델을 설계, 개발, 교육함으로써 워크로드를 신속하고 정확하게 확장 및 배포하는 동시에 운영 비용을 절감할 수 있습니다. 

엣지에서의 딥러닝 및 머신 러닝

클라우드에서 작업하면 엣지에서 머신 러닝의 가능성이 열립니다. 퍼블릭 클라우드 리소스에 연결된 엣지 컴퓨팅 허브를 구축하면 실시간으로 정보를 캡처하고 분석하여 공급망 상태 업데이트부터 재난 대피 장소 정보에 이르는 다양한 운영을 지원할 수 있습니다. 

통합 자동화 기능을 갖춘 애플리케이션 플랫폼인 Red Hat® OpenShift®는 데이터 과학자의 역량을 강화하고 지능형 애플리케이션을 개발하여 다양한 업계의 조직이 비즈니스 및 미션 크리티컬 이니셔티브를 가속화할 수 있게 지원하는 것으로 유명합니다.

Red Hat OpenShift의 AI/ML은 자체 관리형 Red Hat OpenShift 또는 AI/ML 클라우드 서비스를 통해 AI/ML 워크플로우와 AI 기반 지능형 애플리케이션 제공을 가속화합니다.

조직은 DevOps 및 GitOps 원칙을 적용하여 지속적인 예측 정확도를 보장하기 위해 ML 모델을 소프트웨어 개발 프로세스, 프로덕션 롤아웃, 모니터링, 재교육 및 재배포에 통합하는 반복적인 프로세스를 자동화하고 간소화합니다. Red Hat OpenShift에는 데이터센터, 퍼블릭 클라우드 컴퓨팅, 엣지 컴퓨팅 전반에서 일관된 방식으로 머신 러닝 운영(MLOps)을 지원하는 핵심 기능이 포함되어 있습니다. 

Keep reading

문서

스테이트풀과 스테이트리스 비교

스테이트풀과 스테이트리스는 상호 작용 상태가 얼마나 오래 기록되는지, 해당 정보가 어떤 식으로 저장되는지를 기준으로 구별할 수 있습니다.

문서

Quarkus란?

Quarkus는 Java 가상 머신(Java Virtual Machine, JVM)과 네이티브 컴파일을 위해 만들어진 쿠버네티스 네이티브 Java 스택으로, 특히 컨테이너에 Java를 최적화합니다.

문서

서버리스란?

서버리스(serverless)란 개발자가 서버를 관리할 필요 없이 애플리케이션을 빌드하고 실행할 수 있도록 하는 클라우드 네이티브 개발 모델입니다.

클라우드 네이티브 애플리케이션에 대한 자세한 내용

제품

선택한 인프라에서 애플리케이션 출시 테스트를 완료한 통합 서비스 세트를 포함하는 엔터프라이즈 애플리케이션 플랫폼입니다.

여러 서비스를 서로 분리하여 독립적으로 생성, 확장, 배포할 수 있게 하는 분산형 클라우드 네이티브 통합 플랫폼입니다.

리소스

교육

무료 교육 과정

Developing Cloud-Native Applications with Microservices Architectures