¿Qué es el deep learning?

Publicado 10 de febrero de 2026•9 minutos de lectura

El deep learning (aprendizaje profundo) es una técnica de inteligencia artificial que consiste en enseñar a las computadoras a procesar los datos utilizando algoritmos inspirados en el cerebro humano.

Utiliza la inteligencia artificial y el machine learning (aprendizaje automático) para que los analistas puedan recopilar, analizar e interpretar enormes cantidades de datos. Este proceso, también conocido como aprendizaje neuronal profundo o redes neuronales profundas, consiste en que las computadoras adquieran el aprendizaje a través de la observación, de manera similar a las personas.

El cerebro humano tiene muchas neuronas interconectadas que actúan como mensajeras cuando se procesa la información (o los datos). Las neuronas utilizan impulsos eléctricos y señales químicas para comunicarse entre sí y transmitir la información entre las distintas áreas del cerebro.

Las redes neuronales artificiales (ANN) constituyen la arquitectura subyacente del aprendizaje profundo y se basan en este fenómeno biológico, pero se forman con neuronas artificiales que se crean a partir de módulos de software denominados nodos. Los nodos utilizan cálculos matemáticos, a diferencia de las señales químicas que se usan en el cerebro, para comunicar y transmitir la información. Esta red neuronal simulada (SNN) procesa los datos agrupándolos en clústeres y realizando predicciones.

Puede ayudar pensar en el aprendizaje profundo como si fuera una especie de diagrama de flujo que comienza con una capa de entrada y termina con una de salida. Entre las dos, se encuentran las "capas ocultas", en las que se procesa la información en distintos niveles y se ajusta y adapta el comportamiento a medida que se reciben datos nuevos de forma permanente. Los modelos de deep learning pueden tener cientos de capas ocultas, y cada una de ellas cumple una función en el descubrimiento de las relaciones y los patrones dentro del conjunto de datos.

La capa de entrada está compuesta por varios nodos: los datos se incorporan al modelo y se categorizan según corresponda antes de continuar con el proceso. La ruta de los datos a través de las capas se basa en los cálculos de cada nodo. Los datos atraviesan cada una de las capas, y se recopilan conclusiones durante el proceso, las cuales acabarán por convertirse en la capa de salida o el análisis final.

Descubre Red Hat AI

Una plataforma para modelos de IA en la nube híbrida

Las aplicaciones que utilizan deep learning ya están integradas en la vida diaria y se utilizan en diferentes sectores. En la actualidad, muchas herramientas de inteligencia artificial se basan en la inteligencia artificial generativa, la cual es posible gracias a esta técnica.

Sus casos prácticos evolucionan constantemente, pero podemos destacar tres de los más conocidos en la actualidad: la visión artificial, el reconocimiento de voz y el procesamiento del lenguaje natural (NLP).

Visión artificial: las computadoras utilizan las técnicas de deep learning para comprender las imágenes como lo hacemos nosotros a través de la moderación automatizada del contenido, el reconocimiento facial y la clasificación de imágenes.
Reconocimiento de voz: se utilizan los modelos de deep learning para analizar el tono, el lenguaje y el acento. No solo es útil para mejorar la experiencia de los clientes, sino también para aumentar la accesibilidad cuando se requiere la transcripción en tiempo real.
Procesamiento del lenguaje natural (NLP): las computadoras utilizan los algoritmos de deep learning para analizar y recopilar información de los datos y los documentos de texto. Es útil para resumir documentos extensos, ordenar frases clave que expresen opiniones (por ejemplo, comentarios positivos o negativos) y generar información valiosa para los asistentes virtuales automatizados y los chatbots. El NLP es un ámbito más amplio que abarca el desarrollo y la aplicación de modelos de lenguaje de gran tamaño (LLM) para entender y generar lenguaje humano.

Estos son algunos ejemplos de los usos de los principios del aprendizaje profundo en los distintos sectores:

Servicio al cliente: los chatbots, los asistentes virtuales y los portales de servicio al cliente a través de llamadas telefónicas utilizan herramientas como el reconocimiento de voz.
Servicios financieros: el análisis predictivo es la base de la negociación algorítmica de acciones, ya que evalúa los riesgos empresariales para la aprobación de los préstamos, detecta fraudes y gestiona las carteras de créditos e inversiones.
Atención médica: gracias a la digitalización de los registros de salud, los especialistas en diagnóstico por imágenes pueden usar las aplicaciones de reconocimiento de imagen que aprenden a detectar automáticamente las señales de alerta que podrían indicar un diagnóstico determinado. Descubre el caso de HCA Healthcare, que utiliza el análisis predictivo para establecer un enfoque digital estandarizado para la detección de la septicemia.
Medios de comunicación y entretenimiento: el deep learning se utiliza para realizar un seguimiento de la actividad de los usuarios y brindarles recomendaciones personalizadas, desde las compras en línea hasta la transmisión de contenido multimedia.
Automatización industrial: en las fábricas y los depósitos, las aplicaciones de deep learning pueden detectar automáticamente cuando una persona o un objeto se encuentra demasiado cerca de una máquina, lo cual podría poner en riesgo la seguridad. También son útiles para el control de calidad y el mantenimiento predictivo.
Vehículos autónomos: los investigadores del sector automotor utilizan el deep learning para entrenar a los vehículos a detectar objetos o personas, como las señales de "pare", los semáforos, los pasos peatonales y los peatones.
Fuerzas de seguridad: el reconocimiento de voz, la visión artificial y el procesamiento del lenguaje natural permiten ahorrar tiempo y recursos en el análisis de grandes cantidades de datos.
Sector aeroespacial y militar: las entidades que controlan grandes áreas geográficas pueden utilizar el deep learning para detectar objetos, identificar las áreas de interés a la distancia y verificar las zonas seguras o inseguras para las tropas.

Casos prácticos de inteligencia artificial/machine learning

El deep learning es una clase especializada de machine learning y se diferencia por el tipo de datos con los que trabaja y por los métodos que utiliza para aprender.

Los algoritmos clásicos del machine learning requieren cierto grado de intervención humana para procesar los conjuntos de datos antes de incorporarlos al modelo. Esto significa que se definen y etiquetan funciones específicas a partir de los datos de entrada y luego se organizan en tablas antes de incorporarlos al modelo de machine learning. Por el contrario, los algoritmos del deep learning no necesitan ese mismo nivel de procesamiento previo y pueden comprender los datos no estructurados, como los documentos de texto, las imágenes de datos de píxel o los archivos de datos de audio.

Es preferible utilizar el deep learning en lugar del machine learning clásico en los casos en los que haya una enorme cantidad de datos, no se disponga de suficiente conocimiento previo sobre el tema o se trate de una tarea compleja que lleve mucho tiempo.

Obtén información sobre las operaciones de machine learning que respalda Red Hat OpenShift

Sabemos que el deep learning utiliza una estructura de nodos que se comunican entre sí mediante una red neuronal artificial (ANN). Para crear una ANN, se deben incorporar los cálculos y los parámetros al modelo junto con los datos, y se deben tomar precauciones para garantizar que los cálculos tengan en cuenta el sesgo y la varianza.

En el contexto del aprendizaje automático, el sesgo hace referencia a la medida en la que el modelo realiza presunciones o generalizaciones sobre los datos para que la función objetivo sea más fácil de aprender. Si el sesgo es alto, el modelo es demasiado simple y crea atajos (al punto de poder fallar) a medida que procesa la información.

La varianza es la medida de la distancia que separa cada dato de la media, o la medida estadística de la dispersión entre las cifras de un conjunto de datos. Contrariamente a lo que sucede con el sesgo, la varianza se refiere a qué tan sensible es un modelo a los datos de entrenamiento. La varianza (o sensibilidad) alta significa que el modelo presta demasiada atención a los detalles y pasa por alto los patrones fundamentales del conjunto de datos.

En el aprendizaje supervisado, cuando la varianza es muy alta y el sesgo es muy bajo, se habla de sobreajuste. Cuando en cambio el sesgo es alto y la varianza es baja, se da un subajuste. Puede ser difícil llegar al ajuste perfecto, conocido como el equilibrio entre el sesgo y la varianza.

Los parámetros definen los límites, los cuales son fundamentales para comprender la enorme cantidad de datos que deben procesar los algoritmos del aprendizaje profundo. Esto significa que, generalmente, los sobreajustes y los subajustes se pueden corregir utilizando menos o más parámetros, respectivamente.

Consideración del sesgo relacionado con las personas

Si un modelo de deep learning se entrena con datos estadísticamente sesgados o datos que no brindan una representación precisa de la población, se puede obtener un resultado erróneo. Desafortunadamente, el sesgo humano suele transferirse a la inteligencia artificial, lo cual implica el riesgo de que se creen algoritmos discriminatorios y resultados con determinadas inclinaciones.

A medida que las empresas continúan aprovechando la IA para mejorar la productividad y el rendimiento, es fundamental que se implementen estrategias para minimizar el sesgo. El primer paso es la implementación de procesos de diseño inclusivo y una mayor consciencia de la representación de la diversidad en los datos recopilados.

Caja negra

El término "caja negra" hace referencia a los programas de IA que ejecutan una tarea dentro de la red neuronal y no muestran su trabajo, lo cual implica que nadie puede explicar con exactitud cómo se generó un resultado en particular, ni siquiera los analistas de datos ni los ingenieros que crearon el algoritmo. La falta de capacidad de interpretación en los modelos de caja negra puede tener consecuencias negativas cuando se utilizan para la toma de decisiones que conllevan grandes riesgos, especialmente en sectores como la salud, la justicia penal o las finanzas.

Para que las cajas negras sean más comprensibles, se pueden aplicar técnicas deinteligencia artificial explicable (XAI)en todo el ciclo de vida del aprendizaje automático. La inteligencia artificial explicable debe poder demostrar sus competencias y conocimientos; explicar sus acciones pasadas, los procesos en curso y los próximos pasos; y citar cualquier información relevante en la que se basen sus acciones. En pocas palabras, la inteligencia artificial explicable impulsa a los sistemas de inteligencia artificial a "mostrar su trabajo".

Obtén más información sobre la inteligencia artificial explicable

Entrenamiento y desarrollo

Los modelos de deep learning pueden llevar a cabo tareas informáticas más complejas sin intervención humana, pero esto implica que necesitan más potencia de procesamiento, una infraestructura adecuada y conjuntos más grandes de datos para el entrenamiento. El cloud computing permite que los equipos accedan a varios procesadores simultáneamente, como los clústeres de las unidades gráficas de procesamiento (GPU) y de las unidades centrales de procesamiento (CPU), lo cual crea el entorno ideal para que se ejecuten las operaciones matemáticas complejas.

Cuando los equipos de desarrollo diseñan, desarrollan y entrenan modelos de deep learning en la nube, pueden ajustar y distribuir las cargas de trabajo con velocidad y precisión y, al mismo tiempo, reducir los costos operativos.

Inferencia e implementación

Una vez que se entrena el modelo, comienza la etapa de inferencia. En este punto, el modelo de deep learning procesa datos en vivo para hacer predicciones en tiempo real. Aquí es cuando un servidor de inferencia se vuelve esencial. Este se ejecuta dentro de la infraestructura de nube y funciona como un puente entre el hardware y la aplicación orientada al usuario. Su función es optimizar el modelo gestionando las solicitudes de recursos y asegurándose de que el procesamiento se lleve a cabo lo más rápido posible.

Una de las principales herramientas en este ámbito es el modelo de lenguaje de gran tamaño virtual (vLLM), un servidor y motor de inferencia que utiliza la memoria de manera eficiente y está diseñado para mejorar la velocidad y la capacidad de procesamiento de los LLM en un entorno de nube híbrida.

Obtén más información sobre vLLM

El deep learning y el machine learning en el extremo de la red

El uso de la nube brinda nuevas opciones para implementar el machine learning en el extremo de la red. Mediante la creación de centros de edge computing conectados a los recursos de la nube pública, se puede obtener y analizar la información de inmediato para intervenir en operaciones que pueden variar desde la actualización del estado de la cadena de suministro hasta la prestación de información sobre los lugares de evacuación en caso de una catástrofe.

Red Hat® AI permite que tus equipos se beneficien de todas las tecnologías mencionadas (la visión artificial, el reconocimiento de voz y el procesamiento del lenguaje natural) y mucho más.

Nuestra cartera de productos de inteligencia artificial se basa en soluciones que nuestros clientes ya conocen. Gracias a ellas, nuestros productos siguen siendo confiables, flexibles y adaptables.

Con Red Hat AI, las empresas logran:

adoptar la inteligencia artificial y generar innovaciones con ella de manera rápida;
simplificar el proceso de distribución de soluciones basadas en inteligencia artificial;
implementar recursos en cualquier entorno.

Descubre Red Hat AI

Conjunto de herramientas para realizar pruebas con el deep learning

Si deseas diseñar algoritmos de machine learning o crear modelos predictivos desde cero, Red Hat OpenShift AI cuenta con una variedad de herramientas para comenzar.

La plataforma ofrece funciones como interfaces interactivas basadas en JupyterLab, acceso sin inconvenientes a las bibliotecas de inteligencia artificial/machine learning principales y marcos muy populares. Además, contiene un editor visual para crear y automatizar canales de análisis de datos. Cuando se combinan con los canales de CI/CD, los equipos mejoran sus MLOps para aumentar la eficiencia operativa y, así, trasladar más modelos de inteligencia artificial a la fase de producción con mayor rapidez.

Descubre Red Hat OpenShift AI

Partners de Red Hat AI

Nuestro ecosistema de partners de inteligencia artificial es cada vez más amplio, por lo que muchos de ellos trabajan con Red Hat para certificar su funcionamiento con Red Hat AI. De esta manera, puedes explorar diferentes opciones.

Obtén más información sobre nuestros partners

Más información

Los modelos base para la inteligencia artificial

Se trata de modelos de machine learning (aprendizaje automático) que se entrenan previamente para llevar a cabo diversas tareas.

El concepto de MLOps

Las operaciones de machine learning (MLOps) son un conjunto de prácticas para los flujos de trabajo cuyo objetivo es optimizar el proceso de implementación y mantenimiento de los modelos de machine learning (aprendizaje automático).

¿Qué son los modelos de lenguaje de gran tamaño?

Un modelo de lenguaje de gran tamaño (LLM) es un tipo de modelo de inteligencia artificial que emplea técnicas de machine learning (aprendizaje automático) para comprender y generar lenguaje humano.

¿Qué es el deep learning?

Recursos de Red Hat

Consideración del sesgo relacionado con las personas

Caja negra

Entrenamiento y desarrollo

Inferencia e implementación

El deep learning y el machine learning en el extremo de la red

Conjunto de herramientas para realizar pruebas con el deep learning

Partners de Red Hat AI

¿Cuál es el nivel de soberanía de tu estrategia? Presentamos la herramienta Red Hat Sovereignty Readiness Assessment

Todas las versiones de prueba de los productos de Red Hat

Más información

Los modelos base para la inteligencia artificial

El concepto de MLOps

¿Qué son los modelos de lenguaje de gran tamaño?

IA/ML: lecturas recomendadas

Plataformas

Herramientas

Versiones de prueba, compras y ventas

Canales de comunicación

Acerca de Red Hat

Change page language

Red Hat legal and privacy links

Red Hat legal and privacy links