Deep learning

Copiar URL

El deep learning (aprendizaje profundo) es una técnica de inteligencia artificial que consiste en enseñar a las computadoras a procesar los datos utilizando algoritmos inspirados en el cerebro humano. 

Descubre Red Hat AI

En el deep learning, se utiliza la inteligencia artificial y el machine learning (aprendizaje automático) para que los analistas de datos puedan recopilar, analizar e interpretar enormes cantidades de datos. Este proceso, también conocido como aprendizaje neuronal profundo o redes neuronales profundas, consiste en que las computadoras adquieran el aprendizaje a través de la observación, de manera similar a las personas.

El cerebro humano está compuesto por muchas neuronas interconectadas que actúan como mensajeras cuando se procesa la información (o los datos). Las neuronas utilizan impulsos eléctricos y señales químicas para comunicarse entre sí y transmitir la información entre las distintas áreas del cerebro.

Las redes neuronales artificiales (ANN) constituyen la arquitectura fundamental del deep learning y se basan en este fenómeno biológico, pero se forman con neuronas artificiales creadas a partir de módulos de software denominados nodos. Los nodos utilizan cálculos matemáticos, a diferencia de las señales químicas que se usan en el cerebro, para comunicar y transmitir la información. Esta red neuronal simulada (SNN) procesa los datos agrupándolos en clústeres y realizando predicciones.

Puede ayudar pensar en el deep learning como si fuera una especie de diagrama de flujo que comienza con una capa de entrada y termina con una de salida. Entre las dos, se encuentran las "capas ocultas", en las que se procesa la información en distintos niveles y se ajusta y adapta el comportamiento a medida que se reciben datos nuevos de forma permanente. Los modelos de deep learning pueden tener cientos de capas ocultas, y cada una de ellas cumple una función en el descubrimiento de las relaciones y los patrones dentro del conjunto de datos.

La capa de entrada está compuesta por varios nodos y, en ella, los datos se incorporan al modelo y se categorizan según corresponda antes de continuar con el proceso. La ruta de los datos a través de las capas se basa en los cálculos de cada nodo. Los datos atraviesan cada una de las capas, y se recopilan conclusiones durante el proceso, las cuales acabarán por convertirse en la capa de salida o el análisis final.

Recursos de Red Hat

Las aplicaciones que utilizan el deep learning ya están integradas en la vida diaria y se utilizan en diferentes sectores. En la actualidad, muchas herramientas de inteligencia artificial se basan en la inteligencia artificial generativa, la cual es posible gracias a esta técnica.

Sus casos prácticos evolucionan constantemente, pero podemos destacar tres de los más conocidos en la actualidad: la visión artificial, el reconocimiento de voz y el procesamiento del lenguaje natural (NLP).

  • Visión artificial: las computadoras utilizan las técnicas de deep learning para comprender las imágenes como lo hacemos nosotros, lo cual incluye la moderación automatizada del contenido, el reconocimiento facial y la clasificación de imágenes.
  • Reconocimiento de voz: se utilizan los modelos de deep learning para analizar el tono, el lenguaje y el acento. No solo es útil para mejorar la experiencia de los clientes, sino también para aumentar la accesibilidad cuando se requiere la transcripción en tiempo real.
  • Procesamiento del lenguaje natural (NLP): las computadoras utilizan los algoritmos del deep learning para analizar y recopilar información de los datos y los documentos de texto. Es útil para resumir documentos extensos, ordenar frases clave que expresen opiniones (por ejemplo, comentarios positivos o negativos) y generar información valiosa para los asistentes virtuales automatizados y los chatbots. El NLP es un ámbito más amplio que abarca el desarrollo y la aplicación de modelos de lenguaje de gran tamaño (LLM) para entender y generar lenguaje humano.
     

Estos son algunos ejemplos de los usos de los principios del deep learning en los distintos sectores:

  • Servicio al cliente: los chatbots, los asistentes virtuales y los portales de servicio al cliente a través de llamadas telefónicas utilizan herramientas como el reconocimiento de voz.
  • Servicios financieros: el análisis predictivo es la base de la negociación algorítmica de acciones, ya que evalúa los riesgos empresariales para la aprobación de los préstamos, detecta fraudes y gestiona las carteras de créditos e inversiones.
  • Atención médica: gracias a la digitalización de los registros de salud, los especialistas en diagnóstico por imágenes pueden usar las aplicaciones de reconocimiento de imagen que aprenden a detectar automáticamente las señales de alerta que podrían indicar un diagnóstico determinado.Descubre el caso de HCA Healthcare, que utiliza el análisis predictivo para establecer un enfoque digital estandarizado para la detección de la septicemia.
  • Medios de comunicación y entretenimiento: el deep learning se utiliza para realizar un seguimiento de la actividad de los usuarios y brindarles recomendaciones personalizadas, desde las compras en línea hasta la transmisión de contenido multimedia.
  • Automatización industrial: en las fábricas y los depósitos, las aplicaciones de deep learning pueden detectar automáticamente cuando una persona o un objeto se encuentra demasiado cerca de una máquina, lo cual podría poner en riesgo su seguridad. También son útiles para el control de calidad y el mantenimiento predictivo.
  • Vehículos autónomos: los investigadores del sector automotor utilizan el deep learning para entrenar a los vehículos a detectar objetos o personas, como las señales de "pare", los semáforos, los pasos peatonales y los peatones.
  • Fuerzas de seguridad: el reconocimiento de voz, la visión artificial y el procesamiento del lenguaje natural (NLP) permiten ahorrar tiempo y recursos en el análisis de grandes cantidades de datos.
  • Sector aeroespacial y militar: las entidades que controlan grandes áreas geográficas pueden utilizar el deep learning para detectar objetos, identificar las áreas de interés a la distancia y verificar las zonas seguras o inseguras para las tropas.

Descubre los casos prácticos de inteligencia artificial/machine learning

El deep learning es una clase especializada de machine learning y se diferencia por el tipo de datos con los que trabaja y por los métodos que utiliza para aprender.

Los algoritmos clásicos del machine learning requieren cierto grado de intervención humana para procesar los conjuntos de datos antes de incorporarlos al modelo. Esto significa que se definen y etiquetan funciones específicas a partir de los datos de entrada y luego se organizan en tablas antes de incorporarlos al modelo de machine learning. Por el contrario, los algoritmos del deep learning no necesitan ese mismo nivel de procesamiento previo y pueden comprender los datos no estructurados, como los documentos de texto, las imágenes de datos de píxel o los archivos de datos de audio.

Es preferible utilizar el deep learning en lugar del machine learning clásico en los casos en los que haya una enorme cantidad de datos, no se disponga de suficiente conocimiento previo sobre el tema o se trate de una tarea compleja que lleve mucho tiempo.

Sabemos que el deep learning utiliza una estructura de nodos que se comunican entre sí mediante una red neuronal artificial. Para crear una ANN, se deben incorporar los cálculos y los parámetros al modelo junto con los datos, y se deben tomar precauciones para garantizar que los cálculos tengan en cuenta el sesgo y la varianza.

En el contexto del machine learning, el sesgo hace referencia a la medida en la que el modelo realiza suposiciones o generalizaciones sobre los datos para que la función objetivo sea más fácil de aprender. Si el sesgo es alto, el modelo es demasiado simple y crea atajos (al punto de poder fallar) a medida que procesa la información.

La varianza es la medida de la distancia que separa cada dato de la media, o la medida estadística de la dispersión entre las cifras de un conjunto de datos. Contrariamente a lo que sucede con el sesgo, la varianza se refiere a qué tan sensible es un modelo a los datos de entrenamiento. La varianza (o sensibilidad) alta significa que el modelo presta demasiada atención a los detalles y pasa por alto los patrones fundamentales del conjunto de datos.

En el aprendizaje supervisado, cuando la varianza es muy alta y el sesgo es muy bajo, se habla de sobreajuste. Cuando en cambio el sesgo es alto y la varianza es baja, se da un subajuste. Puede ser difícil llegar al ajuste perfecto, conocido como el equilibrio entre el sesgo y la varianza.

Los parámetros definen los límites, los cuales son fundamentales para comprender la enorme cantidad de datos que deben procesar los algoritmos del deep learning. Esto significa que, generalmente, los sobreajustes y los subajustes se pueden corregir utilizando menos o más parámetros, respectivamente.

Consideración del sesgo relacionado con las personas

Si un modelo de deep learning se entrena con datos estadísticamente sesgados o datos que no brindan una representación precisa de la población, se puede obtener un resultado erróneo. Desafortunadamente, los prejuicios humanos suelen transferirse a la inteligencia artificial, lo cual implica el riesgo de que se creen algoritmos discriminatorios y resultados sesgados.

A medida que las empresas continúan aprovechando la inteligencia artificial para mejorar la productividad y el rendimiento, es fundamental que se implementen estrategias para minimizar el sesgo. El primer paso es la implementación de procesos inclusivos de diseño y una mayor consciencia de la representación de la diversidad en los datos recopilados.

Caja negra

El término "caja negra" hace referencia a los programas de inteligencia artificial que ejecutan una tarea dentro de la red neuronal y no muestran su trabajo. Esto implica que nadie puede explicar con exactitud cómo el modelo generó un resultado determinado, ni siquiera los analistas de datos ni los ingenieros que crearon el algoritmo. La falta de interpretación de los modelos de caja negra puede generar consecuencias dañinas cuando se utilizan para la toma de decisiones que conllevan grandes riesgos, en especial en los sectores de atención de la salud, justicia penal y finanzas. 

Los modelos de deep learning pueden llevar a cabo tareas informáticas más complejas sin intervención humana, pero esto implica que necesitan más potencia de procesamiento, una infraestructura adecuada y conjuntos más grandes de datos para el entrenamiento. El cloud computing permite que los equipos accedan a varios procesadores simultáneamente, como los clústeres de las unidades gráficas de procesamiento (GPU) y de las unidades centrales de procesamiento (CPU), lo cual crea el entorno ideal para que se ejecuten las operaciones matemáticas complejas.

Cuando los equipos de desarrollo diseñan, desarrollan y entrenan los modelos de deep learning en la nube, pueden ajustar y distribuir las cargas de trabajo con velocidad y precisión y, al mismo tiempo, reducir los costos operativos.

 

El deep learning y el machine learning en el extremo de la red

El uso de la nube brinda nuevas opciones para implementar el machine learning en el extremo de la red. Mediante la creación de centros de edge computing conectados a los recursos de la nube pública, se puede obtener y analizar la información de inmediato para intervenir en operaciones que pueden variar desde la actualización del estado de la cadena de suministro hasta la prestación de información sobre los lugares de evacuación en caso de una catástrofe. 

Red Hat® AI permite que tus equipos se beneficien de todas las tecnologías mencionadas (la visión artificial, el reconocimiento de voz y el procesamiento del lenguaje natural) y mucho más.

Nuestra cartera de productos de inteligencia artificial se basa en soluciones que nuestros clientes ya conocen. Gracias a ellas, nuestros productos siguen siendo confiables, flexibles y adaptables.

Red Hat AI permite que las empresas:

  • adopten y generen innovaciones con la inteligencia artificial de forma rápida;
  • eliminen las dificultades que implica ofrecer soluciones de inteligencia artificial;
  • realicen implementaciones en cualquier entorno.

Descubre Red Hat AI 

Conjunto de herramientas para realizar pruebas con el deep learning

Si deseas diseñar algoritmos de machine learning o crear modelos predictivos desde cero, Red Hat OpenShift AI cuenta con una variedad de herramientas para comenzar.

La plataforma ofrece herramientas como interfaces interactivas basadas en JupyterLab, acceso sin inconvenientes a las bibliotecas de inteligencia artificial/machine learning principales y marcos muy populares. Además, contiene un editor visual para crear y automatizar canales de análisis de datos. Cuando se combinan con los canales de CI/CD, los equipos mejoran sus MLOps para aumentar la eficiencia operativa y, así, trasladar más modelos de inteligencia artificial a la fase de producción con mayor rapidez.

Descubre Red Hat OpenShift AI 

Partners de Red Hat AI

Nuestro ecosistema de partners de inteligencia artificial es cada vez más amplio, por lo que varios de ellos trabajan con Red Hat para certificar su funcionamiento con Red Hat AI. De esta manera, puedes explorar diferentes opciones.

Obtén más información sobre nuestros partners

Hub

Blogs de Red Hat

Aquí encuentras la información más reciente sobre nuestros clientes, partners y comunidades open source.

Todas las versiones de prueba de los productos de Red Hat

Con las versiones de prueba gratuitas de nuestros productos, podrás adquirir experiencia práctica, prepararte para obtener una certificación o evaluar las soluciones para saber si son adecuadas para tu empresa.

Más información

¿Qué son los vLLM?

Los vLLM son conjuntos de código open source que ayudan a los modelos de lenguaje a realizar cálculos de manera más eficiente.

¿Qué es la inferencia de la inteligencia artificial?

La inferencia de la inteligencia artificial ocurre cuando un modelo de inteligencia artificial proporciona una respuesta a partir de datos. Es la fase final de un proceso complejo de tecnología de machine learning (aprendizaje automático).

Diferencias entre la inteligencia artificial predictiva y la generativa

La inteligencia generativa y la predictiva presentan diferencias significativas y se aplican a distintos casos prácticos. A medida que la inteligencia artificial evoluciona, establecer una distinción entre estos dos tipos permite conocer mejor sus diferentes funciones.

IA/ML: lecturas recomendadas

Artículos relacionados