El machine learning
El machine learning (aprendizaje automático) es una subcategoría de la inteligencia artificial que utiliza algoritmos para identificar patrones y hacer predicciones dentro de un conjunto de datos, el cual puede incluir números, textos y hasta fotografías.
En las condiciones ideales, el machine learning nos permite interpretar los datos con mayor rapidez y precisión de las que tendríamos sin la ayuda de las máquinas. Los fundamentos matemáticos en los que se basa permiten que los algoritmos aprendan de los datos, hagan predicciones y optimicen los modelos.
El funcionamiento del machine learning
La inteligencia artificial surge cuando las personas crean inteligencia similar a la humana de manera sintética dentro de una máquina. El machine learning implica programar las máquinas para que imiten funciones cognitivas específicas propias de los humanos, como la percepción, el aprendizaje y la resolución de problemas.
La manera de lograr que la máquina piense como una persona es entrenándola para que cree su propio modelo predictivo que le permita analizar los datos y, así, adquiera la capacidad de aprendizaje. Para iniciar el proceso, deberás aportar datos a la computadora y elegir un modelo de aprendizaje para darle instrucciones sobre su procesamiento.
Los modelos de machine learning pueden utilizar los datos para cumplir tres funciones:
- Describir lo sucedido
- Predecir lo que sucederá
- Hacer sugerencias sobre las medidas que se deberían tomar
El modelo de aprendizaje que elijas para entrenar la máquina dependerá de la complejidad de la tarea y del resultado que buscas obtener. Se los suele clasificar según tres métodos de aprendizaje: supervisado, no supervisado y por refuerzo.
Los algoritmos de aprendizaje supervisado se entrenan con conjuntos de datos etiquetados. Este modelo se emplea para tareas como el reconocimiento de imágenes.
Los modelos de aprendizaje no supervisado observan los datos sin etiquetas y encuentran similitudes, patrones y tendencias. Se utilizan para tareas como la segmentación de clientes, los sistemas de recomendación y el análisis de datos generales.
Los modelos de aprendizaje por refuerzo se entrenan mediante un proceso de prueba y error dentro de un sistema de recompensas. Se pueden utilizar, por ejemplo, para entrenar una computadora con el fin de que participe en un juego donde las acciones derivan en la victoria o la derrota.
Una vez que la computadora se familiarice con la forma en la que debe interpretar los datos (gracias al modelo de aprendizaje y los datos de entrenamiento), podrá hacer predicciones y ejecutar tareas cuando reciba información nueva. Poco a poco, sus predicciones serán más precisas a medida que aprenda de los flujos constantes de datos y podrá realizar las tareas de manera más rápida y precisa que las personas.
Recursos de Red Hat
Funcionamiento del entrenamiento y la evaluación de modelos de machine learning
La etapa de entrenamiento de machine learning es aquella en la que el modelo aprende a partir de un conjunto de datos que recibe. Durante esta fase, los desarrolladores intentan ajustar los parámetros y reducir al mínimo los errores en sus resultados.
Para ello, se crea un proceso para transferir los datos al modelo, evaluar sus predicciones y utilizarlas en la mejora de su rendimiento. El proceso suele constar de los siguientes pasos:
- Recopilación y preparación de los datos: una vez que se recopilan, los datos se preparan y dividen en datos de entrenamiento y de prueba. Luego, se eliminan aquellos no deseados y se distribuyen de manera aleatoria para lograr resultados uniformes. Se denomina "reducción de la dimensionalidad" a aquella operación que consiste en disminuir la cantidad de variables de entrada o características de un conjunto de datos sin alterar su información principal.
- Selección del modelo: los ingenieros y los analistas de datos crearon varios algoritmos de machine learning para ejecutar distintas tareas, como el reconocimiento de voz y de imágenes y las predicciones, entre otras.
- Entrenamiento: los datos de entrada preparados se envían a través del modelo para encontrar patrones (reconocimiento) y hacer predicciones.
- Evaluación: después del entrenamiento, se evalúa el resultado obtenido con un conjunto de datos que no se haya utilizado antes.
Perfeccionamiento: los desarrolladores ajustan los parámetros para mejorar aún más el modelo. Para ello, se basan en los resultados de la etapa de evaluación anterior.
Desafíos comunes durante el entrenamiento y la evaluación
Si un modelo obtiene buenos resultados con los datos de entrenamiento, pero no con los de prueba, es posible que se esté sobreajustando, es decir, que aprenda demasiado de las interferencias de los datos de entrenamiento. En cambio, si un modelo no obtiene los resultados esperados con ninguno de los conjuntos de datos, es posible que esté subajustándose, es decir, que no aprenda los patrones fundamentales.
La adaptación de bajo rango (LoRA) y la adaptación de bajo rango cuantificada (QLoRA) son técnicas de perfeccionamiento que aprovechan mejor los recursos y evitan el sobreajuste.
Para evitar el sobreajuste de los datos de entrenamiento, se puede utilizar un conjunto de datos de validación independiente. Después de cada iteración, los resultados del modelo se comparan con los datos de validación
y, luego, se hacen los arreglos correspondientes para evitar el sobreajuste. Aquí se aplica el concepto de reducción de la dimensionalidad: se eliminan los datos extraños que pueden provocar un sobreajuste. Sin embargo, este proceso debe llevarse a cabo minuciosamente para que no se produzca un subajuste.
A fin de corregir este problema, los desarrolladores deben agregar más características informativas para mejorar la capacidad del modelo de detectar relaciones complejas entre los datos.
La filtración de datos se produce cuando la información del conjunto de pruebas se filtra por error en el de entrenamiento, lo cual provoca una ventaja desproporcionada y da lugar a una sobreestimación del rendimiento del modelo.
El perfeccionamiento del modelo, la introducción de funciones nuevas y la obtención de datos más pertinentes reducen al mínimo los errores en las próximas repeticiones.
Implementación de modelos de machine learning
Cuando los modelos de machine learning están listos para implementarse, ejecutan un proceso denominado inferencia. Es la "fase de acción" en la que un modelo de inteligencia artificial aplica lo que aprendió durante el entrenamiento para proporcionar resultados en un entorno de producción.
Un modelo de lenguaje de gran tamaño virtual (vLLM) es un servidor y un motor de inferencia que permite que el proceso sea más eficiente. Utiliza técnicas de gestión de la memoria para aumentar al máximo la velocidad de procesamiento (rendimiento), de modo que los usuarios puedan obtener resultados rápidos y confiables de sus modelos de machine learning.
Uso del deep learning y las redes neuronales artificiales en el machine learning
Las redes neuronales son un tipo de algoritmo que se emplea en el machine learning y son especialmente adecuadas para las tareas que implican relaciones complejas y no lineales entre los datos. Por su parte, el deep learning (aprendizaje profundo) es un subconjunto del machine learning que utiliza redes neuronales con varias capas. Estas redes neuronales profundas están estructuradas para poder aprender a representar los datos de manera jerárquica. Por ello, el deep learning es muy eficaz cuando se trata de tareas como el reconocimiento de imágenes y de voz y el procesamiento del lenguaje natural.
Uso del machine learning
El machine learning y la inteligencia artificial se pueden utilizar para mejorar la experiencia de los usuarios, anticipar el comportamiento de los clientes, supervisar los sistemas de detección de fraudes e incluso ayudar a los proveedores de atención médica a detectar afecciones que ponen en riesgo la vida. Muchos de nosotros interactuamos con el machine learning y disfrutamos de sus beneficios todos los días. Entre los usos más comunes se encuentran:
- los algoritmos de recomendación en las plataformas de transmisión de video;
- Las líneas de ayuda automática y los chatbots
- Anuncios personalizados
- Los presupuestos automatizados de las instituciones financieras
El deep learning es la técnica de machine learning que posibilita la inteligencia artificial generativa y se utiliza para analizar e interpretar grandes cantidades de datos. Los modelos de lenguaje de gran tamaño (LLM) son un subconjunto de la inteligencia artificial generativa y constituyen una aplicación fundamental del machine learning, ya que demuestran la capacidad de comprender y generar lenguaje humano a una escala sin precedentes.
Hoy en día, el machine learning es una función esperada en muchas empresas, y hay cada vez más casos prácticos transformadores de inteligencia artificial/machine learning en los sectores de la salud, los servicios financieros, la telecomunicación y el gobierno, entre otros.
Aspectos éticos y de privacidad relacionados con el machine learning
Dado que los modelos de machine learning aprenden de los datos históricos, pueden detectar los sesgos y las formas de discriminación implícitos en los datos que influyen en la toma de decisiones de las personas. Por ejemplo, los datos pueden reflejar sesgos de índole étnica, socioeconómica o de género que existen en la sociedad. Si estos sesgos no se eliminan de los datos de entrenamiento, el modelo puede perpetuarlos y ampliarlos.
Del mismo modo, en manos de estos modelos, la toma de decisiones como la aprobación de préstamos, la contratación o la imposición de penas, podría afectar de forma desmedida a los grupos más desfavorecidos. Para garantizar la igualdad de resultados entre los distintos grupos, es preciso establecer marcos de equidad.
Los modelos de machine learning pueden considerarse como "cajas negras" porque sus procesos internos no son visibles ni comprensibles. Es posible que se genere desconfianza si la falta de transparencia no permite entender el proceso de toma de decisiones del modelo.
Si este sistema toma una decisión errónea (por ejemplo, si se basa en sesgos o discriminación), resulta difícil determinar la responsabilidad, es decir, definir si compete al desarrollador, a la empresa que lo utiliza o al sistema en sí.
Debido a que el machine learning utiliza grandes cantidades de datos para entrenar modelos eficaces, las empresas tienden a recopilar y almacenar un gran volumen de información personal, lo cual genera preocupación por la privacidad y la posibilidad de un uso indebido.
Asimismo, el almacenamiento de grandes conjuntos de datos de carácter personal aumenta el riesgo de que se produzcan filtraciones cuyos efectos se traduzcan en robos de identidad, fraudes financieros o daños a la reputación de las personas.
Red Hat puede ayudarte
Red Hat ofrece una base común para que tus equipos diseñen e implementen las aplicaciones de inteligencia artificial y los modelos de machine learning de forma transparente y regulada.
Red Hat® OpenShift® AI es una plataforma que entrena los modelos de inteligencia artificial con tus propios datos, los distribuye y aplica en ellos las técnicas de ajuste de peticiones y perfeccionamiento para tus casos prácticos específicos.
Si debes realizar implementaciones de inteligencia artificial de gran tamaño, Red Hat OpenShift ofrece una plataforma de aplicaciones adaptable que es adecuada para las cargas de trabajo de inteligencia artificial y brinda acceso a los aceleradores de hardware conocidos.
Red Hat también aplicó la tecnología del machine learning para diseñar servicios nuevos, como Red Hat® Ansible® Lightspeed with IBM watsonx Code Assistant y Red Hat OpenShift Lightspeed, que ofrecen orientación para que los especialistas de la TI trabajen de forma más eficiente.
Además, las integraciones de los partners de Red Hat abren paso a un ecosistema de herramientas confiables de IA diseñadas para funcionar en las plataformas open source.
Introducción a la inteligencia artificial para las empresas: Guía para principiantes
Acelera tu proceso de adopción de la inteligencia artificial con Red Hat OpenShift AI y Red Hat Enterprise Linux AI. Obtén más información al respecto en esta guía para principiantes.