¿Qué es el machine learning?
El machine learning (aprendizaje automático) es una subcategoría de la inteligencia artificial que utiliza algoritmos para identificar patrones y hacer predicciones dentro de un conjunto de datos, el cual puede incluir números, textos y hasta fotografías. En las condiciones ideales, el machine learning nos permite interpretar los datos con mayor rapidez y precisión de las que tendríamos sin la ayuda de las máquinas. Se basa en fundamentos matemáticos que permiten que los algoritmos aprendan a partir de los datos, hagan predicciones y optimicen los modelos.
Funcionamiento del machine learning
La inteligencia artificial se desarrolla cuando las personas crean inteligencia similar a la humana de manera sintética dentro de una máquina. El machine learning implica programar las máquinas para que imiten funciones cognitivas específicas propias de las personas, como la percepción, el aprendizaje y la resolución de problemas.
La manera de lograr que la máquina piense como una persona es entrenarla para que cree su propio modelo predictivo que le permita analizar los datos y, así, adquiera la capacidad de aprendizaje. Para iniciar el proceso, deberás aportar datos a la computadora y elegir un modelo de aprendizaje para darle instrucciones sobre su procesamiento.
Incorpora las prácticas de machine learning a tu empresa
Los modelos de machine learning pueden utilizar los datos para cumplir tres funciones:
- describir lo sucedido;
- predecir lo que sucederá;
- recomendar las medidas que se deberían tomar.
El modelo de aprendizaje que elijas para entrenar la máquina dependerá de la complejidad de la tarea y del resultado que buscas obtener. El machine learning suele clasificarse en tres métodos de aprendizaje: supervisado, no supervisado y por refuerzo.
Los algoritmos del aprendizaje supervisado se entrenan con conjuntos de datos etiquetados. Se emplean para tareas como el reconocimiento de imágenes.
Los modelos de aprendizaje no supervisado observan los datos sin etiquetas y encuentran similitudes, patrones y tendencias. Se utilizan para tareas como la segmentación de clientes, los sistemas de recomendación y el análisis de datos generales.Los modelos de
aprendizaje por refuerzo se entrenan mediante un proceso de prueba y error dentro de un sistema de recompensas establecido. Por ejemplo, se puede utilizar para entrenar una computadora con el fin de que participe en un juego en el que las acciones derivan en la victoria o la derrota.
Una vez que la computadora se familiarice con la forma en la que debe interpretar los datos (gracias al modelo de aprendizaje y los datos de entrenamiento), podrá hacer predicciones y ejecutar tareas cuando reciba datos nuevos. Poco a poco, sus proyecciones serán más precisas a medida que aprenda de los flujos constantes de datos y podrá realizar las tareas de manera más rápida y exacta que las personas.
Recursos de Red Hat
Proceso del entrenamiento y la evaluación de los modelos de machine learning
La etapa de entrenamiento del machine learning es aquella en la que el modelo aprende a partir de un conjunto de datos que recibe. Durante esta etapa, los desarrolladores buscan ajustar los parámetros del modelo y reducir los errores en los resultados. El entrenamiento de los modelos permite mejorar la precisión y la velocidad de las inferencias de inteligencia artificial.
En este sentido, se crea un canal para transferir los datos al modelo, evaluar sus predicciones y utilizarlas a fin de mejorar su rendimiento. El proceso suele consistir en los siguientes pasos:
- Recolección y preparación de los datos: una vez que se recopilan, los datos se preparan y se dividen según si son de entrenamiento o de prueba. Luego, se eliminan aquellos no deseados y se distribuyen de manera aleatoria para lograr resultados uniformes. Se denomina "reducción de la dimensionalidad" a la operación que consiste en disminuir la cantidad de variables de entrada o características de un conjunto de datos sin alterar su información principal.
- Selección de un modelo: los analistas de datos y los ingenieros crearon varios algoritmos de machine learning para distintas tareas, como el reconocimiento de voz y de imágenes, las predicciones y mucho más.
- Entrenamiento: los datos de entrada preparados se envían a través del modelo para encontrar patrones (reconocimiento de patrones) y realizar predicciones.
- Evaluación: después del entrenamiento, se evalúa el resultado del modelo con un conjunto de datos que no se haya utilizado antes.
Perfeccionamiento: los desarrolladores ajustan los parámetros para mejorar aún más el modelo según los resultados obtenidos en el paso de evaluación anterior.
Desafíos comunes del entrenamiento y la evaluación
Si un modelo obtiene buenos resultados con los datos de entrenamiento, pero no con los de prueba, es posible que esté sobreajustado, es decir, que esté aprendiendo demasiado de las interferencias de los datos de entrenamiento. Si obtiene malos resultados con ambos conjuntos, es posible que esté subajustado, lo que ocurre cuando no aprende los patrones fundamentales.
La adaptación de bajo rango (LoRA) y la adaptación de bajo rango cuantificada (QLoRA) son técnicas de perfeccionamiento que aprovechan mejor los recursos y evitan el sobreajuste.
Para garantizar que esto no suceda con los datos de entrenamiento, se pueden utilizar conjuntos de datos de validación independientes. Después de cada repetición del proceso, se evalúa el resultado del modelo con ellos. Luego, se realizan las correcciones necesarias para que no se genere un sobreajuste. En esta instancia, se aplica el concepto de reducción de la dimensionalidad: se eliminan los datos no pertinentes que pueden ocasionar un sobreajuste. Este proceso debe realizarse con cuidado para evitar que se produzca un subajuste.
Para corregir este problema, los desarrolladores deben agregar más características informativas que permitan mejorar la capacidad del modelo de detectar relaciones complejas en los datos.
La filtración de los datos se produce cuando la información del conjunto de pruebas se filtra por error en el de entrenamiento, lo que provoca una ventaja desproporcionada y da lugar a una sobreestimación del rendimiento del modelo.
El perfeccionamiento, la introducción de características nuevas y la obtención de datos más pertinentes pueden disminuir los errores en las próximas repeticiones.
Uso del deep learning y las redes neuronales artificiales en el machine learning
Las redes neuronales son un tipo de algoritmo que se emplea en el machine learning, en especial para las tareas que implican relaciones complejas y no lineales entre los datos. Por su parte, el deep learning (aprendizaje profundo) es un subconjunto del machine learning que utiliza redes neuronales con varias capas. Estas redes profundas están bien estructuradas y pueden aprender a representar los datos de manera jerárquica. Gracias a esto, el deep learning es ideal para las tareas como el reconocimiento de imágenes y de voz y el procesamiento del lenguaje natural.
Uso del machine learning
El machine learning y la inteligencia artificial se pueden utilizar para mejorar la experiencia del usuario, anticipar el comportamiento de los clientes, supervisar los sistemas de detección de fraudes e incluso ayudar a los proveedores de salud a detectar afecciones potencialmente mortales. Muchos de nosotros interactuamos con el machine learning y disfrutamos de sus beneficios todos los días, Estos son algunos de los usos más comunes:
- los algoritmos de recomendación en las plataformas de transmisión de video;
- las líneas de ayuda automática y los chatbots;
- los anuncios personalizados;
- los presupuestos automatizados de las instituciones financieras.
El deep learning es la técnica de machine learning que posibilita la inteligencia artificial generativa, que ahora es la base de muchas herramientas, y se utiliza para analizar e interpretar grandes cantidades de datos. Los modelos de lenguaje de gran tamaño (LLM) son un subconjunto de la inteligencia artificial generativa y representan una aplicación importante del machine learning, ya que demuestran la capacidad de comprender y generar lenguaje humano a una escala sin precedentes.
Hoy en día, el machine learning es una función esperada en muchas empresas, y hay cada vez más casos prácticos transformadores de inteligencia artificial/machine learning en los sectores de la salud, los servicios financieros, las telecomunicaciones y el gobierno, entre otros.
Aspectos éticos y de privacidad relacionados con el machine learning
Al aprender a partir de los datos históricos, los modelos de machine learning pueden detectar sesgos y criterios discriminatorios, los cuales influyen en la toma de decisiones de las personas. Por ejemplo, la información puede reflejar los sesgos de índole étnica, socioeconómica o de género que existen en la sociedad. Si no se eliminan de los datos de entrenamiento, el modelo puede perpetuarlos y reforzarlos.
Asimismo, las decisiones que toman estos modelos, como la aprobación de préstamos, la contratación de personal o la imposición de penas, pueden afectar a los grupos más desfavorecidos de forma desmedida. Para garantizar la igualdad de resultados entre los distintos grupos, es esencial establecer marcos de imparcialidad.
Los modelos de machine learning pueden considerarse como "cajas negras" porque sus procesos internos no son visibles ni comprensibles. Cuando la falta de transparencia impide que las personas comprendan el funcionamiento de un modelo para tomar decisiones, disminuye la confianza.
Si un sistema de machine learning toma una decisión equivocada, como una que se base en un sesgo o un criterio discriminatorio, es difícil determinar la responsabilidad, ya que no se sabe si esta corresponde al desarrollador, a la empresa que utiliza el sistema o al mismo sistema.
Como el machine learning utiliza una enorme cantidad de datos para entrenar modelos eficaces, las empresas tienden a recopilar y almacenar grandes volúmenes de datos personales, lo que genera inquietudes respecto a la privacidad y la posibilidad de usos indebidos.
Por último, el almacenamiento de grandes conjuntos de datos que contienen información personal aumenta el riesgo de filtraciones, lo cual puede derivar en el robo de identidades, fraudes financieros o daños a la reputación de las personas.
Red Hat puede ayudarte
Red Hat ofrece bases comunes para que tus equipos diseñen e implementen aplicaciones de inteligencia artificial y modelos de machine learning con transparencia y control.
Red Hat® OpenShift AI es una plataforma que puede entrenar los modelos de inteligencia artificial con tus propios datos, distribuirlos y aplicar en ellos las técnicas de ajuste de instrucciones y perfeccionamiento para tus casos prácticos específicos.
Para las implementaciones de inteligencia artificial de gran tamaño, Red Hat OpenShift ofrece una plataforma de aplicaciones con capacidad de ajuste que es adecuada para las cargas de trabajo de esta tecnología, con acceso a los aceleradores de hardware conocidos.
Red Hat también aplicó la tecnología del machine learning para diseñar servicios nuevos, como Red Hat® Ansible® Lightspeed with IBM watsonx Code Assistant y Red Hat OpenShift Lightspeed, que ofrecen orientación para que los especialistas de la TI trabajen de forma más eficiente.
Además, las integraciones de los partners de Red Hat abren paso a un ecosistema de herramientas confiables de inteligencia artificial diseñadas para funcionar en las plataformas open source.
El blog oficial de Red Hat
Obtenga la información más reciente sobre nuestro ecosistema de clientes, socios y comunidades.