什么是机器学习?

复制 URL

机器学习(ML)是人工智能(AI)的一个子类,是指利用算法识别一组数据中的规律并做出预测。这些数据可以包含数字、文本,甚至是照片。在理想条件下,机器学习可让人类以自身未曾企及的速度和准确度解读数据。机器学习建立在数学基础之上,这些基础使算法能够从数据中学习、做出预测并优化模型。

探索红帽 AI

人工智能是指人类对机器赋予一种类人的智能。而机器学习意味着人们通过对机器进行编程,使其模仿人类天生具备的特定认知能力,例如感知、学习和解决问题。

如何让机器像人类一样思考?那就是对机器进行训练,使其创造自己的预测模型。这种预测模型可作为机器分析数据的手段,并最终成为“具备学习能力的”机器。要开始这一过程,需要向计算机提供数据并选择学习模型,以指导机器如何处理这些数据。

在企业组织中引入机器学习实践

机器学习模型最终可以使用数据来实现三种功能:

  • 描述发生了什么
  • 预测将会发生什么
  • 建议接下来怎么做

根据任务的复杂度和期望的结果,要选择不同的学习模型来训练机器。机器学习通常划分为三种学习方法:监督机器学习、无监督机器学习和强化机器学习。

监督学习算法是利用加标签的数据集来进行训练。这种模型一般用于图像识别等任务。

无监督学习模型是通过浏览未加标签的数据,查找其中的共性、规律和趋势。这种模型通常用于客户细分、推荐系统和一般数据探索等任务。

强化学习模型是通过在既定回报系统中使用试错流程来进行训练。这种学习可用于训练计算机完成诸如玩游戏等通过操作得出胜败结果的任务。

一旦计算机利用学习模型和训练数据,熟悉了您希望其解读数据的方式后,就能在出现新数据时做出预测并执行任务。随着计算机不断从持续的数据流中学习,其预测准确度会逐渐提高,并且能够以比人类更短的时间和更高的准确度完成任务。

为 AI/ML 工作负载构建混合云平台

红帽资源

机器学习的训练阶段是指模型从一组给定的数据中进行学习的过程。在这一阶段,开发人员的目标是调整模型参数,尽可能减少输出误差。训练 AI 模型有助于提高 AI 推理的准确性和速度。

具体做法是建立一个管道,通过模型传递数据,评估其预测结果,并利用预测结果改进模型。该管道通常包含以下步骤:

  1. 收集和准备数据:收集数据,然后将其划分为训练数据和测试数据,去除不需要的数据,并进行随机化处理以确保数据的均匀分布。该步骤还可能涉及“降维”操作,即在保留数据集基本信息的同时,减少其中输入变量或特征的数量。
  2. 选择模型:数据科学家和工程师已针对语音识别、图像识别、预测等不同任务,开发出各种机器学习算法。
  3. 训练:将准备好的输入数据发送给模型,以发现规律(规律识别)并进行预测。
  4. 评估:训练完成后,使用之前未使用的数据集对模型的输出进行评估。

调优:随后,开发人员会根据上一评估步骤的结果,对参数进行调优,以进一步优化模型。

训练与评估过程中面临的常见挑战

如果一个模型在训练数据上表现出色,但在测试数据上表现欠佳,那么它可能出现了过拟合现象,即从训练数据中的干扰信息里学习了过多内容。而如果一个模型在两组数据上都表现不佳,则可能是欠拟合,即模型未能学习到潜在的规律。

LoRA 和 QLoRA 是高效节能的微调技术,可以帮助用户避免过拟合。

为了防止模型对训练数据过拟合,可以使用一个独立的验证数据集。每次迭代后,依据验证数据对模型输出进行评估,然后做出调整以避免过拟合。这就是降维技术的应用:去除可能导致过拟合的无关数据。不过,降维操作必须谨慎进行,以免导致欠拟合。

为了纠正欠拟合问题,开发人员必须添加更多信息丰富的特征,以提高模型捕捉数据中复杂关系的能力。

当测试集中的信息意外泄露到训练集中时,会发生数据泄露,这会带来不公平的优势,并导致性能被高估。

通过调优、添加新特征以及采用更相关的数据,能够在后续迭代中尽量减少误差。 

神经网络是机器学习中使用的一类算法,尤其擅长处理涉及数据中复杂非线性关系的任务。深度学习是机器学习的一个子领域,其核心在于使用具有多层结构的神经网络。这些深度神经网络通过精妙设计的层级架构,能够逐步学习数据中的层级化表征。这使得深度学习在图像识别、自然语言处理和语音识别等任务中展现出卓越性能。

机器学习和人工智能可用于提升用户体验、预测客户行为、监控欺诈检测系统,甚至还能帮助医疗卫生提供方检测危及生命的疾病。在日常生活中,我们许多人都会用到机器学习。一些常见的机器学习用途包括:

  • 流媒体平台上的算法推荐内容。
  • 智能客服和聊天机器人。
  • 定向投放广告。
  • 金融机构自动化报价。

预测性 AI 与生成式 AI 对比

如今为许多 AI 工具提供支持的生成式 AI 是通过深度学习实现的,深度学习是一种用于分析和解读大量数据的机器学习技术。大语言模型(LLM)是生成式 AI 的子集,具备以空前的规模理解和生成人类语言的能力,代表机器学习的关键应用。

机器学习现已逐渐成为许多公司竞相使用的功能,医疗卫生金融服务电信政府和其他行业纷纷都涌现出变革性的 AI/ML 用例。

探索 AI/ML 用例

由于机器学习模型是从历史数据中学习,它们可能会学习到数据中隐含的人类决策偏见和歧视。例如,数据可能反映社会中既有的种族、性别或社会经济偏见。如果训练数据没有经过去偏处理,模型可能会延续并放大这些偏见。

同样,机器学习模型所做的决策,如贷款审批、人员招聘或司法量刑,可能会对边缘化群体产生不公平影响。为确保不同群体都能得到公平的结果,现已建立公平性框架。

机器学习模型常被视为“黑匣子”,因为其内部运行过程既不可见,也难以理解。缺乏透明度也导致人们难以理解模型如何做出决策,这就可能会引发信任问题。

当机器学习系统做出错误决策时,比如基于偏见或歧视的决策,责任的归属往往难以确定。机器学习模型的决策究竟该由开发人员、使用该系统的企业组织还是系统本身来负责?

由于机器学习需要大量数据来训练有效的模型,促使企业组织收集和存储大量的个人数据,这引发了人们对隐私和潜在滥用的担忧。

此外,存储包含个人信息的大型数据集,会增加数据泄露的风险,而这些泄露可能会导致个人遭遇身份盗窃、金融诈骗或声誉受损等问题。

红帽能为您的团队提供通用基础,以透明且可控的方式构建和部署 AI 应用以及机器学习(ML)模型。

红帽® OpenShift® AI平台则可以针对您的独特用例,使用您自己的数据来训练、即时调整、微调和提供 AI 模型。

对于大型 AI 部署,红帽 OpenShift 可提供一个适合 AI 工作负载的可扩展应用平台,还能让用户利用主流硬件加速器来优化和加速 AI 应用的运行。

红帽还运用机器学习技术开发了新的服务,包括搭载 IBM watsonx Code Assistant 的红帽® Ansible® Lightspeed红帽 OpenShift Lightspeed,这些服务能为 IT 专业人员提供指导,帮助他们更高效地工作。

此外,红帽的合作伙伴集成有利于形成由众多可信 AI 工具构成的生态系统,与开源平台搭配使用。

进一步了解 OpenShift AI

中心

红帽官方博客

获取有关我们的客户、合作伙伴和社区生态系统的最新信息。

所有红帽产品试用

我们的免费试用可让您亲身体验红帽的产品功能,为获得认证做好准备,或评估某个产品是否适合您的企业。

扩展阅读

什么是参数高效微调(PEFT)?

PEFT 是一组仅调整 LLM 中部分参数的技术,可节省资源。

LoRA 与QLoRA:有何区别

LoRA(低秩自适应)和 QLoRA(量化低秩自适应)技术都可用于训练 AI 模型。

什么是 vLLM?

虚拟大型语言模型(vLLM)是一系列开源代码的集合,可帮助语言模型更高效地执行计算。

AI/ML 相关资源