什么是生成式 AI？

Published 2026 年 2 月 5 日•12 分钟阅读

生成式 AI 是一种依赖深度学习模型来创建新内容的人工智能技术。

生成式 AI 应用可以生成文字、图片和代码等。AI 推理是 AI 的运行阶段，在这一阶段，模型能够将其在训练过程中所学到的内容应用于现实场景中。生成式 AI 的常见用例包括聊天机器人、图像创建和编辑、软件代码辅助和科学研究等。

人们在许多专业领域都开始应用了生成式 AI，以快速地可视化呈现创意，高效地处理枯燥而耗时的任务。在医学研究和产品设计等领域，生成式 AI 可以帮助专业人员更好、更快地完成工作。然而，生成式 AI 也会带来新的风险，用户应该了解并努力减轻这些风险。

探索红帽 AI

AI 推理入门

如果您体验过与 ChatGPT 进行条理清晰的对话，或者观看过 Midjourney 根据您的描述渲染出的逼真画面，就会知道生成式 AI 能够给人魔法一般的感觉。是什么造就了这样的魔法？

在您使用的 AI 应用幕后，深度学习模型正在不断重新创造它们从大量训练数据中学会的模式。然后，它们在由人类设定的范围参数中工作，根据学到的知识创造新的内容。

深度学习模型通常不会存储训练数据的副本，而是会将数据进行编码，使类似的数据点被安排在彼此附近。之后，再对这种表示进行解码，以构建具有类似特征的新原始数据。

构建定制的生成式 AI 应用需要一个模型和一些调整，如由人类监督的微调或一层特定于用例的数据。

如今，大多数流行的生成式 AI 应用都能响应用户提示。只要用自然语言描述您想要什么，应用就能返回您想要的任何内容，就像用魔法变出来一样。

了解 AI 技术如何在企业中发挥作用

生成式 AI 在文字和图像方面的突破性进展不仅霸占了新闻头条，也超越了人们的想象。这项技术日新月异，它的一些早期用例包括：

写作：早在 ChatGPT 成为头条新闻（并且开始自己写新闻稿）之前，生成式 AI 系统就已在模仿人类写作上表现优异。语言翻译工具就是生成式 AI 模型的首批用例之一。当前的生成式 AI 工具能够通过响应用户提示来创建几乎任何主题的高质量内容。这些工具还可根据不同的长度和文风要求，调整自己撰写的内容。

生成图像：生成式 AI 图像工具可以根据无数主题和风格的用户提示来合成高质量的图片。一些 AI 工具，如 Adobe Photoshop 中的 Generative Fill，可以为现有作品增添新的元素。

生成语音和音乐：AI 智能声乐工具可以使用书面文本和人声样本音频，创建模仿真人声音的叙述或歌声。还有些工具可以根据用户提示或样本创建人工智能音乐。

生成视频：一些新的服务正在尝试用各种生成式 AI 技术来创建运动影像。例如，有些技术能够将音频与静态图像匹配，让主角的嘴巴和面部表情看起来就像在讲话一样。

生成和补全代码：一些生成式 AI 工具可以接受书面用户提示，应要求输出计算机代码来协助软件开发人员。

增强数据：当使用真实数据不可行或不可取时，生成式 AI 可以创建大量合成数据。例如，如果要训练一个模型来理解医疗卫生数据，但不能包含任何个人身份信息，那么合成数据或许很有用处。它也可以用来将较小或不全的数据集扩展为较大的合成数据集，然后用于训练或测试。

代理式 AI：代理式 AI 和生成式 AI协同工作。代理式 AI 系统可以使用生成式 AI 与用户展开对话、自主创作内容以助力实现更大目标，或是与外部工具进行通信。换言之，生成式 AI 是代理式 AI“认知过程”中至关重要的一环。

探索生成式 AI 用例

深度学习是一种用于分析和解释大量数据的机器学习技术，它使生成式 AI 成为可能。这一过程也称为深度神经学习或深度神经网络，可让计算机模仿人类获取知识的方式，学会通过观察来学习。在应用计算机来解决理解人类语言或自然语言处理（NLP）的问题上，深度学习是一个至关重要的概念。

为了便于理解，我们可以将深度学习想象为某种流程图，它从输入层开始，到输出层结束。夹在这两层之间的是“隐藏层”，负责加工处理不同级别的信息，并随着不断接收新数据而调整和适应它们的行为。深层学习模型可以拥有数百个隐藏层，每个隐藏层都在数据集内发现关系和模式方面发挥作用。

输入层由多个节点组成，从输入层开始，数据被引入模型并根据分类规则进行分类，然后向下一层传递。数据在每一层中的路径是基于为每个节点设置的计算规则确定的。数据通过每一层向前传递，模型会从数据中提取出观察结果或有意义的信息，并形成最终的输出或数据分析结果。

有一项技术加速了深度学习的发展，那就是 GPU（图形处理单元）。GPU 最初是为了加速视频游戏图形的渲染而设计的。但作为一种高效的并行计算执行方式，GPU 已被证明非常适合深度学习工作负载。

深度学习模型在规模和速度上有所突破，正因如此，生成式 AI 应用当前如雨后春笋般涌现。

神经网络是一种信息处理方式，可以模仿生物神经系统，如人类大脑中的连接。AI 便是如此在看似不相关的信息集之间建立联系。神经网络概念与深度学习密切相关。

深度学习模型如何使用神经网络概念来连接数据点？我们从人类大脑的工作方式说起。人类大脑中有很多相互连接的神经元，当大脑处理传入的数据时，这些神经元就会负责传递信息。神经元之间通过电信号和化学物质相互作用，并在大脑的不同区域之间传递信息。

人工神经网络（ANN）使用的是人工神经元而不是生物神经元，这些人工神经元是由称为节点的软件模块构成的。这些节点使用数值计算（而不是大脑中的化学信号）来进行通信和传递信息。模拟神经网络（SNN）通过聚类数据点进行预测的方式来处理数据。

不同的神经网络技术适用于不同类型的数据。递归神经网络（RNN）是一种使用顺序数据的模型，例如通过按顺序学习词语来处理语言。

基于 RNN 的思想，Transformer 是一种特定的神经网络架构，能够更快地处理语言。Transformer 能够学习句子中不同词语的关系，与按顺序摄取各个词语的 RNN 相比，这个过程的效率更高。

大语言模型（LLM）是一种通过将 Transformer 应用于大量广义数据集来进行训练的深度学习模型。LLM 可为许多流行的 AI 聊天和文本工具提供支持。

另外，一种称为扩散模型的深度学习技术已证明非常适合图像生成。扩散模型能够学习将自然图像转化为模糊视觉噪声的过程。然后，图像生成工具将这个过程颠倒过来，从随机噪声模式开始，对其进行细调，直到它变得如同真实照片一般。

深度学习模型可以用参数来描述。如果有一个简单的信用评估模型，该模型使用了来自贷款申请表格的 10 个输入特征进行训练，那么这个模型将有 10 个参数。相比之下，一个 LLM 可具有数十亿个参数。OpenAI 的 Generative Pre-trained Transformer 4（GPT-4）是为 ChatGPT 提供支持的基础模型之一，据说它具有 1 万亿个参数。

基础模型是基于大量普通数据训练的深度学习模型。经过训练后，基础模型就可以针对专门的用例进行细调。顾名思义，这种模型可为许多不同的应用奠定基础。

现如今，创建新的基础模型是一个工程量巨大的项目。这个过程需要不计其数的训练数据，通常要从互联网、数字图书馆、学术文章数据库、库存图像集或其他大型数据集进行广泛的收集。基于如此多数据训练一个模型需要庞大的基础架构，包括组建或租赁 GPU 云。据报道，迄今最大的基础模型的构建成本达到了数亿美元。

由于从零开始训练基础模型需要付出大量时间和精力，因此人们通常依赖第三方训练的模型，在此基础上进行自定义。有多种技术可用来对基础模型进行自定义。其中可能包括微调、Prompt-Tuning 和添加特定于客户或领域的数据。例如，IBM 的 Granite 系列基础模型根据精选数据进行训练，并可让用户清楚了解用于训练的数据。

微调是指利用更具针对性的数据集对经过预先训练的模型进一步训练的过程，这样可以使模型能够有效执行特定任务。这些额外的训练数据会修改模型的参数，并创建一个新版本来替换原始模型。

微调所需的数据和时间通常远少于初始训练。然而，传统微调过程仍然需要大量计算资源。

参数高效微调（PEFT）是一组仅调整 LLM 中部分参数的技术，可节省资源。可以将它视为传统微调技术的演进。

LoRA（低秩自适应）和 QLoRA（量化低秩自适应）都是可用于训练 AI 模型的 PEFT 技术。LoRA and QLoRA 均有助于更高效地对 LLM 进行微调，但在操作模型和利用存储来达到预期结果方面有所不同。

LoRA 与 QLoRA 对比说明

检索增强生成（RAG）是一种通过将 LLM 链接到外部资源，从生成式 AI 应用中获得更好答案的方法。

将 RAG 架构实施到基于 LLM 的问答系统（如聊天机器人）中，可以在 LLM 和您选择的其他知识源之间提供沟通渠道。这使得 LLM 能够交叉引用和补充其内部知识，为进行查询的用户提供更可靠和准确的输出结果。

了解有关 RAG 的更多信息

随着生成式 AI 模型变得越来越复杂，它们的规模也在不断扩大。一些 LLM 可能包含数千亿个参数。这些参数决定了 LLM 对语言的理解能力，模型拥有的参数越多，它能够执行的任务就越复杂，准确率也就越高。但是，参数越多，需要的处理能力也越高。

与其增加更多昂贵的 GPU，不如使用 vLLM 和 llm-d 这类技术，在现有硬件上提升处理效率。

vLLM 是一种推理服务器，可通过更好地利用 GPU 内存来加快生成式 AI 应用的输出速度。
llm-d 是一款 Kubernetes 原生的开源框架，可加速大规模分布式推理。二者均专注于性能优化，旨在解决大型生成式 AI 模型的服务部署难题。

生成式 AI 技术在短时间内取得了长足进步，吸引了格外多的热议，褒奖和质疑各执一词。这项技术的优缺点仍在逐渐浮出水面。这里简要介绍一下生成式 AI 的一些突出问题。

造成危害：生成式 AI 工具被不法分子利用的风险显而易见，例如社交媒体上的虚假信息舆论战，或以真人为目标深度伪造的图像。

加剧有害的社会偏见：生成式 AI 工具已被证明可以重现训练数据中存在的人类偏见，包括有害的歧视或仇恨言论。

提供错误信息：生成式 AI 工具可以产生虚构的、明显错误的信息和场景，有人把这称为“幻觉”。有些错误的生成内容是无害的，比如对聊天提问的无意义回答，或者一张手指过多的人手图像。但也有一些 AI 造成严重问题的情况，比如聊天机器人向饮食失调的人提供有害的建议。

安全和法律风险：生成式 AI 系统可能会引发安全风险，包括用户将敏感信息输入到不安全的应用中。生成式 AI 的响应可能会复制受版权保护的内容，或未经同意盗用真人的声音或身份，从而引发法律风险。此外，一些生成式 AI 工具可能具有使用限制。

输出结果不可解释：有时，AI 模型过于复杂，人类无法理解或解释其决策过程，这被称为“黑箱”模型。“黑箱”模型用于高风险决策时可能会产生严重后果，尤其是在医疗卫生、交通、安全、军事、法律、航空航天、刑事司法或金融等高风险行业。为解决这一问题，可将可解释 AI（XAI）技术应用于机器学习的整个生命周期，使输出结果对人类更加透明、易懂。

进一步了解可解释的 AI

红帽 AI 是一个包含各种产品与服务的平台，能够在您企业 AI 旅程的任何阶段提供帮助，无论您是刚刚起步，还是准备进行扩展。针对您企业独特的用例，它既能支持生成式 AI，也能支持预测性 AI 相关工作。

借助红帽 AI，您就可以访问红帽® AI 推理服务器，在混合云上优化模型推理，从而实现更快、更具成本效益的部署。推理服务器由 vLLM 提供支持，可最大限度提高 GPU 利用率，加快响应速度。

了解有关红帽 AI 推理服务器的更多信息

红帽 AI 推理服务器还包含红帽 AI 存储库，这是一个经过第三方验证和优化的模型集合，既能保证模型选择的灵活性，又能促进跨团队的一致性。通过接入第三方模型存储库，企业能够显著缩短推向市场所需的时间，并降低 AI 成功落地的成本门槛。

了解有关经红帽 AI 验证的模型的更多信息

扩展阅读

什么是混合专家模型（MoE）？

混合专家模型（MoE）是一种模型架构技术，通过将任务路由至模型中最适配的模块，来提升 AI 推理速度。

什么是 AgentOps？

AgentOps（代理运维）是一套工具框架，用于实时监控 AI 在制定决策时的“大脑”运行情况。

什么是主权 AI？

主权 AI 的核心在于自主掌控 AI 技术，将数据保留在本地，并让系统符合自身独特价值观和法律要求。

什么是生成式 AI？

红帽资源

红帽官方博客

自适应企业：AI 就绪，从容应对颠覆性挑战

扩展阅读

什么是混合专家模型（MoE）？

什么是 AgentOps？

什么是主权 AI？

AI/ML 相关资源

平台

工具

试用购买与出售

联系我们

关于红帽

切换页面语言

Red Hat legal and privacy links

Red Hat legal and privacy links