尝试解释人工智能：人工智能是如何运作和运行的——它是如何训练的？

Konrad Wolfenstein

两年前

尝试解释人工智能：人工智能是如何工作的？它是如何训练的？——图片来源：Xpert.Digital

📊 从数据输入到模型预测：人工智能流程

人工智能（AI）是如何运作的？🤖

人工智能（AI）的运行可以分为几个清晰明确的步骤。每个步骤对于人工智能最终交付的结果都至关重要。该过程始于数据输入，终于模型预测以及任何反馈或后续训练。这些阶段描述了几乎所有人工智能模型都会经历的过程，无论它们是简单的规则集还是高度复杂的神经网络。.

1. 数据输入📊

任何人工智能的基础都是它所使用的数据。这些数据可以以多种形式存在，例如图像、文本、音频文件或视频。人工智能利用这些原始数据来识别模式并做出决策。数据的质量和数量在此起着至关重要的作用，因为它们会显著影响模型的最终性能。.

数据越全面、越准确，人工智能的学习能力就越强。例如，训练用于图像处理的人工智能时，需要大量的图像数据才能正确识别不同的物体。对于语言模型而言，文本数据则有助于人工智能理解和生成人类语音。数据输入是第一步，也是最重要的步骤之一，因为预测的质量取决于底层数据的质量。计算机科学中有一句著名的格言“垃圾进，垃圾出”——糟糕的数据会导致糟糕的结果。.

2. 数据预处理🧹

数据录入后，必须先进行预处理才能输入到实际模型中。这个过程称为数据预处理。其目的是将数据转换成模型能够最佳处理的格式。.

数据归一化是预处理中的一个常见步骤。这意味着将数据调整到统一的值域，以便模型能够以一致的方式处理数据。例如，将图像的所有像素值缩放到 0 到 1 的范围内，而不是 0 到 255 的范围内。.

预处理的另一个重要环节是特征提取。这涉及到从原始数据中提取与模型密切相关的特定特征。在图像处理中，这些特征可以是边缘或特定的颜色模式；而在文本处理中，则可以提取相关的关键词或句子结构。预处理对于提高人工智能的学习效率和精确度至关重要。.

3. 模型🧩

模型是所有人工智能的核心。在这里，数据基于算法和数学计算进行分析和处理。模型可以以多种形式存在。其中最著名的模型之一是神经网络，它基于人脑的工作原理。.

神经网络由多层人工神经元组成，这些神经元负责处理和传递信息。每一层都接收前一层的输出并进行进一步处理。神经网络的学习过程涉及调整神经元之间连接的权重，从而使网络能够做出越来越准确的预测或分类。这种调整是通过训练实现的，在训练过程中，网络会访问大量的示例数据，并迭代地改进其内部参数（权重）。.

除了神经网络之外，人工智能模型中还使用了许多其他算法，包括决策树、随机森林、支持向量机等等。具体使用哪种算法取决于具体任务和可用数据。.

4. 模型预测🔍

模型经过数据训练后，即可进行预测。这一步骤称为模型预测。人工智能接收输入，并根据其目前已学习到的模式，返回输出，即预测结果或决策。.

这种预测可以采取不同的形式。例如，在图像分类模型中，人工智能可以预测图片中显示的是哪个物体；在语言模型中，它可以预测句子中下一个出现的词；在金融预测中，人工智能可以预测股市的走势。.

需要强调的是，预测的准确性很大程度上取决于训练数据的质量和模型架构。使用不充分或存在偏差的数据训练的模型极有可能做出错误的预测。.

5. 反馈和培训（可选）♻️

人工智能工作原理的另一个重要方面是反馈机制。在此机制中，模型会定期接受检查并进一步优化。这个过程既可以在训练期间进行，也可以在模型预测之后进行。.

如果模型做出错误预测，它可以通过反馈学习来识别这些错误，并相应地调整其内部参数。这是通过将模型预测结果与实际结果（例如，与已知正确答案的数据）进行比较来实现的。一种典型的方法是所谓的监督学习，在这种方法中，人工智能从已包含正确答案的示例数据中学习。.

神经网络中常用的反馈方法是反向传播算法。在这种算法中，模型产生的误差会反向传播到网络中的各个节点，从而调整神经网络连接的权重。通过这种方式，模型可以从错误中学习，并不断提高预测的准确性。.

训练的作用🏋️‍♂️

训练人工智能是一个迭代过程。模型接触的数据越多，训练次数越多，其预测就越准确。然而，训练也存在局限性：过度训练的模型可能会出现所谓的“过拟合”问题。这意味着模型对训练数据的记忆过于深刻，以至于在新数据上的表现反而变差。因此，训练模型时，使其具备泛化能力至关重要，也就是说，模型也应该能够对新数据做出良好的预测。.

除了常规训练之外，还有迁移学习等方法。这种方法是将已经在大型数据集上训练好的模型用于新的类似任务。由于模型无需从头开始完全训练，因此可以节省时间和计算资源。.

充分发挥你的优势🚀

人工智能（AI）的运行基于一系列复杂步骤的相互作用。从数据输入和预处理到模型训练、预测和反馈，诸多因素都会影响人工智能的准确性和效率。训练有素的人工智能可以在生活的许多领域带来巨大的优势——从自动化简单的任务到解决复杂的难题。然而，为了充分发挥人工智能的优势，了解其局限性和潜在缺陷同样至关重要。.

🤖📚 简单来说：人工智能是如何训练的？

🤖📊 AI学习过程：捕获、链接和存储

使用单个术语“斯图加特”的简单人工智能神经网络图示例 – 图片来源：Xpert.Digital

🌟 收集和准备数据

人工智能学习过程的第一步是收集和准备数据。这些数据可以来自各种来源，例如数据库、传感器、文本或图像。.

🌟 关系数据（神经网络）

收集到的数据通过神经网络连接起来。每个数据包都由网络中的“神经元”（节点）连接表示。以斯图加特市为例，网络结构可能如下所示：

a) 斯图加特是巴登-符腾堡州的一座城市
。b) 巴登-符腾堡州是德国的一个联邦州
) 斯图加特是德国的一座城市。d
) 2023年斯图加特的人口为633,484。e
) 巴特坎施塔特是斯图加特的一个区。f
) 巴特坎施塔特由罗马人建立
。g) 斯图加特是巴登-符腾堡州的首府。

根据数据量的大小，人工智能模型会生成潜在输出的参数。例如，GPT-3 大约有 1750 亿个参数！

🌟 保存和自定义（学习）

数据被输入到神经网络中。它通过人工智能模型，并经由神经元之间的连接（类似于突触）进行处理。神经元之间的权重（参数）会被调整，以训练模型或执行特定任务。.

与直接访问、索引访问、顺序存储或批量存储等传统存储方法不同，神经网络以一种非常规的方式存储数据。“数据”存储在神经元之间连接的权重和偏置中。.

神经网络中信息的实际“存储”是通过调整神经元之间的连接权重来实现的。人工智能模型通过不断根据输入数据和预设的学习算法调整这些权重和偏差来进行“学习”。这是一个持续的过程，模型可以通过反复调整做出更精确的预测。.

人工智能模型可以被视为一种编程，因为它通过预先设定的算法和数学计算创建而成，并且其参数（权重）的调整会不断改进，以做出更准确的预测。这是一个持续进行的过程。.

偏置项是神经网络中添加到神经元加权输入值中的额外参数。它们允许对参数进行加权（重要、次要等），从而使人工智能更加灵活和准确。.

神经网络不仅可以存储单个事实，还可以通过模式识别来了解数据之间的关系。斯图加特的例子说明了如何将知识输入神经网络，但神经网络并非通过显式知识（如这个简单的例子所示）进行学习，而是通过分析数据模式来进行学习。因此，神经网络不仅可以存储单个事实，还可以学习输入数据之间的权重和关系。.

这个过程以通俗易懂的方式介绍了人工智能，特别是神经网络的工作原理，而无需深入探讨技术细节。它表明，信息在神经网络中的存储方式与传统数据库不同，而是通过调整网络内部的连接（权重）来实现的。.

🤖📚 更详细地说：人工智能是如何训练的？

🏋️‍♂️ 训练人工智能，尤其是机器学习模型，需要经过多个步骤。人工智能训练基于对模型参数的持续优化，通过反馈和调整，直至模型在给定数据上表现最佳。以下是该过程的详细解释：

1. 📊 收集和准备数据

数据是人工智能训练的基础。它通常包含成千上万个样本，系统需要分析这些样本。样本包括图像、文本或时间序列数据。.

必须对数据进行清洗和规范化，以避免不必要的误差来源。通常，数据会被转换成包含相关信息的特征。.

2. 🔍 定义模型

模型是一种描述数据间关系的数学函数。在常用于人工智能的神经网络中，模型由多层相互连接的神经元组成。.

每个神经元执行数学运算来处理输入数据，然后将信号传递给下一个神经元。.

3. 🔄 初始化权重

神经元之间的连接具有初始随机设定的权重。这些权重决定了神经元对信号的反应强度。.

训练的目标是调整这些权重，使模型能够做出更好的预测。.

4. ➡️ 前向传播

在前向传播过程中，模型会对输入数据进行处理，以获得预测结果。.

每一层都处理数据并将其传递给下一层，直到最后一层给出结果。.

5. ⚖️ 计算损失函数

损失函数衡量模型预测结果与实际值（标签）的吻合程度。一种常用的衡量方法是计算预测值与实际值之间的误差。.

损失越大，模型的预测效果就越差。.

6. 🔙反向传播

在逆向迭代中，误差是从模型的输出追溯到前面的层。.

误差被重新分配到连接的权重上，模型会调整权重，使误差变小。.

这是通过梯度下降法实现的：计算梯度向量，该向量指示如何改变权重以最小化误差。.

7. 🔧 更新权重

计算出误差后，根据学习率对连接的权重进行小幅调整进行更新。.

学习率决定了每一步权重变化的幅度。变化幅度过大会导致模型不稳定，而变化幅度过小则会导致学习过程缓慢。.

8. 🔁 重复（周期）

前向传播、误差计算和权重更新的过程会重复进行，通常需要经过几个迭代周期（遍历整个数据集），直到模型达到可接受的准确度。.

随着每个时代的到来，该模型会学习到更多信息，并进一步调整其权重。.

9. 📉 验证和测试

模型训练完成后，会使用经过验证的数据集进行测试，以检验其泛化能力。这确保模型不仅“记住”了训练数据，还能对未知数据做出良好的预测。.

测试数据有助于在实际应用之前衡量模型的最终性能。.

10. 🚀 优化

进一步改进模型的步骤包括超参数调优（例如，调整学习率或网络结构）、正则化（以避免过拟合）或增加数据量。.

📊🔙 人工智能：利用可解释人工智能 (XAI)、热图、代理模型或其他解决方案，使人工智能的黑箱变得可理解、可解释和可解释。

人工智能：利用可解释人工智能 (XAI)、热图、代理模型或其他解决方案，让人工智能的“黑箱”变得易于理解、可解释——图片来源：Xpert.Digital

人工智能（AI）所谓的“黑箱”是一个重大且紧迫的问题。即使是专家也常常面临无法完全理解人工智能系统如何做出决策的挑战。这种缺乏透明度会造成相当大的问题，尤其是在经济、政治和医学等关键领域。依赖人工智能系统进行诊断和治疗的医生必须对系统做出的决策充满信心。然而，如果人工智能的决策过程不够透明，就会产生不确定性，进而可能导致信任危机——而这在事关人命的情况下尤为重要。.

更多信息请点击这里：