Wrayの知识库 Wrayの知识库
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
首页
  • Java 基础
  • Java 集合
  • Java 并发
  • Java IO
  • JVM
  • Spring Framework
  • Spring Boot
  • Spring Cloud
  • Spring Security
  • MySQL
  • Redis
  • 计算机基础
  • 操作系统原理
  • Linux
  • MacOS
  • Windows
  • 系统工程与研究专题
  • AI 基础
  • 大模型基础
  • Prompt 工程
  • RAG 检索增强生成
  • Agent 智能体
  • AI 应用开发
  • AI 工程化
  • AI 安全与治理
  • AI 面试与设计题
  • 纸质书
  • 电子书
  • 学习课程
疑难杂症
GitHub (opens new window)
  • AI概述
  • AI基础

    • AI基础概述
    • AI机器学习深度学习与大模型
      • 1. 它们是什么关系
      • 2. 机器学习解决什么问题
      • 3. 深度学习带来的变化
      • 4. 大模型为什么不同
      • 5. 工程视角的理解
      • 6. 常见误区
      • 7. Tips 快问快答
    • 机器学习三大学习范式
    • 训练验证测试与评估
    • 数据集特征标签与泛化
    • 模型推理与部署基础
  • 大模型基础

  • Prompt工程

  • RAG检索增强生成

  • Agent智能体

  • AI应用开发

  • AI工程化

  • AI安全与治理

  • AI面试与设计题

目录

AI机器学习深度学习与大模型

AI、机器学习、深度学习和大模型经常被混用,但它们的边界不同。理解这几个概念的关系,是学习 AI 的第一步。

# 1. 它们是什么关系

人工智能 AI
└─ 机器学习 Machine Learning
   └─ 深度学习 Deep Learning
      └─ 大模型 Foundation Model / Large Model
概念 关注点 典型能力
AI 让机器表现出智能行为 推理、识别、规划、生成
机器学习 从数据中学习规律 分类、回归、排序、推荐
深度学习 用多层神经网络学习复杂表示 图像识别、语音识别、自然语言处理
大模型 用大规模数据和参数学习通用能力 对话、写作、编程、检索增强、工具调用

# 2. 机器学习解决什么问题

传统程序通常由人写规则:

输入数据 + 人写规则 -> 输出结果

机器学习则让模型从样本中学习规则:

输入数据 + 正确答案 -> 训练模型
新输入 + 模型 -> 预测结果

适合机器学习的问题通常具备三个特点:

  • 数据中存在可学习的模式。
  • 很难手写完整规则。
  • 可以用指标评估输出好坏。

# 3. 深度学习带来的变化

传统机器学习依赖人工设计特征,例如从用户行为中提取点击次数、购买间隔、价格区间等。深度学习可以从原始数据中自动学习多层表示。

原始输入
  -> 底层特征
  -> 中层模式
  -> 高层语义
  -> 输出结果

这使得图像、语音、文本、代码等复杂数据更容易被模型处理。

# 4. 大模型为什么不同

大模型不是只针对一个任务训练,而是在大规模数据上学习通用表示和生成能力,再通过指令微调、对齐、工具调用和 RAG 等方式适配具体任务。

对比项 传统机器学习模型 大模型
任务范围 通常面向单一任务 可覆盖多种任务
输入形式 多为结构化特征 文本、代码、图片、音频等
使用方式 调接口得到预测值 对话、生成、推理、调用工具
迭代重点 特征、算法、指标 Prompt、上下文、数据、评估、工程治理
风险 过拟合、偏差、数据漂移 幻觉、注入、越权、成本、不可控输出

# 5. 工程视角的理解

对业务开发者来说,可以把 AI 能力理解成一类特殊的服务:

业务输入
  -> 数据处理
  -> 模型调用
  -> 结果解析
  -> 规则校验
  -> 业务动作

它和普通服务最大的差异是输出具有概率性,所以必须补充评估、校验、兜底和审计。

# 6. 常见误区

误区 正确认知
AI 等于大模型 大模型只是当前最重要的一类 AI 技术
模型越大越好 要结合任务、成本、延迟和数据安全选择
Prompt 能解决一切 Prompt 只是入口,工程链路同样关键
AI 输出就是事实 模型输出需要引用、校验和业务规则兜底

# 7. Tips 快问快答

Q:不懂算法能不能做 AI 应用?

A:可以。AI 应用开发更重视任务拆解、模型调用、数据接入、评估和工程治理。但基础概念必须懂,否则容易把模型当成万能接口。

Q:什么时候用传统机器学习,什么时候用大模型?

A:结构化预测、风控评分、推荐排序等任务仍然适合传统机器学习;自然语言理解、生成、知识问答和复杂交互更适合大模型。

Q:大模型会替代所有机器学习模型吗?

A:不会。大模型适合通用理解和生成,但在低延迟、低成本、强确定性的结构化任务中,传统模型仍然很有价值。

上次更新: 2026/06/25, 17:53:09
AI基础概述
机器学习三大学习范式

← AI基础概述 机器学习三大学习范式→

Copyright © 2023-2026 Wray | 鄂ICP备2024050235号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式