AI 术语速查表

本文档收录了人工智能领域最常用的专业术语，每个术语都配有通俗易懂的一句话解释，并附上官方文档或权威资料链接，方便快速查阅。

A

AaaS（智能体即服务）：指将AI智能体封装为可订阅服务的商业模式，用户通过API调用即可获得智能化能力。 more

A/B Testing（A/B测试）：比较两个或多个模型版本以确定哪个表现更好的实验方法。 more

Accuracy（准确率）：正确预测占总预测的比例，评估分类模型最常用的指标之一。 more

Activation Function（激活函数）：神经网络中决定神经元是否被激活的数学函数，常用的有ReLU、Sigmoid、Tanh等。 more

AdaBoost（自适应提升）：一种集成学习方法，通过组合多个弱分类器形成强分类器。 more

Adapter（适配器）：插入预训练模型中用于微调的小型可训练模块，可实现多任务学习。 more

AdapterFusion（适配器融合）：一种多任务学习技术，在不同任务适配器之间传递知识。 more

Adversarial Attack（对抗攻击）：通过精心设计的输入来欺骗AI模型的攻击方式。 more

Adversarial Training（对抗训练）：使用对抗样本来增强模型鲁棒性的训练方法。 more

Agent（智能体）：一种能够自主感知环境、做出决策并执行行动的AI程序，就像一个可以独立完成任务的数字员工。 more

AI Compiler（AI编译器）：将AI模型转换为可在特定硬件上高效运行的代码的工具。 more

AI Inference（AI推理）：使用训练好的模型对新数据进行预测的过程。 more

AI Model Compression（模型压缩）：通过剪枝、量化、蒸馏等技术减小模型体积和计算量的方法。 more

AI Pipeline（AI流水线）：指从数据准备、模型训练、评估到部署的完整自动化流程，就像一条高效的生产线。 more

Algorithm（算法）：解决问题或完成任务的明确步骤和规则集合。 more

Alignment（对齐）：确保AI模型输出符合人类价值观和意图的技术。 more

ALM（阿凡达语言模型）：Anthropic公司开发的大语言模型系列。 more

Anchor Boxes（锚框）：目标检测中预设的参考框，用于检测不同尺度和形状的目标。 more

Anomaly Detection（异常检测）：识别数据中异常或罕见模式的技术。 more

Anti-overfitting（防过拟合）：防止模型过度记忆训练数据而丧失泛化能力的各种技术。 more

API（应用程序接口）：不同软件之间交换数据和功能的桥梁。 more

Argmax（_argmax函数）：返回使函数值最大化的参数值的运算，常用于分类预测。 more

Artificial General Intelligence（通用人工智能）：指具有人类智能水平、能完成任何智能任务的AI系统，被视为AI发展的终极目标。 more

Artificial Intelligence（人工智能）：让计算机模拟、延伸和扩展人类智能的技术科学。 more

Attention Mechanism（注意力机制）：让AI模型在处理信息时学会"抓住重点"的技术，就像人类阅读时会重点关注关键信息。 more

Augmented Reality（增强现实）：将虚拟信息叠加到真实世界画面中的技术。 more

AutoAugment（自动数据增强）：自动搜索最优数据增强策略的技术。 more

Autoencoder（自编码器）：一种无监督学习模型，通过压缩和重构数据来学习有效特征表示。 more

Automated ML（自动化机器学习）：自动完成机器学习模型设计和调参的技术，让非专家也能轻松训练AI模型。 more

Auxiliary Task（辅助任务）：在多任务学习中帮助主任务学习的额外任务。 more

B

Backpropagation（反向传播）：训练神经网络时的核心算法，通过计算梯度来调整模型参数使预测更准确。 more

Bagging（装袋法）：通过并行训练多个模型并集成结果来提高稳定性和准确性的方法。 more

Base Model（基础模型）：在大规模数据上预训练、可以被微调适配各种任务的模型。 more

Batch（批次）：一次训练中同时处理的一组样本。 more

Batch Normalization（批标准化）：一种加速神经网络训练的技术，通过标准化每层输入来稳定训练过程。 more

Bayesian Optimization（贝叶斯优化）：一种高效的超参数调优方法，利用概率模型指导搜索。 more

Benchmark（基准测试）：用于评估模型性能的标准化测试数据集和评估协议。 more

BERT（BERT模型）：谷歌推出的革命性语言理解模型，能够双向理解文本上下文。 more

Bias（偏差/偏置）：AI模型中的系统性误差，可能导致对某些群体的不公平对待。 more

Bidirectional（双向）：能够同时考虑前后文信息进行处理的模型架构。 more

Big Data（大数据）：指规模巨大、类型多样的数据集合，需要特殊技术处理。 more

Binary Classification（二分类）：将数据分为两类的预测任务。 more

BPE（字节对编码）：一种常用的文本分词方法，将词拆分为子词单元。 more

Bucket（桶）：将连续值离散化到多个区间进行处理的技术。 more

C

Calibration（校准）：调整模型输出概率，使其更接近真实概率分布的技术。 more

Causal Inference（因果推断）：分析变量之间因果关系而非仅仅相关性的统计方法。 more

Chain of Thought（思维链）：让AI模型展示推理步骤的技术，可以提高复杂问题的解决能力。 more

Chatbot（聊天机器人）：能够与用户进行对话交互的AI程序。 more

Checkpointer（检查点保存）：在训练过程中定期保存模型状态以便恢复的技术。 more

Chinchilla（Chinchilla模型）：DeepMind开发的高效大语言模型，展示了最优训练计算分配策略。 more

Chunking（分块）：将长文本或长序列分割成较小组块进行处理的技术。 more

Classification（分类）：预测数据属于哪个类别的任务。 more

CLIP（CLIP模型）：OpenAI开发的多模态模型，能理解图像和文本的关系。 more

Clustering（聚类）：将相似数据分组无监督学习方法。 more

CNN（卷积神经网络）：专门用于处理图像的神经网络架构，能够自动提取图像特征。 more

Code Generation（代码生成）：AI模型根据描述自动编写程序代码的能力。 more

Cognitive Architecture（认知架构）：模拟人类思维过程的AI系统设计框架。 more

Computer Vision（计算机视觉）：让计算机理解和处理图像/视频的AI技术领域。 more

Conditional Generation（条件生成）：在给定特定条件下生成内容的技术。 more

Confidence Interval（置信区间）：对预测结果不确定性范围的量化表示。 more

Confusion Matrix（混淆矩阵）：展示分类模型预测结果与真实标签对应关系的表格。 more

Conjugate Gradient（共轭梯度）：一种求解线性方程组的迭代优化算法。 more

Contrastive Learning（对比学习）：一种自监督学习技术，通过比较相似和不同样本来学习有效特征。 more

Convex Optimization（凸优化）：目标函数为凸函数的优化问题研究领域。 more

Convolution（卷积）：卷积神经网络中用于提取图像特征的核心运算。 more

Copilot（副驾驶）：微软推出的AI辅助编程工具，帮助开发者编写代码。 more

Cost Function（成本函数）：衡量模型预测与真实值差异的函数，训练目标是最小化成本。 more

Cross-Entropy Loss（交叉熵损失）：衡量模型预测概率与真实概率差异的常用损失函数。 more

Cross-Validation（交叉验证）：通过多次划分数据来评估模型稳定性的技术。 more

CUDA（统一计算设备架构）：NVIDIA推出的并行计算平台和编程模型。 more

Custom Model（定制模型）：针对特定任务或领域定制的AI模型。 more

D

DALL·E（DALL·E模型）：OpenAI开发的文生图模型，根据文本描述生成图像。 more

Data Augmentation（数据增强）：通过变换原始数据来增加训练样本数量的技术。 more

Data Engineering（数据工程）：构建和维护数据处理流水线的工程技术。 more

Data Mining（数据挖掘）：从大量数据中发现模式和规律的技术。 more

Data Pipeline（数据流水线）：自动化数据收集、清洗、转换和加载的流程。 more

Data Processing（数据处理）：对原始数据进行清洗、转换和组织的操作。 more

Data Warehouse（数据仓库）：专门用于分析和查询的结构化数据存储系统。 more

Dataset（数据集）：用于训练和评估模型的样本集合。 more

DeBERTa（DeBERTa模型）：微软开发的高性能BERT变体，在多项NLP任务上表现优异。 more

Decision Boundary（决策边界）：分类模型区分不同类别样本的分界线或超平面。 more

Decision Tree（决策树）：通过树状结构进行决策预测的模型。 more

Deep Learning（深度学习）：使用多层神经网络学习数据特征的机器学习方法。 more

Deepfake（深度伪造）：利用AI技术生成逼真的伪造视频或音频。 more

DeepMind（DeepMind）：Alphabet旗下AI研究公司，开发了AlphaGo等著名AI系统。 more

Denoising（去噪）：从信号中移除噪声的技术，在生成模型中用于从噪声恢复清晰内容。 more

Deployment（部署）：将训练好的模型应用到生产环境提供服务的过程。 more

Descriptive Analytics（描述性分析）：分析过去数据以了解发生了什么的技术。 more

DevOps（开发运维）：结合软件开发与系统运维的实践方法论。 more

Differential Privacy（差分隐私）：在保护隐私前提下进行数据分析的技术框架。 more

Differentiable Programming（可微编程）：通过自动微分实现的可学习程序设计范式。 more

Diffusion Model（扩散模型）：通过逐步去噪生成内容的生成模型架构。 more

Digit Recognition（数字识别）：识别手写数字的经典计算机视觉任务。 more

Dimensionality Reduction（降维）：减少数据特征维度同时保留关键信息的技术。 more

Distributed Training（分布式训练）：在多台机器上并行训练模型以加速和扩展规模的技术。 more

Domain Adaptation（领域适配）：将模型从一个领域迁移到另一个相关领域的技术。 more

Domain Knowledge（领域知识）：特定专业领域的专业知识。 more

Dropout（Dropout正则化）：防止神经网络过拟合的技术，随机丢弃部分神经元。 more

Dynamic Routing（动态路由）：根据输入动态决定信息流向的技术，如胶囊网络。 more

E

Early Stopping（早停）：当验证集性能不再提升时停止训练防止过拟合的技术。 more

Edge Computing（边缘计算）：在数据源附近进行计算处理的技术，减少延迟和带宽需求。 more

Edit Distance（编辑距离）：将一个字符串转换为另一个所需的最少编辑操作次数。 more

Efficiency（效率）：在有限资源下实现最优性能的能力。 more

Eigenvalue（特征值）：线性代数中矩阵的重要性质，在PCA等降维技术中用到。 more

ELBO（变分下界）：变分推断中的核心优化目标。 more

Embedding（嵌入）：将高维数据转换为低维向量的技术，便于计算相似度。 more

Emergent Ability（涌现能力）：模型规模增大后突然出现的新能力。 more

End-to-End Learning（端到端学习）：直接从原始输入学习到最终输出的训练范式。 more

Entity Recognition（实体识别）：从文本中识别出人名、地名、机构名等实体的NLP任务。 more

Epoch（轮次）：完整遍历一次训练数据集的过程。 more

Error Analysis（错误分析）：系统分析模型预测错误模式的方法。 more

ETL（抽取转换加载）：数据工程中收集、清洗、存储数据的标准流程。 more

Evaluation Metric（评估指标）：量化模型性能的标准，如准确率、F1分数等。 more

Example Prompting（示例提示）：在提示中包含输入输出示例来引导模型输出。 more

Explanatory Analysis（解释性分析）：理解数据背后原因和机制的分析方法。 more

Explainable AI（可解释AI）：让AI决策过程透明可理解的技术。 more

Exponential Moving Average（指数移动平均）：一种对数据序列进行平滑处理的方法。 more

F

F1 Score（F1分数）：精确率和召回率的调和平均数，综合评估分类性能。 more

Face Recognition（人脸识别）：识别和验证人脸身份的计算机视觉技术。 more

Few-shot Learning（少样本学习）：仅用极少样本就能学习新任务的能力。 more

Fine-tuning（微调）：在预训练模型基础上，用特定数据继续训练以适应新任务。 more

Flatten（展平）：将多维数组转换为一维数组的操作，常用于图像数据预处理。 more

FLOPs（浮点运算次数）：衡量模型计算复杂度的指标。 more

Forecasting（预测）：基于历史数据预测未来趋势的任务。 more

Foundation Model（基础模型）：在大规模数据上预训练、可适配多种任务的AI模型。 more

Fourier Transform（傅里叶变换）：将信号分解为不同频率成分的数学变换。 more

Fraud Detection（欺诈检测）：识别异常交易或行为以防止欺诈的技术。 more

Fully Connected Layer（全连接层）：每层神经元与上一层的所有神经元相连的网络层。 more

G

Gated Recurrent Unit（门控循环单元）：一种比LSTM更简单的循环神经网络结构。 more

Gaussian Distribution（高斯分布）：又称正态分布，是统计学中最重要的概率分布。 more

Gaussian Noise（高斯噪声）：服从正态分布的随机噪声。 more

GBDT（梯度提升决策树）：通过集成多个决策树来提升预测性能的算法。 more

Generalization（泛化）：模型处理未见过的数据的能力。 more

Generative AI（生成式AI）：能够创造新内容的AI，包括文本、图像、音频等。 more

Generative Adversarial Network（生成对抗网络）：由生成器和判别器对抗训练生成逼真数据的模型。 more

Genetic Algorithm（遗传算法）：模拟自然选择进行优化的启发式算法。 more

Gemma（Gemma模型）：Google推出的开源大语言模型系列。 more

Gibbs Sampling（吉布斯采样）：一种从多元概率分布中采样的 Markov Chain Monte Carlo 方法。 more

Global Average Pooling（全局平均池化）：对特征图所有值求平均的池化操作。 more

Gradient（梯度）：函数在某点处上升最快的方向向量。 more

Gradient Accumulation（梯度累积）：通过累积多个小批次的梯度来模拟大批次训练的技术。 more

Gradient Clipping（梯度裁剪）：限制梯度大小防止训练不稳定的技术。 more

Gradient Descent（梯度下降）：优化算法，通过沿梯度方向迭代更新参数来最小化损失函数。 more

Graph Convolutional Network（图卷积网络）：专门处理图结构数据的神经网络。 more

Graph Neural Network（图神经网络）：在图结构上进行学习的神经网络。 more

Ground Truth（真实标签）：训练数据中正确的标签或目标值。 more

GPT（生成式预训练Transformer）：OpenAI开发的大语言模型系列。 more

GPU（图形处理器）：最初用于游戏现广泛用于AI计算的并行处理器。 more

Gradient Boosting（梯度提升）：通过逐步添加弱学习器来优化损失函数的集成方法。 more

Guardrail（护栏）：防止AI模型输出不当内容的安全机制。 more

H

Hallucination（幻觉）：AI模型生成看似合理但实际错误的内容现象。 more

Hard Negative Mining（困难负样本挖掘）：选择难分类负样本进行训练的技术。 more

Hashing（哈希）：将任意长度数据转换为固定长度值的函数。 more

Hebbian Learning（赫布学习）：神经元之间"一起放电则连接加强"的学习规则。 more

Hidden Layer（隐藏层）：输入层和输出层之间的神经网络层。 more

Hierarchical Attention Network（层次注意力网络）：在不同粒度应用注意力的神经网络架构。 more

High-dimensional Data（高维数据）：具有大量特征的数据，需要降维技术处理。 more

Hook（钩子）：在神经网络中插入的用于提取中间层输出的机制。 more

Hopfield Network（霍普菲尔德网络）：一种早期循环神经网络模型。 more

Human-in-the-Loop（人在回路）：将人类反馈纳入AI训练和决策过程的方法。 more

Hyperparameter（超参数）：需要人工设置的模型参数，如学习率、批量大小等。 more

Hyperparameter Tuning（超参数调优）：系统搜索最优超参数组合的过程。 more

I

Image Classification（图像分类）：判断图像属于哪个类别的任务。 more

Image Generation（图像生成）：AI模型根据描述或条件创建新图像的能力。 more

Image Segmentation（图像分割）：将图像划分为不同区域或对象的任务。 more

Image-to-Text（图像转文本）：描述图像内容的任务，也叫图像 Captioning。 more

Imbalanced Data（不平衡数据）：各类别样本数量差异较大的数据集。 more

Inference（推理）：使用训练好的模型进行预测的过程。 more

Information Retrieval（信息检索）：从大规模数据中找到相关信息的技术。 more

Instance Segmentation（实例分割）：区分同类不同个体的图像分割任务。 more

Integer Programming（整数规划）：变量取整数值的优化问题。 more

Integration（集成）：组合多个模型以提升整体性能的方法。 more

Intent Detection（意图识别）：理解用户想要完成什么任务的NLP任务。 more

Interactive Learning（交互式学习）：通过人机交互获取标注数据的学习方式。 more

Interpolation（插值）：在已知数据点之间估计未知点值的方法。 more

IoU（交并比）：衡量目标检测框准确性的指标。 more

J

Jacobian Matrix（雅可比矩阵）：一阶偏导数矩阵，描述函数局部线性近似。 more

JavaScript Object Notation（JSON）：轻量级数据交换格式。 more

Joint Embedding（联合嵌入）：将不同模态数据映射到同一向量空间的技术。 more

K

K-fold Cross Validation（K折交叉验证）：将数据分成K份轮流作为验证集的评估方法。 more

K-means（K均值聚类）：最常用的聚类算法，将数据分成K个簇。 more

K-nearest Neighbors（K近邻）：根据最近K个邻居进行分类的简单算法。 more

Kernel（核函数）：在特征空间中计算相似度的函数。 more

Kernel Method（核方法）：使用核函数处理非线性问题的技术。 more

Knowledge Distillation（知识蒸馏）：用大模型训练小模型的技术，实现模型压缩。 more

Knowledge Graph（知识图谱）：用图结构表示实体和关系的大规模知识库。 more

Knowledge Retrieval（知识检索）：从知识库中获取相关信息的技术。 more

Kubernetes（K8s）：容器编排平台，用于部署和管理AI应用。 more

L

Label（标签）：训练数据中表示正确类别的标记。 more

Label Smoothing（标签平滑）：将硬标签转换为软概率分布的正则化技术。 more

LangChain（LangChain框架）：开发LLM应用的流行框架。 more

LangGraph（LangGraph框架）：用于构建有状态、多角色AI应用的框架。 more

Language Model（语言模型）：预测文本序列概率的模型。 more

Latent Space（潜在空间）：数据压缩后的低维表示空间。 more

Latent Variable（潜在变量）：无法直接观测但影响可观测变量的变量。 more

Layer Normalization（层标准化）：对单层神经元进行标准化的技术。 more

Learning Rate（学习率）：决定参数更新幅度的超参数。 more

Least Squares（最小二乘法）：通过最小化误差平方和进行参数估计的方法。 more

LLaMA（LLaMA模型）：Meta开发的高性能开源大语言模型。 more

LLM（大语言模型）：在海量文本上训练能理解和生成语言的巨型AI模型。 more

LORA（低秩适配）：一种高效的模型微调技术，大幅减少训练参数量。 more

Loss Function（损失函数）：衡量模型预测与真实值差异的函数，训练目标是最小化损失。 more

Long Short-Term Memory（长短期记忆网络）：能够长期记忆信息的循环神经网络变体。 more

Low-rank Adaptation（低秩适配）：通过低秩矩阵近似进行高效微调的技术。 more

LSTM（长短期记忆网络）：能够长期记忆信息的循环神经网络变体。 more

M

Machine Learning（机器学习）：让计算机通过数据学习并改进的AI分支。 more

Machine Translation（机器翻译）：自动将一种语言翻译成另一种语言的技术。 more

Macro F1（宏F1分数）：各类别F1分数的简单平均。 more

Marginal Probability（边缘概率）：不考虑其他变量时单个变量的概率。 more

Markov Chain（马尔可夫链）：未来只与当前状态有关的随机过程。 more

Masked Language Modeling（掩码语言建模）：通过预测被遮挡词语来训练语言模型的方法。 more

Massively Multiplayer Online（大规模多人在线）：支持大量用户同时交互的环境。 more

MatMul（矩阵乘法）：线性代数中的基本运算，深度学习核心计算。 more

Max Pooling（最大池化）：取区域中最大值进行下采样的操作。 more

Maximum Likelihood Estimation（最大似然估计）：找到使观测数据概率最大的参数估计方法。 more

MC Dropout（蒙特卡洛Dropout）：使用Dropout进行贝叶斯近似推断的方法。 more

MCP（模型上下文协议）：Anthropic推出的AI工具集成标准协议。 more

Mean Absolute Error（平均绝对误差）：预测误差绝对值的平均。 more

Mean Squared Error（均方误差）：预测误差平方的平均，常用回归指标。 more

Memory-augmented Neural Network（记忆增强神经网络）：结合外部存储的神经网络架构。 more

Meta-learning（元学习）：学习如何学习的能力，让模型快速适应新任务。 more

Metric Learning（度量学习）：学习有效距离度量来完成分类或检索任务。 more

Mixture of Experts（专家混合）：组合多个专家网络处理不同输入的技术。 more

MLOps（机器学习运维）：机器学习系统的开发、部署和维护实践。 more

Model Architecture（模型架构）：神经网络的设计结构。 more

Model Card（模型卡片）：记录模型用途、限制、性能等信息文档。 more

Model Distillation（模型蒸馏）：用大模型训练小模型的技术，实现模型压缩。 more

Model Ensemble（模型集成）：组合多个模型提升整体性能的技术。 more

Model Evaluation（模型评估）：使用各种指标衡量模型性能的过程。 more

Model Interpretability（模型可解释性）：理解和解释模型决策过程的能力。 more

Model Serving（模型服务）：将模型部署为API提供服务的过程。 more

Model Versioning（模型版本管理）：跟踪和管理不同版本模型的技术。 more

Momentum（动量）：加速梯度下降的优化技术。 more

Monte Carlo Dropout（蒙特卡洛Dropout）：使用Dropout进行贝叶斯近似推断的方法。 more

Multi-class Classification（多分类）：将数据分为多个类别的预测任务。 more

Multi-head Attention（多头注意力）：并行运行多个注意力机制的Transformer核心组件。 more

Multimodal（多模态）：能同时处理文本、图像、音频等多种数据类型的AI能力。 more

Multimodal Learning（多模态学习）：同时处理和关联多种模态数据的学习方法。 more

Multi-task Learning（多任务学习）：同时学习多个相关任务以提升泛化能力。 more

N

Named Entity Recognition（命名实体识别）：从文本中识别人名、地名、机构名等特定实体的NLP任务。 more

Natural Language Generation（自然语言生成）：AI生成人类语言文本的能力。 more

Natural Language Inference（自然语言推理）：判断两个句子逻辑关系的NLP任务。 more

Natural Language Processing（自然语言处理）：让计算机理解和生成人类语言的AI技术。 more

Negative Sampling（负采样）：在训练中随机选取负样本的技术，用于提高效率。 more

NER（命名实体识别）：从文本中识别人名、地名、机构名等特定实体的NLP任务。 more

Neural Architecture Search（神经架构搜索）：自动搜索最优神经网络结构的技术。 more

Neural Network（神经网络）：受人脑启发的计算模型，由层层神经元组成。 more

Neural Turing Machine（神经图灵机）：结合神经网络和外部存储的架构。 more

Node（节点）：神经网络中的计算单元，接收输入并产生输出。 more

Noise（噪声）：干扰数据的随机因素。 more

Noise Contrastive Estimation（噪声对比估计）：一种高效训练词嵌入的技术。 more

Non-maximum Suppression（非极大值抑制）：目标检测中去除冗余检测框的后处理技术。 more

Normalization（标准化）：调整数据分布使其均值为0方差为1的处理。 more

Novelty Detection（异常检测）：识别数据中新奇或异常模式的技术。 more

N-gram（N元语法）：连续的N个词或字符组成的序列。 more

O

Object Detection（目标检测）：在图像中定位并识别多个目标的技术。 more

Objective Function（目标函数）：优化过程中要最大化或最小化的函数。 more

Oblivious Decision Tree（ oblivious决策树）：各层特征选择相互独立的决策树。 more

OCR（光学字符识别）：将图像中的文字识别为可编辑文本的技术。 more

One-shot Learning（单样本学习）：仅用一个样本就能识别新类别的能力。 more

One-hot Encoding（独热编码）：用二进制向量表示分类变量的方法。 more

Online Learning（在线学习）：数据流式到达时持续更新模型的训练方式。 more

Open-source Model（开源模型）：公开代码和权重可自由使用的模型。 more

OpenAI（OpenAI）：开发GPT系列模型的AI研究公司。 more

Operation Fusion（算子融合）：合并多个计算操作以提高效率的技术。 more

Optimal Transport（最优传输）：衡量概率分布差异的数学理论。 more

Optimization（优化）：找到使目标函数最值的参数的过程。 more

Optimizer（优化器）：更新模型参数以最小化损失函数的算法。 more

Oracle（神谕）：在主动学习中提供真实标签的模拟器。 more

Ordinal Regression（有序回归）：预测有顺序关系的离散类别。 more

Out-of-distribution（分布外）：与训练数据分布不同的新数据。 more

Output Layer（输出层）：神经网络最后一层，产生最终预测结果。 more

Overfitting（过拟合）：模型在训练数据上表现好但泛化能力差的问题。 more

P

Padding（填充）：在序列两端添加特殊标记使长度一致的处理。 more

PaLM（Pathways语言模型）：Google开发的大语言模型。 more

Parallel Computing（并行计算）：同时执行多个计算任务以加速处理。 more

Parameter（参数）：模型内部可学习的权重值，通过训练获得。 more

Parameter Efficient Fine-tuning（参数高效微调）：大幅减少微调所需计算资源的技术统称。 more

Parameter Sharing（参数共享）：不同位置使用相同参数减少模型大小的技术。 more

Parsers（解析器）：分析文本语法结构的NLP组件。 more

Partial Differential Equation（偏微分方程）：包含多个变量偏导数的方程，在AI物理建模中常用。 more

PCA（主成分分析）：最常用的降维方法，通过线性变换保留最大方差方向。 more

PEFT（参数高效微调）：大幅减少微调所需计算资源的技术统称。 more

Perceptron（感知机）：最简单的人工神经元模型。 more

Perplexity（困惑度）：衡量语言模型预测不确定性的指标，越低越好。 more

Personalization（个性化）：根据用户偏好定制AI服务的技术。 more

PII（个人身份信息）：可以识别个人身份的数据，需要保护。 more

Pipeline（流水线）：将多个处理步骤串联的工作流程。 more

Pixel（像素）：图像的基本组成单元。 more

Planner（规划器）：在Agent中负责制定行动计划的组件。 more

Pooling（池化）：降采样减少特征图尺寸的操作。 more

Position Embedding（位置嵌入）：为序列中每个位置添加位置信息的技术。 more

Post-training（后训练）：在预训练之后进行的额外训练阶段。 more

Precision（精确率）：预测为正的样本中实际为正的比例。 more

Prediction（预测）：模型对新数据输出结果的过程。 more

Predictive Analytics（预测性分析）：使用历史数据预测未来趋势的技术。 more

Pre-training（预训练）：在大规模数据上训练基础模型的过程。 more

Pretrained Model（预训练模型）：已在大规模数据上训练过的模型，可微调用于下游任务。 more

Principal Component Analysis（主成分分析）：最常用的降维方法，通过线性变换保留最大方差方向。 more

Prior Probability（先验概率）：根据先验知识确定的概率分布。 more

Probabilistic Model（概率模型）：基于概率论构建的模型。 more

Probability Distribution（概率分布）：描述随机变量可能取值及对应概率的函数。 more

Probing（探针分析）：通过训练简单分类器探测预训练模型编码的知识。 more

Prompt（提示词）：引导AI模型产生期望输出的输入文本。 more

Prompt Engineering（提示工程）：设计最优输入提示词来引导AI模型输出的技术。 more

Prompt Injection（提示注入）：通过恶意提示词操纵AI模型的技术。 more

Prompt Tuning（提示微调）：通过学习提示向量来调整模型行为的技术。 more

Pruning（剪枝）：移除神经网络中不重要权重或神经元以压缩模型。 more

Pseudo-labeling（伪标签）：用模型预测作为标签训练其他数据的技术。 more

P-tuning（可学习提示）：通过神经网络学习连续提示向量的技术。 more

Python（Python）：AI领域最流行的编程语言。 more

PyTorch（PyTorch框架）：Meta开源的深度学习框架。 more

Q

Q-function（Q函数）：强化学习中评估状态-动作对价值的函数。 more

Quantization（量化）：将模型参数从高精度转换为低精度的压缩技术。 more

Quantum Computing（量子计算）：利用量子力学原理进行计算的新型计算范式。 more

Query（查询）：向模型或数据库请求信息的操作。 more

Question Answering（问答）：根据问题从给定文本或知识库中提取答案的NLP任务。 more

R

Random Forest（随机森林）：通过集成多棵决策树提升性能的算法。 more

Random Walk（随机游走）：每步随机选择方向的运动过程。 more

Ranking（排序）：根据相关性对项目进行排序的任务。 more

RAG（检索增强生成）：结合知识检索与AI生成的混合技术架构。 more

Recall（召回率）：实际为正的样本中被正确预测为正的比例。 more

Recommendation System（推荐系统）：根据用户兴趣推荐内容的系统。 more

Reconstruction Loss（重建损失）：衡量模型重建原始数据能力的损失函数。 more

Rectified Linear Unit（ReLU）：最常用的激活函数，负值输出0正值保持不变。 more

Recurrent Neural Network（循环神经网络）：适合处理序列数据的神经网络架构。 more

Regression（回归）：预测连续数值的任务。 more

Regularization（正则化）：防止过拟合的约束技术。 more

Reinforcement Learning（强化学习）：通过试错学习最优策略的机器学习方法。 more

Relation Extraction（关系抽取）：从文本中识别实体之间关系的NLP任务。 more

Relationship Extraction（关系抽取）：从文本中识别实体之间关系的NLP任务。 more

Representation Learning（表示学习）：自动学习数据有效表示的技术。 more

Residual Block（残差块）：包含跳跃连接的神经网络块，缓解梯度消失问题。 more

Residual Connection（残差连接）：跳跃连接缓解深层网络训练困难的技术。 more

ResNet（残差网络）：使用残差连接的深度卷积神经网络。 more

Resource Efficiency（资源效率）：在有限计算资源下实现最优性能。 more

Response Generation（响应生成）：AI根据输入生成回答的过程。 more

Retrieval Augmented Generation（检索增强生成）：结合知识检索与AI生成的混合技术架构。 more

Reward Function（奖励函数）：强化学习中评估行为好坏的函数。 more

RHO（检索增强优化）：一种基于检索结果优化提示的技术。 more

RNN（循环神经网络）：适合处理序列数据的神经网络架构。 more

Robustness（鲁棒性）：AI模型面对噪声、对抗攻击等干扰时的稳定能力。 more

Role-playing（角色扮演）：让AI模型扮演特定角色的提示技术。 more

Root Mean Square Propagation（RMSProp）：自适应学习率的优化算法。 more

Router（路由）：在多专家网络中决定使用哪个专家的组件。 more

S

S3（简单存储服务）：AWS提供的云存储服务。 more

SageMaker（AWS SageMaker）：AWS的机器学习平台。 more

Saliency Map（显著性图）：显示输入中对输出最重要区域的图像。 more

Sample（样本）：数据集中的单个数据点。 more

Sampling（采样）：从分布中随机选取样本的过程。 more

Scalability（可扩展性）：系统处理更大规模数据或用户的能力。 more

Score（分数）：模型输出的原始数值，表示某种置信度。 more

Search Algorithm（搜索算法）：在解空间中寻找最优解的算法。 more

Self-attention（自注意力）：序列内部各位置相互注意的机制。 more

Self-consistency（自一致性）：通过多次采样选择最一致答案的技术。 more

Self-supervised Learning（自监督学习）：无需人工标注的从无标签数据学习的技术。 more

Semantic Analysis（语义分析）：理解文本深层含义的NLP技术。 more

Semantic Role Labeling（语义角色标注）：识别句子中主语、宾语、谓语等语义角色的任务。 more

Semantic Search（语义搜索）：理解查询意图而非仅匹配关键词的搜索技术。 more

Semantic Segmentation（语义分割）：对图像每个像素进行分类的任务。 more

Semi-supervised Learning（半监督学习）：同时使用标注和未标注数据的学习方法。 more

Sentence Embedding（句子嵌入）：将句子映射为向量的技术。 more

Sentiment Analysis（情感分析）：判断文本情感倾向（正面、负面、中性）的NLP任务。 more

Sequence Generation（序列生成）：生成文本、代码等序列数据的技术。 more

Sequence Modeling（序列建模）：处理和预测序列数据的任务。 more

Sequence-to-Sequence（序列到序列）：将一个序列映射到另一个序列的模型架构。 more

Serverless Computing（无服务器计算）：无需管理服务器的云端执行模式。 more

Service Level Agreement（服务级别协议）：服务质量的保证协议。 more

Serving（服务化）：将模型部署为API供调用的过程。 more

SGD（随机梯度下降）：每次用单个样本计算梯度的优化算法。 more

Sigmoid（Sigmoid函数）：将数值映射到0到1之间的激活函数。 more

Similarity（相似度）：衡量两个对象相近程度的指标。 more

Simulated Environment（模拟环境）：在虚拟环境中训练AI的技术。 more

Singular Value Decomposition（奇异值分解）：矩阵分解的常用方法，用于降维。 more

Skip-gram（Skip-gram模型）：一种词嵌入训练架构。 more

Smoothing（平滑）：处理数据中稀疏或零值的技术。 more

SNE（随机邻域嵌入）：一种非线性降维技术。 more

Social Media Analysis（社交媒体分析）：分析社交媒体内容的AI技术。 more

Soft Margin（软间隔）：允许一定错误分类的SVM变体。 more

Softmax（Softmax函数）：将数值转换为概率分布的函数，常用于多分类。 more

Software Engineering（软件工程）：开发和维护软件系统的学科。 more

SOTA（最先进）：当前最高水平或最佳性能。 more

Span Extraction（片段抽取）：从文本中抽取特定片段回答问题的任务。 more

Spark（Spark）：大数据处理框架。 more

Sparse Attention（稀疏注意力）：只计算部分注意力权重的注意力机制。 more

Sparsity（稀疏性）：大部分元素为0的特性。 more

Speech Recognition（语音识别）：将语音转换为文字的技术。 more

Speech Synthesis（语音合成）：将文字转换为语音的技术。 more

SQL（结构化查询语言）：用于操作关系数据库的语言。 more

SQuAD（SQuAD数据集）：著名的机器阅读理解数据集。 more

SSL（安全套接层）：网络通信加密协议。 more

Stability（稳定性）：模型对小扰动不敏感的特性。 more

Stack（堆栈）：后进先出的数据结构。 more

State of the Art（最先进）：当前最高水平或最佳性能。 more

Stochastic Gradient Descent（随机梯度下降）：每次用单个样本计算梯度的优化算法。 more

Streaming（流式处理）：实时处理连续数据流的技术。 more

Structured Data（结构化数据）：具有明确定义格式的数据，如表格数据。 more

Structured Prediction（结构化预测）：输出具有复杂结构（如树、图）的预测任务。 more

Style Transfer（风格迁移）：将一种图像风格应用到另一图像的技术。 more

StyleGAN（风格生成对抗网络）：能控制生成图像风格的高质量生成模型。 more

Supervised Learning（监督学习）：使用标注数据进行训练的学习方法。 more

Support Vector Machine（支持向量机）：通过找到最优分割超平面进行分类的算法。 more

Symbolic AI（符号AI）：基于规则和逻辑的人工智能方法。 more

Synonym（同义词）：意思相近的词语。 more

T

T5（文本到文本Transformer）：将所有NLP任务统一为文本到文本格式的模型。 more

Tabular Data（表格数据）：以表格形式组织的数据。 more

Tanh（双曲正切函数）：将数值映射到-1到1之间的激活函数。 more

Target（目标）：模型要预测的真实值或期望输出。 more

Task-specific Model（任务专用模型）：针对特定任务优化的模型。 more

Token（词元）：语言模型处理文本的最小单位。 more

Tokenization（分词）：将文本分割为词元的过程。 more

Topic Modeling（主题建模）：从文档集合中发现主题的统计方法。 more

Token Limit（词元限制）：模型一次能处理的最大词元数量。 more

Top-k Sampling（Top-k采样）：从最高概率的k个选项中随机选择的生成策略。 more

Training（训练）：使用数据调整模型参数使模型学习模式的过程。 more

Training Data（训练数据）：用于训练模型的标注数据。 more

Trajectory（轨迹）：智能体在环境中一系列状态-动作序列。 more

Transfer Learning（迁移学习）：将一个任务学到的知识应用到相关任务的技术。 more

Transformer（Transformer）：基于注意力机制的革命性模型架构。 more

Translation（翻译）：将一种语言转换为另一种语言的任务。 more

TREC（文本检索会议）：信息检索领域的重要评测会议和数据集。 more

Tree Search（树搜索）：在树结构中搜索最优解的算法。 more

Trend Analysis（趋势分析）：识别数据中长期变化趋势的技术。 more

Triplet Loss（三元组损失）：学习度量空间中样本相对距离的损失函数。 more

Trojan Attack（特洛伊木马攻击）：在模型中植入恶意后门的攻击方式。 more

Tuning（调优）：调整模型或系统参数以优化性能。 more

Turn-taking（对话轮次）：多轮对话中角色交替的机制。 more

Two-tower Model（双塔模型）：分别编码查询和文档的检索模型架构。 more

U

UMAP（统一流形近似与投影）：高效的降维可视化技术。 more

Underfitting（欠拟合）：模型过于简单，无法捕捉数据规律的问题。 more

Uniform Resource Locator（URL）：网页地址。 more

Unsupervised Learning（无监督学习）：使用无标签数据发现模式的学习方法。 more

Upsampling（上采样）：增加数据分辨率的操作。 more

User Experience（用户体验）：用户与产品交互的总体感受。 more

User Intent（用户意图）：用户想要完成的目标或需求。 more

V

VAE（变分自编码器）：使用变分推断的自编码器，可用于生成任务。 more

Validation Data（验证数据）：用于调参和早停的独立数据集。 more

Vanishing Gradient（梯度消失）：深层网络训练中梯度变得极小的问题。 more

Variational Inference（变分推断）：使用变分分布近似后验分布的推断方法。 more

Vector（向量）：具有大小和方向的数学对象。 more

Vector Database（向量数据库）：专门存储和检索高维向量的数据库。 more

Vector Space（向量空间）：向量构成的数学空间，用于表示语义。 more

Video Understanding（视频理解）：理解和分析视频内容的AI技术。 more

Virtual Environment（虚拟环境）：隔离的Python运行环境。 more

Vision and Language（视觉语言）：同时处理图像和文本的多模态领域。 more

Vision Transformer（视觉Transformer）：将Transformer架构应用于图像处理的模型。 more

VLM（视觉语言模型）：能同时理解图像和文本的多模态模型。 more

Voice Assistant（语音助手）：通过语音交互提供服务的AI程序。 more

W

Weight（权重）：神经网络中连接节点的参数，决定输入的重要性。 more

Weight Decay（权重衰减）：通过惩罚大权重防止过拟合的正则化技术。 more

Weights & Biases（W&B）：机器学习实验跟踪工具。 more

Whitening（白化）：使数据协方差矩阵为单位矩阵的预处理。 more

Word Embedding（词嵌入）：将词语映射为向量的技术。 more

Word2Vec（词2向量）：经典的词嵌入训练算法。 more

Wrapper（包装器）：在模型外层添加功能的组件。 more

X

XGBoost（极端梯度提升）：高效的梯度提升算法库。 more

Y

YAML（YAML不是标记语言）：人类可读的数据序列化格式。 more

YOLO（YOLO目标检测）：实时目标检测算法，以速度快著称。 more

Z

Zero-shot Learning（零样本学习）：模型能够识别从未见过类别样本的能力。 more

Zero-shot Translation（零样本翻译）：不经过语言对直接训练实现翻译。 more

Zeroshot（零样本）：模型能够处理从未见过任务的能力。 more

ZKP（零知识证明）：证明某事为真而不透露具体信息的加密技术。 more

附录：AI产品与系统

主流AI模型

GPT系列：OpenAI开发的大语言模型，包括GPT-3、GPT-4、GPT-4o等，在文本生成和理解方面表现卓越。 more

Claude系列：Anthropic公司开发的AI助手，以长文本处理和安全性著称。 more

Gemini：Google开发的多模态AI模型，原名Bard，能处理文本、图像、视频等多种模态。 more

LLaMA：Meta开源的大语言模型系列，参数规模从70亿到700亿不等。 more

Qwen：阿里巴巴开发的中文大语言模型系列。 more

DeepSeek：中国AI公司开发的高性能大语言模型。 more

Mistral：法国AI公司开发的高效大语言模型。 more

Groq：专注于快速推理的AI芯片和模型服务。 more

AI开发框架

LangChain：用于构建LLM应用的流行Python框架，提供链式调用、Agent、工具集成等功能。 more

LangGraph：用于构建有状态、多角色AI应用的框架，支持复杂工作流。 more

LlamaIndex：专注于数据连接的LLM框架，用于构建知识增强的应用。 more

AutoGen：微软开发的多Agent自动生成框架。 more

CrewAI：用于构建多Agent协作团队的框架。 more

OpenAI SDK：OpenAI官方提供的API客户端库。 more

Anthropic SDK：Claude模型的官方API客户端库。 more

AI部署与推理

Ollama：在本地运行大语言模型的工具，支持macOS、Linux、Windows。 more

vLLM：高效的大语言模型推理服务框架，支持PagedAttention。 more

TensorRT-LNVIDIA：的高性能深度学习推理引擎。 more

ONNX Runtime：跨平台的机器学习推理引擎。 more

LightLLM：基于Python的大语言模型推理框架。 more

FastAPI：Python高性能Web框架，常用于部署AI服务。 more

向量数据库

Pinecone：云原生向量数据库服务。 more

Weaviate：开源向量搜索引擎，支持GraphQL API。 more

Milvus：开源向量数据库，由Linux基金会托管。 more

Chroma：开源嵌入式向量数据库，为LLM应用设计。 more

Faiss：Facebook开源的向量检索库。 more

Qdrant：开源向量数据库，支持云原生部署。 more

AI应用平台

OpenClaw：企业级AI Agent开发平台，支持快速构建智能应用。 more

LangChain平台：LangChain官方提供的云端LLM应用开发平台。 more

Hugging Face：最大的开源机器学习社区和模型托管平台。 more

Replicate：云端运行开源AI模型的平台。 more

Runway：AI视频生成和编辑平台。 more

Midjourney：通过文字描述生成图像的AI工具。 more

Stable Diffusion：开源的文生图模型，可本地部署。 more

AI开发工具

Cursor：基于AI的代码编辑器，集成GPT-4能力。 more

GitHub Copilot：微软的AI编程助手，集成在VS Code中。 more

Amazon SageMaker：AWS的全托管机器学习平台。 more

Google Vertex AI：Google Cloud的机器学习平台。 more

Azure Machine Learning：微软Azure的机器学习平台。 more

Weights & Biases：机器学习实验跟踪和模型可视化工具。 more

MLflow：开源的机器学习生命周期管理平台。 more

Comet：机器学习实验管理平台。 more

AI开发组件

OpenAPI：用于描述RESTful API的规范，AI服务多通过OpenAPI暴露接口。 more

GraphQL：API查询语言，AI应用常用于灵活获取数据。 more

gRPC：高性能RPC框架，AI服务间通信常用。 more

Docker：容器化技术，用于AI应用打包和部署。 more

Kubernetes：容器编排平台，用于AI服务自动化部署和扩缩容。 more

Prompt工程工具

PromptPerfect：专业的提示词优化工具。 more

PromptBase：提示词交易和分享平台。 more

PromptFlow：Microsoft的提示词工程工具。 more

AI安全与伦理

AI Safety：确保AI系统安全可靠的研究领域。 more

Responsible AI：负责任AI开发和部署的实践和原则。 more

AI Alignment：确保AI目标与人类价值观一致的研究。 more

Red Teaming：通过模拟攻击测试AI系统安全性的方法。 more

Bias Detection：检测AI系统中偏见的技术。 more

AI评估与基准

HELM：大语言模型综合评估基准。 more

MMLU：大规模多任务语言理解测试。 more

HumanEval：代码生成能力评估数据集。 more

MMLU：多任务语言理解基准。 more

GLUE：自然语言理解基准套件。 more

SuperGLUE：比GLUE更具挑战性的NLP基准。 more

AI智能体相关

Agent Framework：构建AI智能体的软件框架。 more

Tool Use：AI模型调用外部工具的能力。 more

Memory System：AI智能体的记忆系统，用于存储和检索信息。 more

Planning：AI智能体的规划能力，用于分解复杂任务。 more

Reflection：AI智能体的反思能力，用于自我改进。 more

ReAct：结合推理和行动的AI框架。 more

AI工作流

AI Pipeline：从数据处理到模型部署的完整流程。 more

ETL Pipeline：数据抽取、转换、加载流程，AI数据处理基础。 more

Data Pipeline：数据处理和流转的自动化流程。 more

CI/CD Pipeline：持续集成和持续部署，AI模型发布自动化。 more

ML Pipeline：机器学习模型训练和部署流水线。 more

AI云服务

AWS AI Services：Amazon的AI服务系列，包括Rekognition、Polly、Lex等。 more

Google AI Services：Google Cloud的AI服务。 more

Azure AI Services：Microsoft Azure的AI服务。 more

阿里云AI：阿里巴巴的AI开放平台。 more

腾讯云AI：腾讯云的AI服务。 more

百度智能云：百度的AI开放平台。 more

AI开发资源

arXiv：AI领域最新研究论文预印本平台。 more

Papers with Code：带代码的AI论文集。 more

GitHub：全球最大开源代码平台，AI项目聚集地。 more

Kaggle：数据科学和机器学习竞赛平台。 more

Model Zoo：预训练模型仓库。 more

AI News：AI行业新闻资讯网站。 more

AI学习资源

DeepLearning.AI：Andrew Ng创办的AI学习平台。 more

Fast.ai：免费深度学习课程。 more

CS231n：斯坦福视觉识别课程。 more

CS224n：斯坦福NLP课程。 more

Google ML Courses：Google的免费机器学习课程。 more

AI行业术语

AI winters：AI发展史上的低谷期。 more

AI boom：AI快速发展和投资热潮期。 more

Edge AI：在终端设备上运行的AI。 more

On-premise AI：本地部署的AI系统。 more

SaaS AI：作为服务提供的AI能力。 more

AI Marketplace：AI模型和服务的交易平台。 more

AI as a Service（AIaaS）：AI即服务，通过云端API提供AI能力。 more

AI相关组织

OpenAI：AI研究和部署公司，开发GPT系列。 more

Anthropic：AI安全公司，开发Claude。 more

DeepMind：Google旗下AI研究公司，开发AlphaGo。 more

Meta AI：Meta的AI研究部门。 more

Google DeepMind：Google和DeepMind合并后的AI研究部门。 more

Microsoft Research：微软研究院，AI基础研究。 more

Stanford HAI：斯坦福人本人工智能研究院。 more

MIT CSAIL：麻省理工计算机与人工智能实验室。 more

AI认证与标准

AWS AI Certification：Amazon的AI认证。 more

Google Cloud AI Certification：Google Cloud的AI认证。 more

TensorFlow Developer Certificate：TensorFlow开发者认证。 more

PyTorch Certification：PyTorch开发者认证。 more

AI 术语速查表 ​

A ​

B ​

C ​

D ​

E ​

F ​

G ​

H ​

I ​

J ​

K ​

L ​

M ​

N ​

O ​

P ​

Q ​

R ​

S ​

T ​

U ​

V ​

W ​

X ​

Y ​

Z ​

附录：AI产品与系统 ​

主流AI模型 ​

AI开发框架 ​

AI部署与推理 ​

向量数据库 ​

AI应用平台 ​

AI开发工具 ​

AI开发组件 ​

Prompt工程工具 ​

AI安全与伦理 ​

AI评估与基准 ​

AI智能体相关 ​

AI工作流 ​

AI云服务 ​

AI开发资源 ​

AI学习资源 ​

AI行业术语 ​

AI相关组织 ​

AI认证与标准 ​