Skip to content

AI 术语速查表

本文档收录了人工智能领域最常用的专业术语,每个术语都配有通俗易懂的一句话解释,并附上官方文档或权威资料链接,方便快速查阅。

A

AaaS(智能体即服务):指将AI智能体封装为可订阅服务的商业模式,用户通过API调用即可获得智能化能力。 more

A/B Testing(A/B测试):比较两个或多个模型版本以确定哪个表现更好的实验方法。 more

Accuracy(准确率):正确预测占总预测的比例,评估分类模型最常用的指标之一。 more

Activation Function(激活函数):神经网络中决定神经元是否被激活的数学函数,常用的有ReLU、Sigmoid、Tanh等。 more

AdaBoost(自适应提升):一种集成学习方法,通过组合多个弱分类器形成强分类器。 more

Adapter(适配器):插入预训练模型中用于微调的小型可训练模块,可实现多任务学习。 more

AdapterFusion(适配器融合):一种多任务学习技术,在不同任务适配器之间传递知识。 more

Adversarial Attack(对抗攻击):通过精心设计的输入来欺骗AI模型的攻击方式。 more

Adversarial Training(对抗训练):使用对抗样本来增强模型鲁棒性的训练方法。 more

Agent(智能体):一种能够自主感知环境、做出决策并执行行动的AI程序,就像一个可以独立完成任务的数字员工。 more

AI Compiler(AI编译器):将AI模型转换为可在特定硬件上高效运行的代码的工具。 more

AI Inference(AI推理):使用训练好的模型对新数据进行预测的过程。 more

AI Model Compression(模型压缩):通过剪枝、量化、蒸馏等技术减小模型体积和计算量的方法。 more

AI Pipeline(AI流水线):指从数据准备、模型训练、评估到部署的完整自动化流程,就像一条高效的生产线。 more

Algorithm(算法):解决问题或完成任务的明确步骤和规则集合。 more

Alignment(对齐):确保AI模型输出符合人类价值观和意图的技术。 more

ALM(阿凡达语言模型):Anthropic公司开发的大语言模型系列。 more

Anchor Boxes(锚框):目标检测中预设的参考框,用于检测不同尺度和形状的目标。 more

Anomaly Detection(异常检测):识别数据中异常或罕见模式的技术。 more

Anti-overfitting(防过拟合):防止模型过度记忆训练数据而丧失泛化能力的各种技术。 more

API(应用程序接口):不同软件之间交换数据和功能的桥梁。 more

Argmax(_argmax函数):返回使函数值最大化的参数值的运算,常用于分类预测。 more

Artificial General Intelligence(通用人工智能):指具有人类智能水平、能完成任何智能任务的AI系统,被视为AI发展的终极目标。 more

Artificial Intelligence(人工智能):让计算机模拟、延伸和扩展人类智能的技术科学。 more

Attention Mechanism(注意力机制):让AI模型在处理信息时学会"抓住重点"的技术,就像人类阅读时会重点关注关键信息。 more

Augmented Reality(增强现实):将虚拟信息叠加到真实世界画面中的技术。 more

AutoAugment(自动数据增强):自动搜索最优数据增强策略的技术。 more

Autoencoder(自编码器):一种无监督学习模型,通过压缩和重构数据来学习有效特征表示。 more

Automated ML(自动化机器学习):自动完成机器学习模型设计和调参的技术,让非专家也能轻松训练AI模型。 more

Auxiliary Task(辅助任务):在多任务学习中帮助主任务学习的额外任务。 more

B

Backpropagation(反向传播):训练神经网络时的核心算法,通过计算梯度来调整模型参数使预测更准确。 more

Bagging(装袋法):通过并行训练多个模型并集成结果来提高稳定性和准确性的方法。 more

Base Model(基础模型):在大规模数据上预训练、可以被微调适配各种任务的模型。 more

Batch(批次):一次训练中同时处理的一组样本。 more

Batch Normalization(批标准化):一种加速神经网络训练的技术,通过标准化每层输入来稳定训练过程。 more

Bayesian Optimization(贝叶斯优化):一种高效的超参数调优方法,利用概率模型指导搜索。 more

Benchmark(基准测试):用于评估模型性能的标准化测试数据集和评估协议。 more

BERT(BERT模型):谷歌推出的革命性语言理解模型,能够双向理解文本上下文。 more

Bias(偏差/偏置):AI模型中的系统性误差,可能导致对某些群体的不公平对待。 more

Bidirectional(双向):能够同时考虑前后文信息进行处理的模型架构。 more

Big Data(大数据):指规模巨大、类型多样的数据集合,需要特殊技术处理。 more

Binary Classification(二分类):将数据分为两类的预测任务。 more

BPE(字节对编码):一种常用的文本分词方法,将词拆分为子词单元。 more

Bucket(桶):将连续值离散化到多个区间进行处理的技术。 more

C

Calibration(校准):调整模型输出概率,使其更接近真实概率分布的技术。 more

Causal Inference(因果推断):分析变量之间因果关系而非仅仅相关性的统计方法。 more

Chain of Thought(思维链):让AI模型展示推理步骤的技术,可以提高复杂问题的解决能力。 more

Chatbot(聊天机器人):能够与用户进行对话交互的AI程序。 more

Checkpointer(检查点保存):在训练过程中定期保存模型状态以便恢复的技术。 more

Chinchilla(Chinchilla模型):DeepMind开发的高效大语言模型,展示了最优训练计算分配策略。 more

Chunking(分块):将长文本或长序列分割成较小组块进行处理的技术。 more

Classification(分类):预测数据属于哪个类别的任务。 more

CLIP(CLIP模型):OpenAI开发的多模态模型,能理解图像和文本的关系。 more

Clustering(聚类):将相似数据分组无监督学习方法。 more

CNN(卷积神经网络):专门用于处理图像的神经网络架构,能够自动提取图像特征。 more

Code Generation(代码生成):AI模型根据描述自动编写程序代码的能力。 more

Cognitive Architecture(认知架构):模拟人类思维过程的AI系统设计框架。 more

Computer Vision(计算机视觉):让计算机理解和处理图像/视频的AI技术领域。 more

Conditional Generation(条件生成):在给定特定条件下生成内容的技术。 more

Confidence Interval(置信区间):对预测结果不确定性范围的量化表示。 more

Confusion Matrix(混淆矩阵):展示分类模型预测结果与真实标签对应关系的表格。 more

Conjugate Gradient(共轭梯度):一种求解线性方程组的迭代优化算法。 more

Contrastive Learning(对比学习):一种自监督学习技术,通过比较相似和不同样本来学习有效特征。 more

Convex Optimization(凸优化):目标函数为凸函数的优化问题研究领域。 more

Convolution(卷积):卷积神经网络中用于提取图像特征的核心运算。 more

Copilot(副驾驶):微软推出的AI辅助编程工具,帮助开发者编写代码。 more

Cost Function(成本函数):衡量模型预测与真实值差异的函数,训练目标是最小化成本。 more

Cross-Entropy Loss(交叉熵损失):衡量模型预测概率与真实概率差异的常用损失函数。 more

Cross-Validation(交叉验证):通过多次划分数据来评估模型稳定性的技术。 more

CUDA(统一计算设备架构):NVIDIA推出的并行计算平台和编程模型。 more

Custom Model(定制模型):针对特定任务或领域定制的AI模型。 more

D

DALL·E(DALL·E模型):OpenAI开发的文生图模型,根据文本描述生成图像。 more

Data Augmentation(数据增强):通过变换原始数据来增加训练样本数量的技术。 more

Data Engineering(数据工程):构建和维护数据处理流水线的工程技术。 more

Data Mining(数据挖掘):从大量数据中发现模式和规律的技术。 more

Data Pipeline(数据流水线):自动化数据收集、清洗、转换和加载的流程。 more

Data Processing(数据处理):对原始数据进行清洗、转换和组织的操作。 more

Data Warehouse(数据仓库):专门用于分析和查询的结构化数据存储系统。 more

Dataset(数据集):用于训练和评估模型的样本集合。 more

DeBERTa(DeBERTa模型):微软开发的高性能BERT变体,在多项NLP任务上表现优异。 more

Decision Boundary(决策边界):分类模型区分不同类别样本的分界线或超平面。 more

Decision Tree(决策树):通过树状结构进行决策预测的模型。 more

Deep Learning(深度学习):使用多层神经网络学习数据特征的机器学习方法。 more

Deepfake(深度伪造):利用AI技术生成逼真的伪造视频或音频。 more

DeepMind(DeepMind):Alphabet旗下AI研究公司,开发了AlphaGo等著名AI系统。 more

Denoising(去噪):从信号中移除噪声的技术,在生成模型中用于从噪声恢复清晰内容。 more

Deployment(部署):将训练好的模型应用到生产环境提供服务的过程。 more

Descriptive Analytics(描述性分析):分析过去数据以了解发生了什么的技术。 more

DevOps(开发运维):结合软件开发与系统运维的实践方法论。 more

Differential Privacy(差分隐私):在保护隐私前提下进行数据分析的技术框架。 more

Differentiable Programming(可微编程):通过自动微分实现的可学习程序设计范式。 more

Diffusion Model(扩散模型):通过逐步去噪生成内容的生成模型架构。 more

Digit Recognition(数字识别):识别手写数字的经典计算机视觉任务。 more

Dimensionality Reduction(降维):减少数据特征维度同时保留关键信息的技术。 more

Distributed Training(分布式训练):在多台机器上并行训练模型以加速和扩展规模的技术。 more

Domain Adaptation(领域适配):将模型从一个领域迁移到另一个相关领域的技术。 more

Domain Knowledge(领域知识):特定专业领域的专业知识。 more

Dropout(Dropout正则化):防止神经网络过拟合的技术,随机丢弃部分神经元。 more

Dynamic Routing(动态路由):根据输入动态决定信息流向的技术,如胶囊网络。 more

E

Early Stopping(早停):当验证集性能不再提升时停止训练防止过拟合的技术。 more

Edge Computing(边缘计算):在数据源附近进行计算处理的技术,减少延迟和带宽需求。 more

Edit Distance(编辑距离):将一个字符串转换为另一个所需的最少编辑操作次数。 more

Efficiency(效率):在有限资源下实现最优性能的能力。 more

Eigenvalue(特征值):线性代数中矩阵的重要性质,在PCA等降维技术中用到。 more

ELBO(变分下界):变分推断中的核心优化目标。 more

Embedding(嵌入):将高维数据转换为低维向量的技术,便于计算相似度。 more

Emergent Ability(涌现能力):模型规模增大后突然出现的新能力。 more

End-to-End Learning(端到端学习):直接从原始输入学习到最终输出的训练范式。 more

Entity Recognition(实体识别):从文本中识别出人名、地名、机构名等实体的NLP任务。 more

Epoch(轮次):完整遍历一次训练数据集的过程。 more

Error Analysis(错误分析):系统分析模型预测错误模式的方法。 more

ETL(抽取转换加载):数据工程中收集、清洗、存储数据的标准流程。 more

Evaluation Metric(评估指标):量化模型性能的标准,如准确率、F1分数等。 more

Example Prompting(示例提示):在提示中包含输入输出示例来引导模型输出。 more

Explanatory Analysis(解释性分析):理解数据背后原因和机制的分析方法。 more

Explainable AI(可解释AI):让AI决策过程透明可理解的技术。 more

Exponential Moving Average(指数移动平均):一种对数据序列进行平滑处理的方法。 more

F

F1 Score(F1分数):精确率和召回率的调和平均数,综合评估分类性能。 more

Face Recognition(人脸识别):识别和验证人脸身份的计算机视觉技术。 more

Few-shot Learning(少样本学习):仅用极少样本就能学习新任务的能力。 more

Fine-tuning(微调):在预训练模型基础上,用特定数据继续训练以适应新任务。 more

Flatten(展平):将多维数组转换为一维数组的操作,常用于图像数据预处理。 more

FLOPs(浮点运算次数):衡量模型计算复杂度的指标。 more

Forecasting(预测):基于历史数据预测未来趋势的任务。 more

Foundation Model(基础模型):在大规模数据上预训练、可适配多种任务的AI模型。 more

Fourier Transform(傅里叶变换):将信号分解为不同频率成分的数学变换。 more

Fraud Detection(欺诈检测):识别异常交易或行为以防止欺诈的技术。 more

Fully Connected Layer(全连接层):每层神经元与上一层的所有神经元相连的网络层。 more

G

Gated Recurrent Unit(门控循环单元):一种比LSTM更简单的循环神经网络结构。 more

Gaussian Distribution(高斯分布):又称正态分布,是统计学中最重要的概率分布。 more

Gaussian Noise(高斯噪声):服从正态分布的随机噪声。 more

GBDT(梯度提升决策树):通过集成多个决策树来提升预测性能的算法。 more

Generalization(泛化):模型处理未见过的数据的能力。 more

Generative AI(生成式AI):能够创造新内容的AI,包括文本、图像、音频等。 more

Generative Adversarial Network(生成对抗网络):由生成器和判别器对抗训练生成逼真数据的模型。 more

Genetic Algorithm(遗传算法):模拟自然选择进行优化的启发式算法。 more

Gemma(Gemma模型):Google推出的开源大语言模型系列。 more

Gibbs Sampling(吉布斯采样):一种从多元概率分布中采样的 Markov Chain Monte Carlo 方法。 more

Global Average Pooling(全局平均池化):对特征图所有值求平均的池化操作。 more

Gradient(梯度):函数在某点处上升最快的方向向量。 more

Gradient Accumulation(梯度累积):通过累积多个小批次的梯度来模拟大批次训练的技术。 more

Gradient Clipping(梯度裁剪):限制梯度大小防止训练不稳定的技术。 more

Gradient Descent(梯度下降):优化算法,通过沿梯度方向迭代更新参数来最小化损失函数。 more

Graph Convolutional Network(图卷积网络):专门处理图结构数据的神经网络。 more

Graph Neural Network(图神经网络):在图结构上进行学习的神经网络。 more

Ground Truth(真实标签):训练数据中正确的标签或目标值。 more

GPT(生成式预训练Transformer):OpenAI开发的大语言模型系列。 more

GPU(图形处理器):最初用于游戏现广泛用于AI计算的并行处理器。 more

Gradient Boosting(梯度提升):通过逐步添加弱学习器来优化损失函数的集成方法。 more

Guardrail(护栏):防止AI模型输出不当内容的安全机制。 more

H

Hallucination(幻觉):AI模型生成看似合理但实际错误的内容现象。 more

Hard Negative Mining(困难负样本挖掘):选择难分类负样本进行训练的技术。 more

Hashing(哈希):将任意长度数据转换为固定长度值的函数。 more

Hebbian Learning(赫布学习):神经元之间"一起放电则连接加强"的学习规则。 more

Hidden Layer(隐藏层):输入层和输出层之间的神经网络层。 more

Hierarchical Attention Network(层次注意力网络):在不同粒度应用注意力的神经网络架构。 more

High-dimensional Data(高维数据):具有大量特征的数据,需要降维技术处理。 more

Hook(钩子):在神经网络中插入的用于提取中间层输出的机制。 more

Hopfield Network(霍普菲尔德网络):一种早期循环神经网络模型。 more

Human-in-the-Loop(人在回路):将人类反馈纳入AI训练和决策过程的方法。 more

Hyperparameter(超参数):需要人工设置的模型参数,如学习率、批量大小等。 more

Hyperparameter Tuning(超参数调优):系统搜索最优超参数组合的过程。 more

I

Image Classification(图像分类):判断图像属于哪个类别的任务。 more

Image Generation(图像生成):AI模型根据描述或条件创建新图像的能力。 more

Image Segmentation(图像分割):将图像划分为不同区域或对象的任务。 more

Image-to-Text(图像转文本):描述图像内容的任务,也叫图像 Captioning。 more

Imbalanced Data(不平衡数据):各类别样本数量差异较大的数据集。 more

Inference(推理):使用训练好的模型进行预测的过程。 more

Information Retrieval(信息检索):从大规模数据中找到相关信息的技术。 more

Instance Segmentation(实例分割):区分同类不同个体的图像分割任务。 more

Integer Programming(整数规划):变量取整数值的优化问题。 more

Integration(集成):组合多个模型以提升整体性能的方法。 more

Intent Detection(意图识别):理解用户想要完成什么任务的NLP任务。 more

Interactive Learning(交互式学习):通过人机交互获取标注数据的学习方式。 more

Interpolation(插值):在已知数据点之间估计未知点值的方法。 more

IoU(交并比):衡量目标检测框准确性的指标。 more

J

Jacobian Matrix(雅可比矩阵):一阶偏导数矩阵,描述函数局部线性近似。 more

JavaScript Object Notation(JSON):轻量级数据交换格式。 more

Joint Embedding(联合嵌入):将不同模态数据映射到同一向量空间的技术。 more

K

K-fold Cross Validation(K折交叉验证):将数据分成K份轮流作为验证集的评估方法。 more

K-means(K均值聚类):最常用的聚类算法,将数据分成K个簇。 more

K-nearest Neighbors(K近邻):根据最近K个邻居进行分类的简单算法。 more

Kernel(核函数):在特征空间中计算相似度的函数。 more

Kernel Method(核方法):使用核函数处理非线性问题的技术。 more

Knowledge Distillation(知识蒸馏):用大模型训练小模型的技术,实现模型压缩。 more

Knowledge Graph(知识图谱):用图结构表示实体和关系的大规模知识库。 more

Knowledge Retrieval(知识检索):从知识库中获取相关信息的技术。 more

Kubernetes(K8s):容器编排平台,用于部署和管理AI应用。 more

L

Label(标签):训练数据中表示正确类别的标记。 more

Label Smoothing(标签平滑):将硬标签转换为软概率分布的正则化技术。 more

LangChain(LangChain框架):开发LLM应用的流行框架。 more

LangGraph(LangGraph框架):用于构建有状态、多角色AI应用的框架。 more

Language Model(语言模型):预测文本序列概率的模型。 more

Latent Space(潜在空间):数据压缩后的低维表示空间。 more

Latent Variable(潜在变量):无法直接观测但影响可观测变量的变量。 more

Layer Normalization(层标准化):对单层神经元进行标准化的技术。 more

Learning Rate(学习率):决定参数更新幅度的超参数。 more

Least Squares(最小二乘法):通过最小化误差平方和进行参数估计的方法。 more

LLaMA(LLaMA模型):Meta开发的高性能开源大语言模型。 more

LLM(大语言模型):在海量文本上训练能理解和生成语言的巨型AI模型。 more

LORA(低秩适配):一种高效的模型微调技术,大幅减少训练参数量。 more

Loss Function(损失函数):衡量模型预测与真实值差异的函数,训练目标是最小化损失。 more

Long Short-Term Memory(长短期记忆网络):能够长期记忆信息的循环神经网络变体。 more

Low-rank Adaptation(低秩适配):通过低秩矩阵近似进行高效微调的技术。 more

LSTM(长短期记忆网络):能够长期记忆信息的循环神经网络变体。 more

M

Machine Learning(机器学习):让计算机通过数据学习并改进的AI分支。 more

Machine Translation(机器翻译):自动将一种语言翻译成另一种语言的技术。 more

Macro F1(宏F1分数):各类别F1分数的简单平均。 more

Marginal Probability(边缘概率):不考虑其他变量时单个变量的概率。 more

Markov Chain(马尔可夫链):未来只与当前状态有关的随机过程。 more

Masked Language Modeling(掩码语言建模):通过预测被遮挡词语来训练语言模型的方法。 more

Massively Multiplayer Online(大规模多人在线):支持大量用户同时交互的环境。 more

MatMul(矩阵乘法):线性代数中的基本运算,深度学习核心计算。 more

Max Pooling(最大池化):取区域中最大值进行下采样的操作。 more

Maximum Likelihood Estimation(最大似然估计):找到使观测数据概率最大的参数估计方法。 more

MC Dropout(蒙特卡洛Dropout):使用Dropout进行贝叶斯近似推断的方法。 more

MCP(模型上下文协议):Anthropic推出的AI工具集成标准协议。 more

Mean Absolute Error(平均绝对误差):预测误差绝对值的平均。 more

Mean Squared Error(均方误差):预测误差平方的平均,常用回归指标。 more

Memory-augmented Neural Network(记忆增强神经网络):结合外部存储的神经网络架构。 more

Meta-learning(元学习):学习如何学习的能力,让模型快速适应新任务。 more

Metric Learning(度量学习):学习有效距离度量来完成分类或检索任务。 more

Mixture of Experts(专家混合):组合多个专家网络处理不同输入的技术。 more

MLOps(机器学习运维):机器学习系统的开发、部署和维护实践。 more

Model Architecture(模型架构):神经网络的设计结构。 more

Model Card(模型卡片):记录模型用途、限制、性能等信息文档。 more

Model Distillation(模型蒸馏):用大模型训练小模型的技术,实现模型压缩。 more

Model Ensemble(模型集成):组合多个模型提升整体性能的技术。 more

Model Evaluation(模型评估):使用各种指标衡量模型性能的过程。 more

Model Interpretability(模型可解释性):理解和解释模型决策过程的能力。 more

Model Serving(模型服务):将模型部署为API提供服务的过程。 more

Model Versioning(模型版本管理):跟踪和管理不同版本模型的技术。 more

Momentum(动量):加速梯度下降的优化技术。 more

Monte Carlo Dropout(蒙特卡洛Dropout):使用Dropout进行贝叶斯近似推断的方法。 more

Multi-class Classification(多分类):将数据分为多个类别的预测任务。 more

Multi-head Attention(多头注意力):并行运行多个注意力机制的Transformer核心组件。 more

Multimodal(多模态):能同时处理文本、图像、音频等多种数据类型的AI能力。 more

Multimodal Learning(多模态学习):同时处理和关联多种模态数据的学习方法。 more

Multi-task Learning(多任务学习):同时学习多个相关任务以提升泛化能力。 more

N

Named Entity Recognition(命名实体识别):从文本中识别人名、地名、机构名等特定实体的NLP任务。 more

Natural Language Generation(自然语言生成):AI生成人类语言文本的能力。 more

Natural Language Inference(自然语言推理):判断两个句子逻辑关系的NLP任务。 more

Natural Language Processing(自然语言处理):让计算机理解和生成人类语言的AI技术。 more

Negative Sampling(负采样):在训练中随机选取负样本的技术,用于提高效率。 more

NER(命名实体识别):从文本中识别人名、地名、机构名等特定实体的NLP任务。 more

Neural Architecture Search(神经架构搜索):自动搜索最优神经网络结构的技术。 more

Neural Network(神经网络):受人脑启发的计算模型,由层层神经元组成。 more

Neural Turing Machine(神经图灵机):结合神经网络和外部存储的架构。 more

Node(节点):神经网络中的计算单元,接收输入并产生输出。 more

Noise(噪声):干扰数据的随机因素。 more

Noise Contrastive Estimation(噪声对比估计):一种高效训练词嵌入的技术。 more

Non-maximum Suppression(非极大值抑制):目标检测中去除冗余检测框的后处理技术。 more

Normalization(标准化):调整数据分布使其均值为0方差为1的处理。 more

Novelty Detection(异常检测):识别数据中新奇或异常模式的技术。 more

N-gram(N元语法):连续的N个词或字符组成的序列。 more

O

Object Detection(目标检测):在图像中定位并识别多个目标的技术。 more

Objective Function(目标函数):优化过程中要最大化或最小化的函数。 more

Oblivious Decision Tree( oblivious决策树):各层特征选择相互独立的决策树。 more

OCR(光学字符识别):将图像中的文字识别为可编辑文本的技术。 more

One-shot Learning(单样本学习):仅用一个样本就能识别新类别的能力。 more

One-hot Encoding(独热编码):用二进制向量表示分类变量的方法。 more

Online Learning(在线学习):数据流式到达时持续更新模型的训练方式。 more

Open-source Model(开源模型):公开代码和权重可自由使用的模型。 more

OpenAI(OpenAI):开发GPT系列模型的AI研究公司。 more

Operation Fusion(算子融合):合并多个计算操作以提高效率的技术。 more

Optimal Transport(最优传输):衡量概率分布差异的数学理论。 more

Optimization(优化):找到使目标函数最值的参数的过程。 more

Optimizer(优化器):更新模型参数以最小化损失函数的算法。 more

Oracle(神谕):在主动学习中提供真实标签的模拟器。 more

Ordinal Regression(有序回归):预测有顺序关系的离散类别。 more

Out-of-distribution(分布外):与训练数据分布不同的新数据。 more

Output Layer(输出层):神经网络最后一层,产生最终预测结果。 more

Overfitting(过拟合):模型在训练数据上表现好但泛化能力差的问题。 more

P

Padding(填充):在序列两端添加特殊标记使长度一致的处理。 more

PaLM(Pathways语言模型):Google开发的大语言模型。 more

Parallel Computing(并行计算):同时执行多个计算任务以加速处理。 more

Parameter(参数):模型内部可学习的权重值,通过训练获得。 more

Parameter Efficient Fine-tuning(参数高效微调):大幅减少微调所需计算资源的技术统称。 more

Parameter Sharing(参数共享):不同位置使用相同参数减少模型大小的技术。 more

Parsers(解析器):分析文本语法结构的NLP组件。 more

Partial Differential Equation(偏微分方程):包含多个变量偏导数的方程,在AI物理建模中常用。 more

PCA(主成分分析):最常用的降维方法,通过线性变换保留最大方差方向。 more

PEFT(参数高效微调):大幅减少微调所需计算资源的技术统称。 more

Perceptron(感知机):最简单的人工神经元模型。 more

Perplexity(困惑度):衡量语言模型预测不确定性的指标,越低越好。 more

Personalization(个性化):根据用户偏好定制AI服务的技术。 more

PII(个人身份信息):可以识别个人身份的数据,需要保护。 more

Pipeline(流水线):将多个处理步骤串联的工作流程。 more

Pixel(像素):图像的基本组成单元。 more

Planner(规划器):在Agent中负责制定行动计划的组件。 more

Pooling(池化):降采样减少特征图尺寸的操作。 more

Position Embedding(位置嵌入):为序列中每个位置添加位置信息的技术。 more

Post-training(后训练):在预训练之后进行的额外训练阶段。 more

Precision(精确率):预测为正的样本中实际为正的比例。 more

Prediction(预测):模型对新数据输出结果的过程。 more

Predictive Analytics(预测性分析):使用历史数据预测未来趋势的技术。 more

Pre-training(预训练):在大规模数据上训练基础模型的过程。 more

Pretrained Model(预训练模型):已在大规模数据上训练过的模型,可微调用于下游任务。 more

Principal Component Analysis(主成分分析):最常用的降维方法,通过线性变换保留最大方差方向。 more

Prior Probability(先验概率):根据先验知识确定的概率分布。 more

Probabilistic Model(概率模型):基于概率论构建的模型。 more

Probability Distribution(概率分布):描述随机变量可能取值及对应概率的函数。 more

Probing(探针分析):通过训练简单分类器探测预训练模型编码的知识。 more

Prompt(提示词):引导AI模型产生期望输出的输入文本。 more

Prompt Engineering(提示工程):设计最优输入提示词来引导AI模型输出的技术。 more

Prompt Injection(提示注入):通过恶意提示词操纵AI模型的技术。 more

Prompt Tuning(提示微调):通过学习提示向量来调整模型行为的技术。 more

Pruning(剪枝):移除神经网络中不重要权重或神经元以压缩模型。 more

Pseudo-labeling(伪标签):用模型预测作为标签训练其他数据的技术。 more

P-tuning(可学习提示):通过神经网络学习连续提示向量的技术。 more

Python(Python):AI领域最流行的编程语言。 more

PyTorch(PyTorch框架):Meta开源的深度学习框架。 more

Q

Q-function(Q函数):强化学习中评估状态-动作对价值的函数。 more

Quantization(量化):将模型参数从高精度转换为低精度的压缩技术。 more

Quantum Computing(量子计算):利用量子力学原理进行计算的新型计算范式。 more

Query(查询):向模型或数据库请求信息的操作。 more

Question Answering(问答):根据问题从给定文本或知识库中提取答案的NLP任务。 more

R

Random Forest(随机森林):通过集成多棵决策树提升性能的算法。 more

Random Walk(随机游走):每步随机选择方向的运动过程。 more

Ranking(排序):根据相关性对项目进行排序的任务。 more

RAG(检索增强生成):结合知识检索与AI生成的混合技术架构。 more

Recall(召回率):实际为正的样本中被正确预测为正的比例。 more

Recommendation System(推荐系统):根据用户兴趣推荐内容的系统。 more

Reconstruction Loss(重建损失):衡量模型重建原始数据能力的损失函数。 more

Rectified Linear Unit(ReLU):最常用的激活函数,负值输出0正值保持不变。 more

Recurrent Neural Network(循环神经网络):适合处理序列数据的神经网络架构。 more

Regression(回归):预测连续数值的任务。 more

Regularization(正则化):防止过拟合的约束技术。 more

Reinforcement Learning(强化学习):通过试错学习最优策略的机器学习方法。 more

Relation Extraction(关系抽取):从文本中识别实体之间关系的NLP任务。 more

Relationship Extraction(关系抽取):从文本中识别实体之间关系的NLP任务。 more

Representation Learning(表示学习):自动学习数据有效表示的技术。 more

Residual Block(残差块):包含跳跃连接的神经网络块,缓解梯度消失问题。 more

Residual Connection(残差连接):跳跃连接缓解深层网络训练困难的技术。 more

ResNet(残差网络):使用残差连接的深度卷积神经网络。 more

Resource Efficiency(资源效率):在有限计算资源下实现最优性能。 more

Response Generation(响应生成):AI根据输入生成回答的过程。 more

Retrieval Augmented Generation(检索增强生成):结合知识检索与AI生成的混合技术架构。 more

Reward Function(奖励函数):强化学习中评估行为好坏的函数。 more

RHO(检索增强优化):一种基于检索结果优化提示的技术。 more

RNN(循环神经网络):适合处理序列数据的神经网络架构。 more

Robustness(鲁棒性):AI模型面对噪声、对抗攻击等干扰时的稳定能力。 more

Role-playing(角色扮演):让AI模型扮演特定角色的提示技术。 more

Root Mean Square Propagation(RMSProp):自适应学习率的优化算法。 more

Router(路由):在多专家网络中决定使用哪个专家的组件。 more

S

S3(简单存储服务):AWS提供的云存储服务。 more

SageMaker(AWS SageMaker):AWS的机器学习平台。 more

Saliency Map(显著性图):显示输入中对输出最重要区域的图像。 more

Sample(样本):数据集中的单个数据点。 more

Sampling(采样):从分布中随机选取样本的过程。 more

Scalability(可扩展性):系统处理更大规模数据或用户的能力。 more

Score(分数):模型输出的原始数值,表示某种置信度。 more

Search Algorithm(搜索算法):在解空间中寻找最优解的算法。 more

Self-attention(自注意力):序列内部各位置相互注意的机制。 more

Self-consistency(自一致性):通过多次采样选择最一致答案的技术。 more

Self-supervised Learning(自监督学习):无需人工标注的从无标签数据学习的技术。 more

Semantic Analysis(语义分析):理解文本深层含义的NLP技术。 more

Semantic Role Labeling(语义角色标注):识别句子中主语、宾语、谓语等语义角色的任务。 more

Semantic Search(语义搜索):理解查询意图而非仅匹配关键词的搜索技术。 more

Semantic Segmentation(语义分割):对图像每个像素进行分类的任务。 more

Semi-supervised Learning(半监督学习):同时使用标注和未标注数据的学习方法。 more

Sentence Embedding(句子嵌入):将句子映射为向量的技术。 more

Sentiment Analysis(情感分析):判断文本情感倾向(正面、负面、中性)的NLP任务。 more

Sequence Generation(序列生成):生成文本、代码等序列数据的技术。 more

Sequence Modeling(序列建模):处理和预测序列数据的任务。 more

Sequence-to-Sequence(序列到序列):将一个序列映射到另一个序列的模型架构。 more

Serverless Computing(无服务器计算):无需管理服务器的云端执行模式。 more

Service Level Agreement(服务级别协议):服务质量的保证协议。 more

Serving(服务化):将模型部署为API供调用的过程。 more

SGD(随机梯度下降):每次用单个样本计算梯度的优化算法。 more

Sigmoid(Sigmoid函数):将数值映射到0到1之间的激活函数。 more

Similarity(相似度):衡量两个对象相近程度的指标。 more

Simulated Environment(模拟环境):在虚拟环境中训练AI的技术。 more

Singular Value Decomposition(奇异值分解):矩阵分解的常用方法,用于降维。 more

Skip-gram(Skip-gram模型):一种词嵌入训练架构。 more

Smoothing(平滑):处理数据中稀疏或零值的技术。 more

SNE(随机邻域嵌入):一种非线性降维技术。 more

Social Media Analysis(社交媒体分析):分析社交媒体内容的AI技术。 more

Soft Margin(软间隔):允许一定错误分类的SVM变体。 more

Softmax(Softmax函数):将数值转换为概率分布的函数,常用于多分类。 more

Software Engineering(软件工程):开发和维护软件系统的学科。 more

SOTA(最先进):当前最高水平或最佳性能。 more

Span Extraction(片段抽取):从文本中抽取特定片段回答问题的任务。 more

Spark(Spark):大数据处理框架。 more

Sparse Attention(稀疏注意力):只计算部分注意力权重的注意力机制。 more

Sparsity(稀疏性):大部分元素为0的特性。 more

Speech Recognition(语音识别):将语音转换为文字的技术。 more

Speech Synthesis(语音合成):将文字转换为语音的技术。 more

SQL(结构化查询语言):用于操作关系数据库的语言。 more

SQuAD(SQuAD数据集):著名的机器阅读理解数据集。 more

SSL(安全套接层):网络通信加密协议。 more

Stability(稳定性):模型对小扰动不敏感的特性。 more

Stack(堆栈):后进先出的数据结构。 more

State of the Art(最先进):当前最高水平或最佳性能。 more

Stochastic Gradient Descent(随机梯度下降):每次用单个样本计算梯度的优化算法。 more

Streaming(流式处理):实时处理连续数据流的技术。 more

Structured Data(结构化数据):具有明确定义格式的数据,如表格数据。 more

Structured Prediction(结构化预测):输出具有复杂结构(如树、图)的预测任务。 more

Style Transfer(风格迁移):将一种图像风格应用到另一图像的技术。 more

StyleGAN(风格生成对抗网络):能控制生成图像风格的高质量生成模型。 more

Supervised Learning(监督学习):使用标注数据进行训练的学习方法。 more

Support Vector Machine(支持向量机):通过找到最优分割超平面进行分类的算法。 more

Symbolic AI(符号AI):基于规则和逻辑的人工智能方法。 more

Synonym(同义词):意思相近的词语。 more

T

T5(文本到文本Transformer):将所有NLP任务统一为文本到文本格式的模型。 more

Tabular Data(表格数据):以表格形式组织的数据。 more

Tanh(双曲正切函数):将数值映射到-1到1之间的激活函数。 more

Target(目标):模型要预测的真实值或期望输出。 more

Task-specific Model(任务专用模型):针对特定任务优化的模型。 more

Token(词元):语言模型处理文本的最小单位。 more

Tokenization(分词):将文本分割为词元的过程。 more

Topic Modeling(主题建模):从文档集合中发现主题的统计方法。 more

Token Limit(词元限制):模型一次能处理的最大词元数量。 more

Top-k Sampling(Top-k采样):从最高概率的k个选项中随机选择的生成策略。 more

Training(训练):使用数据调整模型参数使模型学习模式的过程。 more

Training Data(训练数据):用于训练模型的标注数据。 more

Trajectory(轨迹):智能体在环境中一系列状态-动作序列。 more

Transfer Learning(迁移学习):将一个任务学到的知识应用到相关任务的技术。 more

Transformer(Transformer):基于注意力机制的革命性模型架构。 more

Translation(翻译):将一种语言转换为另一种语言的任务。 more

TREC(文本检索会议):信息检索领域的重要评测会议和数据集。 more

Tree Search(树搜索):在树结构中搜索最优解的算法。 more

Trend Analysis(趋势分析):识别数据中长期变化趋势的技术。 more

Triplet Loss(三元组损失):学习度量空间中样本相对距离的损失函数。 more

Trojan Attack(特洛伊木马攻击):在模型中植入恶意后门的攻击方式。 more

Tuning(调优):调整模型或系统参数以优化性能。 more

Turn-taking(对话轮次):多轮对话中角色交替的机制。 more

Two-tower Model(双塔模型):分别编码查询和文档的检索模型架构。 more

U

UMAP(统一流形近似与投影):高效的降维可视化技术。 more

Underfitting(欠拟合):模型过于简单,无法捕捉数据规律的问题。 more

Uniform Resource Locator(URL):网页地址。 more

Unsupervised Learning(无监督学习):使用无标签数据发现模式的学习方法。 more

Upsampling(上采样):增加数据分辨率的操作。 more

User Experience(用户体验):用户与产品交互的总体感受。 more

User Intent(用户意图):用户想要完成的目标或需求。 more

V

VAE(变分自编码器):使用变分推断的自编码器,可用于生成任务。 more

Validation Data(验证数据):用于调参和早停的独立数据集。 more

Vanishing Gradient(梯度消失):深层网络训练中梯度变得极小的问题。 more

Variational Inference(变分推断):使用变分分布近似后验分布的推断方法。 more

Vector(向量):具有大小和方向的数学对象。 more

Vector Database(向量数据库):专门存储和检索高维向量的数据库。 more

Vector Space(向量空间):向量构成的数学空间,用于表示语义。 more

Video Understanding(视频理解):理解和分析视频内容的AI技术。 more

Virtual Environment(虚拟环境):隔离的Python运行环境。 more

Vision and Language(视觉语言):同时处理图像和文本的多模态领域。 more

Vision Transformer(视觉Transformer):将Transformer架构应用于图像处理的模型。 more

VLM(视觉语言模型):能同时理解图像和文本的多模态模型。 more

Voice Assistant(语音助手):通过语音交互提供服务的AI程序。 more

W

Weight(权重):神经网络中连接节点的参数,决定输入的重要性。 more

Weight Decay(权重衰减):通过惩罚大权重防止过拟合的正则化技术。 more

Weights & Biases(W&B):机器学习实验跟踪工具。 more

Whitening(白化):使数据协方差矩阵为单位矩阵的预处理。 more

Word Embedding(词嵌入):将词语映射为向量的技术。 more

Word2Vec(词2向量):经典的词嵌入训练算法。 more

Wrapper(包装器):在模型外层添加功能的组件。 more

X

XGBoost(极端梯度提升):高效的梯度提升算法库。 more

Y

YAML(YAML不是标记语言):人类可读的数据序列化格式。 more

YOLO(YOLO目标检测):实时目标检测算法,以速度快著称。 more

Z

Zero-shot Learning(零样本学习):模型能够识别从未见过类别样本的能力。 more

Zero-shot Translation(零样本翻译):不经过语言对直接训练实现翻译。 more

Zeroshot(零样本):模型能够处理从未见过任务的能力。 more

ZKP(零知识证明):证明某事为真而不透露具体信息的加密技术。 more

附录:AI产品与系统

主流AI模型

GPT系列:OpenAI开发的大语言模型,包括GPT-3、GPT-4、GPT-4o等,在文本生成和理解方面表现卓越。 more

Claude系列:Anthropic公司开发的AI助手,以长文本处理和安全性著称。 more

Gemini:Google开发的多模态AI模型,原名Bard,能处理文本、图像、视频等多种模态。 more

LLaMA:Meta开源的大语言模型系列,参数规模从70亿到700亿不等。 more

Qwen:阿里巴巴开发的中文大语言模型系列。 more

DeepSeek:中国AI公司开发的高性能大语言模型。 more

Mistral:法国AI公司开发的高效大语言模型。 more

Groq:专注于快速推理的AI芯片和模型服务。 more

AI开发框架

LangChain:用于构建LLM应用的流行Python框架,提供链式调用、Agent、工具集成等功能。 more

LangGraph:用于构建有状态、多角色AI应用的框架,支持复杂工作流。 more

LlamaIndex:专注于数据连接的LLM框架,用于构建知识增强的应用。 more

AutoGen:微软开发的多Agent自动生成框架。 more

CrewAI:用于构建多Agent协作团队的框架。 more

OpenAI SDK:OpenAI官方提供的API客户端库。 more

Anthropic SDK:Claude模型的官方API客户端库。 more

AI部署与推理

Ollama:在本地运行大语言模型的工具,支持macOS、Linux、Windows。 more

vLLM:高效的大语言模型推理服务框架,支持PagedAttention。 more

TensorRT-LNVIDIA:的高性能深度学习推理引擎。 more

ONNX Runtime:跨平台的机器学习推理引擎。 more

LightLLM:基于Python的大语言模型推理框架。 more

FastAPI:Python高性能Web框架,常用于部署AI服务。 more

向量数据库

Pinecone:云原生向量数据库服务。 more

Weaviate:开源向量搜索引擎,支持GraphQL API。 more

Milvus:开源向量数据库,由Linux基金会托管。 more

Chroma:开源嵌入式向量数据库,为LLM应用设计。 more

Faiss:Facebook开源的向量检索库。 more

Qdrant:开源向量数据库,支持云原生部署。 more

AI应用平台

OpenClaw:企业级AI Agent开发平台,支持快速构建智能应用。 more

LangChain平台:LangChain官方提供的云端LLM应用开发平台。 more

Hugging Face:最大的开源机器学习社区和模型托管平台。 more

Replicate:云端运行开源AI模型的平台。 more

Runway:AI视频生成和编辑平台。 more

Midjourney:通过文字描述生成图像的AI工具。 more

Stable Diffusion:开源的文生图模型,可本地部署。 more

AI开发工具

Cursor:基于AI的代码编辑器,集成GPT-4能力。 more

GitHub Copilot:微软的AI编程助手,集成在VS Code中。 more

Amazon SageMaker:AWS的全托管机器学习平台。 more

Google Vertex AI:Google Cloud的机器学习平台。 more

Azure Machine Learning:微软Azure的机器学习平台。 more

Weights & Biases:机器学习实验跟踪和模型可视化工具。 more

MLflow:开源的机器学习生命周期管理平台。 more

Comet:机器学习实验管理平台。 more

AI开发组件

OpenAPI:用于描述RESTful API的规范,AI服务多通过OpenAPI暴露接口。 more

GraphQL:API查询语言,AI应用常用于灵活获取数据。 more

gRPC:高性能RPC框架,AI服务间通信常用。 more

Docker:容器化技术,用于AI应用打包和部署。 more

Kubernetes:容器编排平台,用于AI服务自动化部署和扩缩容。 more

Prompt工程工具

PromptPerfect:专业的提示词优化工具。 more

PromptBase:提示词交易和分享平台。 more

PromptFlow:Microsoft的提示词工程工具。 more

AI安全与伦理

AI Safety:确保AI系统安全可靠的研究领域。 more

Responsible AI:负责任AI开发和部署的实践和原则。 more

AI Alignment:确保AI目标与人类价值观一致的研究。 more

Red Teaming:通过模拟攻击测试AI系统安全性的方法。 more

Bias Detection:检测AI系统中偏见的技术。 more

AI评估与基准

HELM:大语言模型综合评估基准。 more

MMLU:大规模多任务语言理解测试。 more

HumanEval:代码生成能力评估数据集。 more

MMLU:多任务语言理解基准。 more

GLUE:自然语言理解基准套件。 more

SuperGLUE:比GLUE更具挑战性的NLP基准。 more

AI智能体相关

Agent Framework:构建AI智能体的软件框架。 more

Tool Use:AI模型调用外部工具的能力。 more

Memory System:AI智能体的记忆系统,用于存储和检索信息。 more

Planning:AI智能体的规划能力,用于分解复杂任务。 more

Reflection:AI智能体的反思能力,用于自我改进。 more

ReAct:结合推理和行动的AI框架。 more

AI工作流

AI Pipeline:从数据处理到模型部署的完整流程。 more

ETL Pipeline:数据抽取、转换、加载流程,AI数据处理基础。 more

Data Pipeline:数据处理和流转的自动化流程。 more

CI/CD Pipeline:持续集成和持续部署,AI模型发布自动化。 more

ML Pipeline:机器学习模型训练和部署流水线。 more

AI云服务

AWS AI Services:Amazon的AI服务系列,包括Rekognition、Polly、Lex等。 more

Google AI Services:Google Cloud的AI服务。 more

Azure AI Services:Microsoft Azure的AI服务。 more

阿里云AI:阿里巴巴的AI开放平台。 more

腾讯云AI:腾讯云的AI服务。 more

百度智能云:百度的AI开放平台。 more

AI开发资源

arXiv:AI领域最新研究论文预印本平台。 more

Papers with Code:带代码的AI论文集。 more

GitHub:全球最大开源代码平台,AI项目聚集地。 more

Kaggle:数据科学和机器学习竞赛平台。 more

Model Zoo:预训练模型仓库。 more

AI News:AI行业新闻资讯网站。 more

AI学习资源

DeepLearning.AI:Andrew Ng创办的AI学习平台。 more

Fast.ai:免费深度学习课程。 more

CS231n:斯坦福视觉识别课程。 more

CS224n:斯坦福NLP课程。 more

Google ML Courses:Google的免费机器学习课程。 more

AI行业术语

AI winters:AI发展史上的低谷期。 more

AI boom:AI快速发展和投资热潮期。 more

Edge AI:在终端设备上运行的AI。 more

On-premise AI:本地部署的AI系统。 more

SaaS AI:作为服务提供的AI能力。 more

AI Marketplace:AI模型和服务的交易平台。 more

AI as a Service(AIaaS):AI即服务,通过云端API提供AI能力。 more

AI相关组织

OpenAI:AI研究和部署公司,开发GPT系列。 more

Anthropic:AI安全公司,开发Claude。 more

DeepMind:Google旗下AI研究公司,开发AlphaGo。 more

Meta AI:Meta的AI研究部门。 more

Google DeepMind:Google和DeepMind合并后的AI研究部门。 more

Microsoft Research:微软研究院,AI基础研究。 more

Stanford HAI:斯坦福人本人工智能研究院。 more

MIT CSAIL:麻省理工计算机与人工智能实验室。 more

AI认证与标准

AWS AI Certification:Amazon的AI认证。 more

Google Cloud AI Certification:Google Cloud的AI认证。 more

TensorFlow Developer Certificate:TensorFlow开发者认证。 more

PyTorch Certification:PyTorch开发者认证。 more