Appearance
AI 术语速查表
本文档收录了人工智能领域最常用的专业术语,每个术语都配有通俗易懂的一句话解释,并附上官方文档或权威资料链接,方便快速查阅。
A
AaaS(智能体即服务):指将AI智能体封装为可订阅服务的商业模式,用户通过API调用即可获得智能化能力。 more
A/B Testing(A/B测试):比较两个或多个模型版本以确定哪个表现更好的实验方法。 more
Accuracy(准确率):正确预测占总预测的比例,评估分类模型最常用的指标之一。 more
Activation Function(激活函数):神经网络中决定神经元是否被激活的数学函数,常用的有ReLU、Sigmoid、Tanh等。 more
AdaBoost(自适应提升):一种集成学习方法,通过组合多个弱分类器形成强分类器。 more
Adapter(适配器):插入预训练模型中用于微调的小型可训练模块,可实现多任务学习。 more
AdapterFusion(适配器融合):一种多任务学习技术,在不同任务适配器之间传递知识。 more
Adversarial Attack(对抗攻击):通过精心设计的输入来欺骗AI模型的攻击方式。 more
Adversarial Training(对抗训练):使用对抗样本来增强模型鲁棒性的训练方法。 more
Agent(智能体):一种能够自主感知环境、做出决策并执行行动的AI程序,就像一个可以独立完成任务的数字员工。 more
AI Compiler(AI编译器):将AI模型转换为可在特定硬件上高效运行的代码的工具。 more
AI Inference(AI推理):使用训练好的模型对新数据进行预测的过程。 more
AI Model Compression(模型压缩):通过剪枝、量化、蒸馏等技术减小模型体积和计算量的方法。 more
AI Pipeline(AI流水线):指从数据准备、模型训练、评估到部署的完整自动化流程,就像一条高效的生产线。 more
Algorithm(算法):解决问题或完成任务的明确步骤和规则集合。 more
Alignment(对齐):确保AI模型输出符合人类价值观和意图的技术。 more
ALM(阿凡达语言模型):Anthropic公司开发的大语言模型系列。 more
Anchor Boxes(锚框):目标检测中预设的参考框,用于检测不同尺度和形状的目标。 more
Anomaly Detection(异常检测):识别数据中异常或罕见模式的技术。 more
Anti-overfitting(防过拟合):防止模型过度记忆训练数据而丧失泛化能力的各种技术。 more
API(应用程序接口):不同软件之间交换数据和功能的桥梁。 more
Argmax(_argmax函数):返回使函数值最大化的参数值的运算,常用于分类预测。 more
Artificial General Intelligence(通用人工智能):指具有人类智能水平、能完成任何智能任务的AI系统,被视为AI发展的终极目标。 more
Artificial Intelligence(人工智能):让计算机模拟、延伸和扩展人类智能的技术科学。 more
Attention Mechanism(注意力机制):让AI模型在处理信息时学会"抓住重点"的技术,就像人类阅读时会重点关注关键信息。 more
Augmented Reality(增强现实):将虚拟信息叠加到真实世界画面中的技术。 more
AutoAugment(自动数据增强):自动搜索最优数据增强策略的技术。 more
Autoencoder(自编码器):一种无监督学习模型,通过压缩和重构数据来学习有效特征表示。 more
Automated ML(自动化机器学习):自动完成机器学习模型设计和调参的技术,让非专家也能轻松训练AI模型。 more
Auxiliary Task(辅助任务):在多任务学习中帮助主任务学习的额外任务。 more
B
Backpropagation(反向传播):训练神经网络时的核心算法,通过计算梯度来调整模型参数使预测更准确。 more
Bagging(装袋法):通过并行训练多个模型并集成结果来提高稳定性和准确性的方法。 more
Base Model(基础模型):在大规模数据上预训练、可以被微调适配各种任务的模型。 more
Batch(批次):一次训练中同时处理的一组样本。 more
Batch Normalization(批标准化):一种加速神经网络训练的技术,通过标准化每层输入来稳定训练过程。 more
Bayesian Optimization(贝叶斯优化):一种高效的超参数调优方法,利用概率模型指导搜索。 more
Benchmark(基准测试):用于评估模型性能的标准化测试数据集和评估协议。 more
BERT(BERT模型):谷歌推出的革命性语言理解模型,能够双向理解文本上下文。 more
Bias(偏差/偏置):AI模型中的系统性误差,可能导致对某些群体的不公平对待。 more
Bidirectional(双向):能够同时考虑前后文信息进行处理的模型架构。 more
Big Data(大数据):指规模巨大、类型多样的数据集合,需要特殊技术处理。 more
Binary Classification(二分类):将数据分为两类的预测任务。 more
BPE(字节对编码):一种常用的文本分词方法,将词拆分为子词单元。 more
Bucket(桶):将连续值离散化到多个区间进行处理的技术。 more
C
Calibration(校准):调整模型输出概率,使其更接近真实概率分布的技术。 more
Causal Inference(因果推断):分析变量之间因果关系而非仅仅相关性的统计方法。 more
Chain of Thought(思维链):让AI模型展示推理步骤的技术,可以提高复杂问题的解决能力。 more
Chatbot(聊天机器人):能够与用户进行对话交互的AI程序。 more
Checkpointer(检查点保存):在训练过程中定期保存模型状态以便恢复的技术。 more
Chinchilla(Chinchilla模型):DeepMind开发的高效大语言模型,展示了最优训练计算分配策略。 more
Chunking(分块):将长文本或长序列分割成较小组块进行处理的技术。 more
Classification(分类):预测数据属于哪个类别的任务。 more
CLIP(CLIP模型):OpenAI开发的多模态模型,能理解图像和文本的关系。 more
Clustering(聚类):将相似数据分组无监督学习方法。 more
CNN(卷积神经网络):专门用于处理图像的神经网络架构,能够自动提取图像特征。 more
Code Generation(代码生成):AI模型根据描述自动编写程序代码的能力。 more
Cognitive Architecture(认知架构):模拟人类思维过程的AI系统设计框架。 more
Computer Vision(计算机视觉):让计算机理解和处理图像/视频的AI技术领域。 more
Conditional Generation(条件生成):在给定特定条件下生成内容的技术。 more
Confidence Interval(置信区间):对预测结果不确定性范围的量化表示。 more
Confusion Matrix(混淆矩阵):展示分类模型预测结果与真实标签对应关系的表格。 more
Conjugate Gradient(共轭梯度):一种求解线性方程组的迭代优化算法。 more
Contrastive Learning(对比学习):一种自监督学习技术,通过比较相似和不同样本来学习有效特征。 more
Convex Optimization(凸优化):目标函数为凸函数的优化问题研究领域。 more
Convolution(卷积):卷积神经网络中用于提取图像特征的核心运算。 more
Copilot(副驾驶):微软推出的AI辅助编程工具,帮助开发者编写代码。 more
Cost Function(成本函数):衡量模型预测与真实值差异的函数,训练目标是最小化成本。 more
Cross-Entropy Loss(交叉熵损失):衡量模型预测概率与真实概率差异的常用损失函数。 more
Cross-Validation(交叉验证):通过多次划分数据来评估模型稳定性的技术。 more
CUDA(统一计算设备架构):NVIDIA推出的并行计算平台和编程模型。 more
Custom Model(定制模型):针对特定任务或领域定制的AI模型。 more
D
DALL·E(DALL·E模型):OpenAI开发的文生图模型,根据文本描述生成图像。 more
Data Augmentation(数据增强):通过变换原始数据来增加训练样本数量的技术。 more
Data Engineering(数据工程):构建和维护数据处理流水线的工程技术。 more
Data Mining(数据挖掘):从大量数据中发现模式和规律的技术。 more
Data Pipeline(数据流水线):自动化数据收集、清洗、转换和加载的流程。 more
Data Processing(数据处理):对原始数据进行清洗、转换和组织的操作。 more
Data Warehouse(数据仓库):专门用于分析和查询的结构化数据存储系统。 more
Dataset(数据集):用于训练和评估模型的样本集合。 more
DeBERTa(DeBERTa模型):微软开发的高性能BERT变体,在多项NLP任务上表现优异。 more
Decision Boundary(决策边界):分类模型区分不同类别样本的分界线或超平面。 more
Decision Tree(决策树):通过树状结构进行决策预测的模型。 more
Deep Learning(深度学习):使用多层神经网络学习数据特征的机器学习方法。 more
Deepfake(深度伪造):利用AI技术生成逼真的伪造视频或音频。 more
DeepMind(DeepMind):Alphabet旗下AI研究公司,开发了AlphaGo等著名AI系统。 more
Denoising(去噪):从信号中移除噪声的技术,在生成模型中用于从噪声恢复清晰内容。 more
Deployment(部署):将训练好的模型应用到生产环境提供服务的过程。 more
Descriptive Analytics(描述性分析):分析过去数据以了解发生了什么的技术。 more
DevOps(开发运维):结合软件开发与系统运维的实践方法论。 more
Differential Privacy(差分隐私):在保护隐私前提下进行数据分析的技术框架。 more
Differentiable Programming(可微编程):通过自动微分实现的可学习程序设计范式。 more
Diffusion Model(扩散模型):通过逐步去噪生成内容的生成模型架构。 more
Digit Recognition(数字识别):识别手写数字的经典计算机视觉任务。 more
Dimensionality Reduction(降维):减少数据特征维度同时保留关键信息的技术。 more
Distributed Training(分布式训练):在多台机器上并行训练模型以加速和扩展规模的技术。 more
Domain Adaptation(领域适配):将模型从一个领域迁移到另一个相关领域的技术。 more
Domain Knowledge(领域知识):特定专业领域的专业知识。 more
Dropout(Dropout正则化):防止神经网络过拟合的技术,随机丢弃部分神经元。 more
Dynamic Routing(动态路由):根据输入动态决定信息流向的技术,如胶囊网络。 more
E
Early Stopping(早停):当验证集性能不再提升时停止训练防止过拟合的技术。 more
Edge Computing(边缘计算):在数据源附近进行计算处理的技术,减少延迟和带宽需求。 more
Edit Distance(编辑距离):将一个字符串转换为另一个所需的最少编辑操作次数。 more
Efficiency(效率):在有限资源下实现最优性能的能力。 more
Eigenvalue(特征值):线性代数中矩阵的重要性质,在PCA等降维技术中用到。 more
ELBO(变分下界):变分推断中的核心优化目标。 more
Embedding(嵌入):将高维数据转换为低维向量的技术,便于计算相似度。 more
Emergent Ability(涌现能力):模型规模增大后突然出现的新能力。 more
End-to-End Learning(端到端学习):直接从原始输入学习到最终输出的训练范式。 more
Entity Recognition(实体识别):从文本中识别出人名、地名、机构名等实体的NLP任务。 more
Epoch(轮次):完整遍历一次训练数据集的过程。 more
Error Analysis(错误分析):系统分析模型预测错误模式的方法。 more
ETL(抽取转换加载):数据工程中收集、清洗、存储数据的标准流程。 more
Evaluation Metric(评估指标):量化模型性能的标准,如准确率、F1分数等。 more
Example Prompting(示例提示):在提示中包含输入输出示例来引导模型输出。 more
Explanatory Analysis(解释性分析):理解数据背后原因和机制的分析方法。 more
Explainable AI(可解释AI):让AI决策过程透明可理解的技术。 more
Exponential Moving Average(指数移动平均):一种对数据序列进行平滑处理的方法。 more
F
F1 Score(F1分数):精确率和召回率的调和平均数,综合评估分类性能。 more
Face Recognition(人脸识别):识别和验证人脸身份的计算机视觉技术。 more
Few-shot Learning(少样本学习):仅用极少样本就能学习新任务的能力。 more
Fine-tuning(微调):在预训练模型基础上,用特定数据继续训练以适应新任务。 more
Flatten(展平):将多维数组转换为一维数组的操作,常用于图像数据预处理。 more
FLOPs(浮点运算次数):衡量模型计算复杂度的指标。 more
Forecasting(预测):基于历史数据预测未来趋势的任务。 more
Foundation Model(基础模型):在大规模数据上预训练、可适配多种任务的AI模型。 more
Fourier Transform(傅里叶变换):将信号分解为不同频率成分的数学变换。 more
Fraud Detection(欺诈检测):识别异常交易或行为以防止欺诈的技术。 more
Fully Connected Layer(全连接层):每层神经元与上一层的所有神经元相连的网络层。 more
G
Gated Recurrent Unit(门控循环单元):一种比LSTM更简单的循环神经网络结构。 more
Gaussian Distribution(高斯分布):又称正态分布,是统计学中最重要的概率分布。 more
Gaussian Noise(高斯噪声):服从正态分布的随机噪声。 more
GBDT(梯度提升决策树):通过集成多个决策树来提升预测性能的算法。 more
Generalization(泛化):模型处理未见过的数据的能力。 more
Generative AI(生成式AI):能够创造新内容的AI,包括文本、图像、音频等。 more
Generative Adversarial Network(生成对抗网络):由生成器和判别器对抗训练生成逼真数据的模型。 more
Genetic Algorithm(遗传算法):模拟自然选择进行优化的启发式算法。 more
Gemma(Gemma模型):Google推出的开源大语言模型系列。 more
Gibbs Sampling(吉布斯采样):一种从多元概率分布中采样的 Markov Chain Monte Carlo 方法。 more
Global Average Pooling(全局平均池化):对特征图所有值求平均的池化操作。 more
Gradient(梯度):函数在某点处上升最快的方向向量。 more
Gradient Accumulation(梯度累积):通过累积多个小批次的梯度来模拟大批次训练的技术。 more
Gradient Clipping(梯度裁剪):限制梯度大小防止训练不稳定的技术。 more
Gradient Descent(梯度下降):优化算法,通过沿梯度方向迭代更新参数来最小化损失函数。 more
Graph Convolutional Network(图卷积网络):专门处理图结构数据的神经网络。 more
Graph Neural Network(图神经网络):在图结构上进行学习的神经网络。 more
Ground Truth(真实标签):训练数据中正确的标签或目标值。 more
GPT(生成式预训练Transformer):OpenAI开发的大语言模型系列。 more
GPU(图形处理器):最初用于游戏现广泛用于AI计算的并行处理器。 more
Gradient Boosting(梯度提升):通过逐步添加弱学习器来优化损失函数的集成方法。 more
Guardrail(护栏):防止AI模型输出不当内容的安全机制。 more
H
Hallucination(幻觉):AI模型生成看似合理但实际错误的内容现象。 more
Hard Negative Mining(困难负样本挖掘):选择难分类负样本进行训练的技术。 more
Hashing(哈希):将任意长度数据转换为固定长度值的函数。 more
Hebbian Learning(赫布学习):神经元之间"一起放电则连接加强"的学习规则。 more
Hidden Layer(隐藏层):输入层和输出层之间的神经网络层。 more
Hierarchical Attention Network(层次注意力网络):在不同粒度应用注意力的神经网络架构。 more
High-dimensional Data(高维数据):具有大量特征的数据,需要降维技术处理。 more
Hook(钩子):在神经网络中插入的用于提取中间层输出的机制。 more
Hopfield Network(霍普菲尔德网络):一种早期循环神经网络模型。 more
Human-in-the-Loop(人在回路):将人类反馈纳入AI训练和决策过程的方法。 more
Hyperparameter(超参数):需要人工设置的模型参数,如学习率、批量大小等。 more
Hyperparameter Tuning(超参数调优):系统搜索最优超参数组合的过程。 more
I
Image Classification(图像分类):判断图像属于哪个类别的任务。 more
Image Generation(图像生成):AI模型根据描述或条件创建新图像的能力。 more
Image Segmentation(图像分割):将图像划分为不同区域或对象的任务。 more
Image-to-Text(图像转文本):描述图像内容的任务,也叫图像 Captioning。 more
Imbalanced Data(不平衡数据):各类别样本数量差异较大的数据集。 more
Inference(推理):使用训练好的模型进行预测的过程。 more
Information Retrieval(信息检索):从大规模数据中找到相关信息的技术。 more
Instance Segmentation(实例分割):区分同类不同个体的图像分割任务。 more
Integer Programming(整数规划):变量取整数值的优化问题。 more
Integration(集成):组合多个模型以提升整体性能的方法。 more
Intent Detection(意图识别):理解用户想要完成什么任务的NLP任务。 more
Interactive Learning(交互式学习):通过人机交互获取标注数据的学习方式。 more
Interpolation(插值):在已知数据点之间估计未知点值的方法。 more
IoU(交并比):衡量目标检测框准确性的指标。 more
J
Jacobian Matrix(雅可比矩阵):一阶偏导数矩阵,描述函数局部线性近似。 more
JavaScript Object Notation(JSON):轻量级数据交换格式。 more
Joint Embedding(联合嵌入):将不同模态数据映射到同一向量空间的技术。 more
K
K-fold Cross Validation(K折交叉验证):将数据分成K份轮流作为验证集的评估方法。 more
K-means(K均值聚类):最常用的聚类算法,将数据分成K个簇。 more
K-nearest Neighbors(K近邻):根据最近K个邻居进行分类的简单算法。 more
Kernel(核函数):在特征空间中计算相似度的函数。 more
Kernel Method(核方法):使用核函数处理非线性问题的技术。 more
Knowledge Distillation(知识蒸馏):用大模型训练小模型的技术,实现模型压缩。 more
Knowledge Graph(知识图谱):用图结构表示实体和关系的大规模知识库。 more
Knowledge Retrieval(知识检索):从知识库中获取相关信息的技术。 more
Kubernetes(K8s):容器编排平台,用于部署和管理AI应用。 more
L
Label(标签):训练数据中表示正确类别的标记。 more
Label Smoothing(标签平滑):将硬标签转换为软概率分布的正则化技术。 more
LangChain(LangChain框架):开发LLM应用的流行框架。 more
LangGraph(LangGraph框架):用于构建有状态、多角色AI应用的框架。 more
Language Model(语言模型):预测文本序列概率的模型。 more
Latent Space(潜在空间):数据压缩后的低维表示空间。 more
Latent Variable(潜在变量):无法直接观测但影响可观测变量的变量。 more
Layer Normalization(层标准化):对单层神经元进行标准化的技术。 more
Learning Rate(学习率):决定参数更新幅度的超参数。 more
Least Squares(最小二乘法):通过最小化误差平方和进行参数估计的方法。 more
LLaMA(LLaMA模型):Meta开发的高性能开源大语言模型。 more
LLM(大语言模型):在海量文本上训练能理解和生成语言的巨型AI模型。 more
LORA(低秩适配):一种高效的模型微调技术,大幅减少训练参数量。 more
Loss Function(损失函数):衡量模型预测与真实值差异的函数,训练目标是最小化损失。 more
Long Short-Term Memory(长短期记忆网络):能够长期记忆信息的循环神经网络变体。 more
Low-rank Adaptation(低秩适配):通过低秩矩阵近似进行高效微调的技术。 more
LSTM(长短期记忆网络):能够长期记忆信息的循环神经网络变体。 more
M
Machine Learning(机器学习):让计算机通过数据学习并改进的AI分支。 more
Machine Translation(机器翻译):自动将一种语言翻译成另一种语言的技术。 more
Macro F1(宏F1分数):各类别F1分数的简单平均。 more
Marginal Probability(边缘概率):不考虑其他变量时单个变量的概率。 more
Markov Chain(马尔可夫链):未来只与当前状态有关的随机过程。 more
Masked Language Modeling(掩码语言建模):通过预测被遮挡词语来训练语言模型的方法。 more
Massively Multiplayer Online(大规模多人在线):支持大量用户同时交互的环境。 more
MatMul(矩阵乘法):线性代数中的基本运算,深度学习核心计算。 more
Max Pooling(最大池化):取区域中最大值进行下采样的操作。 more
Maximum Likelihood Estimation(最大似然估计):找到使观测数据概率最大的参数估计方法。 more
MC Dropout(蒙特卡洛Dropout):使用Dropout进行贝叶斯近似推断的方法。 more
MCP(模型上下文协议):Anthropic推出的AI工具集成标准协议。 more
Mean Absolute Error(平均绝对误差):预测误差绝对值的平均。 more
Mean Squared Error(均方误差):预测误差平方的平均,常用回归指标。 more
Memory-augmented Neural Network(记忆增强神经网络):结合外部存储的神经网络架构。 more
Meta-learning(元学习):学习如何学习的能力,让模型快速适应新任务。 more
Metric Learning(度量学习):学习有效距离度量来完成分类或检索任务。 more
Mixture of Experts(专家混合):组合多个专家网络处理不同输入的技术。 more
MLOps(机器学习运维):机器学习系统的开发、部署和维护实践。 more
Model Architecture(模型架构):神经网络的设计结构。 more
Model Card(模型卡片):记录模型用途、限制、性能等信息文档。 more
Model Distillation(模型蒸馏):用大模型训练小模型的技术,实现模型压缩。 more
Model Ensemble(模型集成):组合多个模型提升整体性能的技术。 more
Model Evaluation(模型评估):使用各种指标衡量模型性能的过程。 more
Model Interpretability(模型可解释性):理解和解释模型决策过程的能力。 more
Model Serving(模型服务):将模型部署为API提供服务的过程。 more
Model Versioning(模型版本管理):跟踪和管理不同版本模型的技术。 more
Momentum(动量):加速梯度下降的优化技术。 more
Monte Carlo Dropout(蒙特卡洛Dropout):使用Dropout进行贝叶斯近似推断的方法。 more
Multi-class Classification(多分类):将数据分为多个类别的预测任务。 more
Multi-head Attention(多头注意力):并行运行多个注意力机制的Transformer核心组件。 more
Multimodal(多模态):能同时处理文本、图像、音频等多种数据类型的AI能力。 more
Multimodal Learning(多模态学习):同时处理和关联多种模态数据的学习方法。 more
Multi-task Learning(多任务学习):同时学习多个相关任务以提升泛化能力。 more
N
Named Entity Recognition(命名实体识别):从文本中识别人名、地名、机构名等特定实体的NLP任务。 more
Natural Language Generation(自然语言生成):AI生成人类语言文本的能力。 more
Natural Language Inference(自然语言推理):判断两个句子逻辑关系的NLP任务。 more
Natural Language Processing(自然语言处理):让计算机理解和生成人类语言的AI技术。 more
Negative Sampling(负采样):在训练中随机选取负样本的技术,用于提高效率。 more
NER(命名实体识别):从文本中识别人名、地名、机构名等特定实体的NLP任务。 more
Neural Architecture Search(神经架构搜索):自动搜索最优神经网络结构的技术。 more
Neural Network(神经网络):受人脑启发的计算模型,由层层神经元组成。 more
Neural Turing Machine(神经图灵机):结合神经网络和外部存储的架构。 more
Node(节点):神经网络中的计算单元,接收输入并产生输出。 more
Noise(噪声):干扰数据的随机因素。 more
Noise Contrastive Estimation(噪声对比估计):一种高效训练词嵌入的技术。 more
Non-maximum Suppression(非极大值抑制):目标检测中去除冗余检测框的后处理技术。 more
Normalization(标准化):调整数据分布使其均值为0方差为1的处理。 more
Novelty Detection(异常检测):识别数据中新奇或异常模式的技术。 more
N-gram(N元语法):连续的N个词或字符组成的序列。 more
O
Object Detection(目标检测):在图像中定位并识别多个目标的技术。 more
Objective Function(目标函数):优化过程中要最大化或最小化的函数。 more
Oblivious Decision Tree( oblivious决策树):各层特征选择相互独立的决策树。 more
OCR(光学字符识别):将图像中的文字识别为可编辑文本的技术。 more
One-shot Learning(单样本学习):仅用一个样本就能识别新类别的能力。 more
One-hot Encoding(独热编码):用二进制向量表示分类变量的方法。 more
Online Learning(在线学习):数据流式到达时持续更新模型的训练方式。 more
Open-source Model(开源模型):公开代码和权重可自由使用的模型。 more
OpenAI(OpenAI):开发GPT系列模型的AI研究公司。 more
Operation Fusion(算子融合):合并多个计算操作以提高效率的技术。 more
Optimal Transport(最优传输):衡量概率分布差异的数学理论。 more
Optimization(优化):找到使目标函数最值的参数的过程。 more
Optimizer(优化器):更新模型参数以最小化损失函数的算法。 more
Oracle(神谕):在主动学习中提供真实标签的模拟器。 more
Ordinal Regression(有序回归):预测有顺序关系的离散类别。 more
Out-of-distribution(分布外):与训练数据分布不同的新数据。 more
Output Layer(输出层):神经网络最后一层,产生最终预测结果。 more
Overfitting(过拟合):模型在训练数据上表现好但泛化能力差的问题。 more
P
Padding(填充):在序列两端添加特殊标记使长度一致的处理。 more
PaLM(Pathways语言模型):Google开发的大语言模型。 more
Parallel Computing(并行计算):同时执行多个计算任务以加速处理。 more
Parameter(参数):模型内部可学习的权重值,通过训练获得。 more
Parameter Efficient Fine-tuning(参数高效微调):大幅减少微调所需计算资源的技术统称。 more
Parameter Sharing(参数共享):不同位置使用相同参数减少模型大小的技术。 more
Parsers(解析器):分析文本语法结构的NLP组件。 more
Partial Differential Equation(偏微分方程):包含多个变量偏导数的方程,在AI物理建模中常用。 more
PCA(主成分分析):最常用的降维方法,通过线性变换保留最大方差方向。 more
PEFT(参数高效微调):大幅减少微调所需计算资源的技术统称。 more
Perceptron(感知机):最简单的人工神经元模型。 more
Perplexity(困惑度):衡量语言模型预测不确定性的指标,越低越好。 more
Personalization(个性化):根据用户偏好定制AI服务的技术。 more
PII(个人身份信息):可以识别个人身份的数据,需要保护。 more
Pipeline(流水线):将多个处理步骤串联的工作流程。 more
Pixel(像素):图像的基本组成单元。 more
Planner(规划器):在Agent中负责制定行动计划的组件。 more
Pooling(池化):降采样减少特征图尺寸的操作。 more
Position Embedding(位置嵌入):为序列中每个位置添加位置信息的技术。 more
Post-training(后训练):在预训练之后进行的额外训练阶段。 more
Precision(精确率):预测为正的样本中实际为正的比例。 more
Prediction(预测):模型对新数据输出结果的过程。 more
Predictive Analytics(预测性分析):使用历史数据预测未来趋势的技术。 more
Pre-training(预训练):在大规模数据上训练基础模型的过程。 more
Pretrained Model(预训练模型):已在大规模数据上训练过的模型,可微调用于下游任务。 more
Principal Component Analysis(主成分分析):最常用的降维方法,通过线性变换保留最大方差方向。 more
Prior Probability(先验概率):根据先验知识确定的概率分布。 more
Probabilistic Model(概率模型):基于概率论构建的模型。 more
Probability Distribution(概率分布):描述随机变量可能取值及对应概率的函数。 more
Probing(探针分析):通过训练简单分类器探测预训练模型编码的知识。 more
Prompt(提示词):引导AI模型产生期望输出的输入文本。 more
Prompt Engineering(提示工程):设计最优输入提示词来引导AI模型输出的技术。 more
Prompt Injection(提示注入):通过恶意提示词操纵AI模型的技术。 more
Prompt Tuning(提示微调):通过学习提示向量来调整模型行为的技术。 more
Pruning(剪枝):移除神经网络中不重要权重或神经元以压缩模型。 more
Pseudo-labeling(伪标签):用模型预测作为标签训练其他数据的技术。 more
P-tuning(可学习提示):通过神经网络学习连续提示向量的技术。 more
Python(Python):AI领域最流行的编程语言。 more
PyTorch(PyTorch框架):Meta开源的深度学习框架。 more
Q
Q-function(Q函数):强化学习中评估状态-动作对价值的函数。 more
Quantization(量化):将模型参数从高精度转换为低精度的压缩技术。 more
Quantum Computing(量子计算):利用量子力学原理进行计算的新型计算范式。 more
Query(查询):向模型或数据库请求信息的操作。 more
Question Answering(问答):根据问题从给定文本或知识库中提取答案的NLP任务。 more
R
Random Forest(随机森林):通过集成多棵决策树提升性能的算法。 more
Random Walk(随机游走):每步随机选择方向的运动过程。 more
Ranking(排序):根据相关性对项目进行排序的任务。 more
RAG(检索增强生成):结合知识检索与AI生成的混合技术架构。 more
Recall(召回率):实际为正的样本中被正确预测为正的比例。 more
Recommendation System(推荐系统):根据用户兴趣推荐内容的系统。 more
Reconstruction Loss(重建损失):衡量模型重建原始数据能力的损失函数。 more
Rectified Linear Unit(ReLU):最常用的激活函数,负值输出0正值保持不变。 more
Recurrent Neural Network(循环神经网络):适合处理序列数据的神经网络架构。 more
Regression(回归):预测连续数值的任务。 more
Regularization(正则化):防止过拟合的约束技术。 more
Reinforcement Learning(强化学习):通过试错学习最优策略的机器学习方法。 more
Relation Extraction(关系抽取):从文本中识别实体之间关系的NLP任务。 more
Relationship Extraction(关系抽取):从文本中识别实体之间关系的NLP任务。 more
Representation Learning(表示学习):自动学习数据有效表示的技术。 more
Residual Block(残差块):包含跳跃连接的神经网络块,缓解梯度消失问题。 more
Residual Connection(残差连接):跳跃连接缓解深层网络训练困难的技术。 more
ResNet(残差网络):使用残差连接的深度卷积神经网络。 more
Resource Efficiency(资源效率):在有限计算资源下实现最优性能。 more
Response Generation(响应生成):AI根据输入生成回答的过程。 more
Retrieval Augmented Generation(检索增强生成):结合知识检索与AI生成的混合技术架构。 more
Reward Function(奖励函数):强化学习中评估行为好坏的函数。 more
RHO(检索增强优化):一种基于检索结果优化提示的技术。 more
RNN(循环神经网络):适合处理序列数据的神经网络架构。 more
Robustness(鲁棒性):AI模型面对噪声、对抗攻击等干扰时的稳定能力。 more
Role-playing(角色扮演):让AI模型扮演特定角色的提示技术。 more
Root Mean Square Propagation(RMSProp):自适应学习率的优化算法。 more
Router(路由):在多专家网络中决定使用哪个专家的组件。 more
S
S3(简单存储服务):AWS提供的云存储服务。 more
SageMaker(AWS SageMaker):AWS的机器学习平台。 more
Saliency Map(显著性图):显示输入中对输出最重要区域的图像。 more
Sample(样本):数据集中的单个数据点。 more
Sampling(采样):从分布中随机选取样本的过程。 more
Scalability(可扩展性):系统处理更大规模数据或用户的能力。 more
Score(分数):模型输出的原始数值,表示某种置信度。 more
Search Algorithm(搜索算法):在解空间中寻找最优解的算法。 more
Self-attention(自注意力):序列内部各位置相互注意的机制。 more
Self-consistency(自一致性):通过多次采样选择最一致答案的技术。 more
Self-supervised Learning(自监督学习):无需人工标注的从无标签数据学习的技术。 more
Semantic Analysis(语义分析):理解文本深层含义的NLP技术。 more
Semantic Role Labeling(语义角色标注):识别句子中主语、宾语、谓语等语义角色的任务。 more
Semantic Search(语义搜索):理解查询意图而非仅匹配关键词的搜索技术。 more
Semantic Segmentation(语义分割):对图像每个像素进行分类的任务。 more
Semi-supervised Learning(半监督学习):同时使用标注和未标注数据的学习方法。 more
Sentence Embedding(句子嵌入):将句子映射为向量的技术。 more
Sentiment Analysis(情感分析):判断文本情感倾向(正面、负面、中性)的NLP任务。 more
Sequence Generation(序列生成):生成文本、代码等序列数据的技术。 more
Sequence Modeling(序列建模):处理和预测序列数据的任务。 more
Sequence-to-Sequence(序列到序列):将一个序列映射到另一个序列的模型架构。 more
Serverless Computing(无服务器计算):无需管理服务器的云端执行模式。 more
Service Level Agreement(服务级别协议):服务质量的保证协议。 more
Serving(服务化):将模型部署为API供调用的过程。 more
SGD(随机梯度下降):每次用单个样本计算梯度的优化算法。 more
Sigmoid(Sigmoid函数):将数值映射到0到1之间的激活函数。 more
Similarity(相似度):衡量两个对象相近程度的指标。 more
Simulated Environment(模拟环境):在虚拟环境中训练AI的技术。 more
Singular Value Decomposition(奇异值分解):矩阵分解的常用方法,用于降维。 more
Skip-gram(Skip-gram模型):一种词嵌入训练架构。 more
Smoothing(平滑):处理数据中稀疏或零值的技术。 more
SNE(随机邻域嵌入):一种非线性降维技术。 more
Social Media Analysis(社交媒体分析):分析社交媒体内容的AI技术。 more
Soft Margin(软间隔):允许一定错误分类的SVM变体。 more
Softmax(Softmax函数):将数值转换为概率分布的函数,常用于多分类。 more
Software Engineering(软件工程):开发和维护软件系统的学科。 more
SOTA(最先进):当前最高水平或最佳性能。 more
Span Extraction(片段抽取):从文本中抽取特定片段回答问题的任务。 more
Spark(Spark):大数据处理框架。 more
Sparse Attention(稀疏注意力):只计算部分注意力权重的注意力机制。 more
Sparsity(稀疏性):大部分元素为0的特性。 more
Speech Recognition(语音识别):将语音转换为文字的技术。 more
Speech Synthesis(语音合成):将文字转换为语音的技术。 more
SQL(结构化查询语言):用于操作关系数据库的语言。 more
SQuAD(SQuAD数据集):著名的机器阅读理解数据集。 more
SSL(安全套接层):网络通信加密协议。 more
Stability(稳定性):模型对小扰动不敏感的特性。 more
Stack(堆栈):后进先出的数据结构。 more
State of the Art(最先进):当前最高水平或最佳性能。 more
Stochastic Gradient Descent(随机梯度下降):每次用单个样本计算梯度的优化算法。 more
Streaming(流式处理):实时处理连续数据流的技术。 more
Structured Data(结构化数据):具有明确定义格式的数据,如表格数据。 more
Structured Prediction(结构化预测):输出具有复杂结构(如树、图)的预测任务。 more
Style Transfer(风格迁移):将一种图像风格应用到另一图像的技术。 more
StyleGAN(风格生成对抗网络):能控制生成图像风格的高质量生成模型。 more
Supervised Learning(监督学习):使用标注数据进行训练的学习方法。 more
Support Vector Machine(支持向量机):通过找到最优分割超平面进行分类的算法。 more
Symbolic AI(符号AI):基于规则和逻辑的人工智能方法。 more
Synonym(同义词):意思相近的词语。 more
T
T5(文本到文本Transformer):将所有NLP任务统一为文本到文本格式的模型。 more
Tabular Data(表格数据):以表格形式组织的数据。 more
Tanh(双曲正切函数):将数值映射到-1到1之间的激活函数。 more
Target(目标):模型要预测的真实值或期望输出。 more
Task-specific Model(任务专用模型):针对特定任务优化的模型。 more
Token(词元):语言模型处理文本的最小单位。 more
Tokenization(分词):将文本分割为词元的过程。 more
Topic Modeling(主题建模):从文档集合中发现主题的统计方法。 more
Token Limit(词元限制):模型一次能处理的最大词元数量。 more
Top-k Sampling(Top-k采样):从最高概率的k个选项中随机选择的生成策略。 more
Training(训练):使用数据调整模型参数使模型学习模式的过程。 more
Training Data(训练数据):用于训练模型的标注数据。 more
Trajectory(轨迹):智能体在环境中一系列状态-动作序列。 more
Transfer Learning(迁移学习):将一个任务学到的知识应用到相关任务的技术。 more
Transformer(Transformer):基于注意力机制的革命性模型架构。 more
Translation(翻译):将一种语言转换为另一种语言的任务。 more
TREC(文本检索会议):信息检索领域的重要评测会议和数据集。 more
Tree Search(树搜索):在树结构中搜索最优解的算法。 more
Trend Analysis(趋势分析):识别数据中长期变化趋势的技术。 more
Triplet Loss(三元组损失):学习度量空间中样本相对距离的损失函数。 more
Trojan Attack(特洛伊木马攻击):在模型中植入恶意后门的攻击方式。 more
Tuning(调优):调整模型或系统参数以优化性能。 more
Turn-taking(对话轮次):多轮对话中角色交替的机制。 more
Two-tower Model(双塔模型):分别编码查询和文档的检索模型架构。 more
U
UMAP(统一流形近似与投影):高效的降维可视化技术。 more
Underfitting(欠拟合):模型过于简单,无法捕捉数据规律的问题。 more
Uniform Resource Locator(URL):网页地址。 more
Unsupervised Learning(无监督学习):使用无标签数据发现模式的学习方法。 more
Upsampling(上采样):增加数据分辨率的操作。 more
User Experience(用户体验):用户与产品交互的总体感受。 more
User Intent(用户意图):用户想要完成的目标或需求。 more
V
VAE(变分自编码器):使用变分推断的自编码器,可用于生成任务。 more
Validation Data(验证数据):用于调参和早停的独立数据集。 more
Vanishing Gradient(梯度消失):深层网络训练中梯度变得极小的问题。 more
Variational Inference(变分推断):使用变分分布近似后验分布的推断方法。 more
Vector(向量):具有大小和方向的数学对象。 more
Vector Database(向量数据库):专门存储和检索高维向量的数据库。 more
Vector Space(向量空间):向量构成的数学空间,用于表示语义。 more
Video Understanding(视频理解):理解和分析视频内容的AI技术。 more
Virtual Environment(虚拟环境):隔离的Python运行环境。 more
Vision and Language(视觉语言):同时处理图像和文本的多模态领域。 more
Vision Transformer(视觉Transformer):将Transformer架构应用于图像处理的模型。 more
VLM(视觉语言模型):能同时理解图像和文本的多模态模型。 more
Voice Assistant(语音助手):通过语音交互提供服务的AI程序。 more
W
Weight(权重):神经网络中连接节点的参数,决定输入的重要性。 more
Weight Decay(权重衰减):通过惩罚大权重防止过拟合的正则化技术。 more
Weights & Biases(W&B):机器学习实验跟踪工具。 more
Whitening(白化):使数据协方差矩阵为单位矩阵的预处理。 more
Word Embedding(词嵌入):将词语映射为向量的技术。 more
Word2Vec(词2向量):经典的词嵌入训练算法。 more
Wrapper(包装器):在模型外层添加功能的组件。 more
X
XGBoost(极端梯度提升):高效的梯度提升算法库。 more
Y
YAML(YAML不是标记语言):人类可读的数据序列化格式。 more
YOLO(YOLO目标检测):实时目标检测算法,以速度快著称。 more
Z
Zero-shot Learning(零样本学习):模型能够识别从未见过类别样本的能力。 more
Zero-shot Translation(零样本翻译):不经过语言对直接训练实现翻译。 more
Zeroshot(零样本):模型能够处理从未见过任务的能力。 more
ZKP(零知识证明):证明某事为真而不透露具体信息的加密技术。 more
附录:AI产品与系统
主流AI模型
GPT系列:OpenAI开发的大语言模型,包括GPT-3、GPT-4、GPT-4o等,在文本生成和理解方面表现卓越。 more
Claude系列:Anthropic公司开发的AI助手,以长文本处理和安全性著称。 more
Gemini:Google开发的多模态AI模型,原名Bard,能处理文本、图像、视频等多种模态。 more
LLaMA:Meta开源的大语言模型系列,参数规模从70亿到700亿不等。 more
Qwen:阿里巴巴开发的中文大语言模型系列。 more
DeepSeek:中国AI公司开发的高性能大语言模型。 more
Mistral:法国AI公司开发的高效大语言模型。 more
Groq:专注于快速推理的AI芯片和模型服务。 more
AI开发框架
LangChain:用于构建LLM应用的流行Python框架,提供链式调用、Agent、工具集成等功能。 more
LangGraph:用于构建有状态、多角色AI应用的框架,支持复杂工作流。 more
LlamaIndex:专注于数据连接的LLM框架,用于构建知识增强的应用。 more
AutoGen:微软开发的多Agent自动生成框架。 more
CrewAI:用于构建多Agent协作团队的框架。 more
OpenAI SDK:OpenAI官方提供的API客户端库。 more
Anthropic SDK:Claude模型的官方API客户端库。 more
AI部署与推理
Ollama:在本地运行大语言模型的工具,支持macOS、Linux、Windows。 more
vLLM:高效的大语言模型推理服务框架,支持PagedAttention。 more
TensorRT-LNVIDIA:的高性能深度学习推理引擎。 more
ONNX Runtime:跨平台的机器学习推理引擎。 more
LightLLM:基于Python的大语言模型推理框架。 more
FastAPI:Python高性能Web框架,常用于部署AI服务。 more
向量数据库
Pinecone:云原生向量数据库服务。 more
Weaviate:开源向量搜索引擎,支持GraphQL API。 more
Milvus:开源向量数据库,由Linux基金会托管。 more
Chroma:开源嵌入式向量数据库,为LLM应用设计。 more
Faiss:Facebook开源的向量检索库。 more
Qdrant:开源向量数据库,支持云原生部署。 more
AI应用平台
OpenClaw:企业级AI Agent开发平台,支持快速构建智能应用。 more
LangChain平台:LangChain官方提供的云端LLM应用开发平台。 more
Hugging Face:最大的开源机器学习社区和模型托管平台。 more
Replicate:云端运行开源AI模型的平台。 more
Runway:AI视频生成和编辑平台。 more
Midjourney:通过文字描述生成图像的AI工具。 more
Stable Diffusion:开源的文生图模型,可本地部署。 more
AI开发工具
Cursor:基于AI的代码编辑器,集成GPT-4能力。 more
GitHub Copilot:微软的AI编程助手,集成在VS Code中。 more
Amazon SageMaker:AWS的全托管机器学习平台。 more
Google Vertex AI:Google Cloud的机器学习平台。 more
Azure Machine Learning:微软Azure的机器学习平台。 more
Weights & Biases:机器学习实验跟踪和模型可视化工具。 more
MLflow:开源的机器学习生命周期管理平台。 more
Comet:机器学习实验管理平台。 more
AI开发组件
OpenAPI:用于描述RESTful API的规范,AI服务多通过OpenAPI暴露接口。 more
GraphQL:API查询语言,AI应用常用于灵活获取数据。 more
gRPC:高性能RPC框架,AI服务间通信常用。 more
Docker:容器化技术,用于AI应用打包和部署。 more
Kubernetes:容器编排平台,用于AI服务自动化部署和扩缩容。 more
Prompt工程工具
PromptPerfect:专业的提示词优化工具。 more
PromptBase:提示词交易和分享平台。 more
PromptFlow:Microsoft的提示词工程工具。 more
AI安全与伦理
AI Safety:确保AI系统安全可靠的研究领域。 more
Responsible AI:负责任AI开发和部署的实践和原则。 more
AI Alignment:确保AI目标与人类价值观一致的研究。 more
Red Teaming:通过模拟攻击测试AI系统安全性的方法。 more
Bias Detection:检测AI系统中偏见的技术。 more
AI评估与基准
HELM:大语言模型综合评估基准。 more
MMLU:大规模多任务语言理解测试。 more
HumanEval:代码生成能力评估数据集。 more
MMLU:多任务语言理解基准。 more
GLUE:自然语言理解基准套件。 more
SuperGLUE:比GLUE更具挑战性的NLP基准。 more
AI智能体相关
Agent Framework:构建AI智能体的软件框架。 more
Tool Use:AI模型调用外部工具的能力。 more
Memory System:AI智能体的记忆系统,用于存储和检索信息。 more
Planning:AI智能体的规划能力,用于分解复杂任务。 more
Reflection:AI智能体的反思能力,用于自我改进。 more
ReAct:结合推理和行动的AI框架。 more
AI工作流
AI Pipeline:从数据处理到模型部署的完整流程。 more
ETL Pipeline:数据抽取、转换、加载流程,AI数据处理基础。 more
Data Pipeline:数据处理和流转的自动化流程。 more
CI/CD Pipeline:持续集成和持续部署,AI模型发布自动化。 more
ML Pipeline:机器学习模型训练和部署流水线。 more
AI云服务
AWS AI Services:Amazon的AI服务系列,包括Rekognition、Polly、Lex等。 more
Google AI Services:Google Cloud的AI服务。 more
Azure AI Services:Microsoft Azure的AI服务。 more
阿里云AI:阿里巴巴的AI开放平台。 more
腾讯云AI:腾讯云的AI服务。 more
百度智能云:百度的AI开放平台。 more
AI开发资源
arXiv:AI领域最新研究论文预印本平台。 more
Papers with Code:带代码的AI论文集。 more
GitHub:全球最大开源代码平台,AI项目聚集地。 more
Kaggle:数据科学和机器学习竞赛平台。 more
Model Zoo:预训练模型仓库。 more
AI News:AI行业新闻资讯网站。 more
AI学习资源
DeepLearning.AI:Andrew Ng创办的AI学习平台。 more
Fast.ai:免费深度学习课程。 more
CS231n:斯坦福视觉识别课程。 more
CS224n:斯坦福NLP课程。 more
Google ML Courses:Google的免费机器学习课程。 more
AI行业术语
AI winters:AI发展史上的低谷期。 more
AI boom:AI快速发展和投资热潮期。 more
Edge AI:在终端设备上运行的AI。 more
On-premise AI:本地部署的AI系统。 more
SaaS AI:作为服务提供的AI能力。 more
AI Marketplace:AI模型和服务的交易平台。 more
AI as a Service(AIaaS):AI即服务,通过云端API提供AI能力。 more
AI相关组织
OpenAI:AI研究和部署公司,开发GPT系列。 more
Anthropic:AI安全公司,开发Claude。 more
DeepMind:Google旗下AI研究公司,开发AlphaGo。 more
Meta AI:Meta的AI研究部门。 more
Google DeepMind:Google和DeepMind合并后的AI研究部门。 more
Microsoft Research:微软研究院,AI基础研究。 more
Stanford HAI:斯坦福人本人工智能研究院。 more
MIT CSAIL:麻省理工计算机与人工智能实验室。 more
AI认证与标准
AWS AI Certification:Amazon的AI认证。 more
Google Cloud AI Certification:Google Cloud的AI认证。 more
TensorFlow Developer Certificate:TensorFlow开发者认证。 more
PyTorch Certification:PyTorch开发者认证。 more
