全面解析:常见AI名词解释与英文全称,如GPT、RAG、Embeddings(嵌入)、Fine-tuning(微调)、DALL-E 3、Sora等

名词 解释
AI Artificial Intelligence(人工智能),模拟、延伸和扩展人类智能的理论、方法、技术及应用系统。
AGI Artificial General Intelligence(通用人工智能),指具有广泛能力和自主学习能力的人工智能。
AIGC AI-Generated Content(人工智能生成内容),利用AI技术生成文本、图像、音频、视频等内容。
Generative AI Generative Artificial Intelligence(生成式人工智能),能够生成新的数据或内容的人工智能模型。
OpenAI 一家人工智能研究机构,致力于确保人工智能的益处惠及全人类。
GPT Generative Pre-trained Transformer(生成式预训练变换器),一种语言模型,能够生成类似人类的文本。
GPT-3 第三代生成式预训练变换器,OpenAI开发的第三代生成式预训练变换器,具有1750亿参数。
GPT-4 第四代生成式预训练变换器,OpenAI开发的第四代生成式预训练变换器,具有更强的理解和生成能力。
GPT-4o “o“代表 Omni即全能模型,也可以说是优化版GPT-4,专注于特定任务的优化,是OpenAI推出的最新旗舰级人工智能模型,它是GPT系列的一个重要升级。
ChatGPT Chat Generative Pre-trained Transformer(聊天生成式预训练变换器),基于GPT模型的聊天机器人应用,能够进行自然语言对话。
GPTs GPT Store,OpenAI推出的应用商店,提供基于GPT技术的各类应用。
Prompt 提示词,在使用生成式AI时用于引导模型生成特定内容。
AI Agent 人工智能体,能够自主执行任务的智能系统。
NLP Natural Language Processing(自然语言处理),人工智能的一个分支,处理和分析自然语言数据。
LLM Large Language Model(大型语言模型),能够处理和生成自然语言的深度学习模型。
Embeddings 嵌入,将文本等数据转换为向量以便于计算处理。
Fine-tuning 微调,在预训练模型基础上,通过少量任务相关数据进行进一步训练以提高模型性能。
Vector Store 向量存储,用于存储和检索向量化的数据。
RAG Retrieval-Augmented Generation(检索增强生成),结合生成模型和检索系统的技术。这个概念来自于 Facebook AI 部门自然语言处理研究员们在 2020 年发表的一篇论文中。所以他的出现要早于ChatGPT甚至LLM的出现,而不是因为ChatGPT后的实践方案。
DALL-E DALL-E,OpenAI开发的图像生成模型,能够根据文本描述生成图像。
DALL-E 3 DALL-E 3,DALL-E的第三代版本,具有更强的图像生成能力和质量。
Stable Diffusion Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词[锚点失效]指导下产生图生图的转变
Sora Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。Sora这一名称源于日文“空”,即天空之意,以示其无限的创造潜力。OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频,称该模型能够生成长达一分钟的视频。
Imagen Google开发的基于文本描述生成高质量图像的模型。
Midjourney 一种生成艺术图像的AI工具。
Dreambooth 一种个性化图像生成技术,允许用户微调模型以生成特定风格的图像。
Lensa 一款利用AI技术进行图像编辑和优化的应用程序。
LLaMA Large Language Model Meta AI(大型语言模型Meta AI),Meta开发的大型语言模型,专注于提高语言理解和生成能力。
机器学习 Machine Learning,是人工智能的一个分支,通过算法从数据中学习和预测结果。
深度学习 Deep Learning,是机器学习的一个子领域,通过多层神经网络从数据中学习复杂特征。
神经网络 Neural Network,模拟人脑神经元连接的计算模型,用于模式识别和预测。
语言建模 Language Modeling,预测或生成语言序列的模型,在自然语言处理任务中广泛应用。
扩散模型 Diffusion Model,通过迭代过程生成高质量数据(如图像)的模型。
多模态模型 Multimodal Model,能够处理和生成多种类型数据(如文本、图像、音频)的模型。

本文由@指点号原创发布于今日指点,转载请附带链接。

本文链接:https://www.jinrizhidian.com/tech/2124.html

发表评论