对普通人来说AI人工智能仿佛太遥远了又感觉就在眼前现在咱们生活、工作中到处都能听到某某某用AI提高工作效率或者用AI做了一些作品用AI做图做视频等等。下面从AI基础概念用大白话讲讲诸如像深度学习、大模型、推理、训练、算力等多个方面的术语出发让咱们一起来认识AI了解AI。一、AI基础术语大白话解释生活/工作场景举例AI人工智能让机器学着像人一样看东西、听声音、想事情、做决定。手机语音助手、人脸识别解锁、AI帮你写文章。ML机器学习让机器自己去海量数据里找规律不用咱们一行行写代码教它。刷短视频越刷越懂你、淘宝猜你喜欢、自动拦截垃圾邮件。DL深度学习现在AI画画、聊天、认脸的主流技术底层靠它支撑。GPT聊天、Stable Diffusion画画、手机刷脸支付。AGI通用人工智能啥都会、跟真人一样聪明的AI目前还没实现。网上吹的“全能AI”其实都是把几个单项功能拼凑起来的。AIGC生成式人工智能AI自己原创内容。让AI写请假条、画头像、配音、剪短视频。窄AI弱AI现在咱们用的AI全都是这种只会干一件事。Siri只会听指令Midjourney只会画画电商客服只会回话。模型Model训练好、能直接干活的AI程序。聊天的GPT-4、通义千问画画的Midjourney。参数ParamsAI脑子里的“脑细胞”数量。参数越多懂的就越多越聪明。7B就是70亿参数GPT-4万亿参数脑子特别大。权重WeightAI在学东西时自己总结出来的经验用来分清重点。分清一句话里的重点或者认出照片里的人脸。数据集Dataset喂给AI吃的“教材”。拿几百万篇维基百科教它认字拿一堆照片教它认猫认狗。预训练PTAI的“九年义务教育”学完成了什么都懂一点的“基座模型”。拿全网海量资料教它常识、语法。微调FT“岗前培训”用专门资料教它让它变成懂行的专家。拿医生、律师或者客服的资料教通用模型。训练Train让AI不停地看数据、找规律做错了就纠正直到学会为止。用海量文本数据教大模型。推理Inference咱们平时用AI的过程问它问题它给答案。你问它问题它给你答案你给个词它给你画张图。二、神经网络与深度学习术语大白话解释生活/工作场景举例神经网络模仿人脑搭出来的计算网。手机相册自动把风景照分一类、人脸照分一类。神经元网里最小的计算零件负责接收和处理信息。海量神经元组合运算让AI识别图片轮廓。层Layer神经网络一层一层的层数越多叫“深度”学习。一步步深入能学的东西就越复杂。CNN卷积神经网络“看图专家”。手机相册分类、小区摄像头抓人、医院看X光片找病灶。RNN/LSTM早期的“文字和语音处理专家”现在基本被淘汰了。早期机器翻译、语音识别。Transformer现在所有厉害的聊天AI、多模态AI的底层架构。GPT系列、Qwen、Claude能看懂长文上下文。Encoder 编码器专门负责“阅读理解”。百度用它来做文章相似度匹配、情感分析。Decoder 解码器专门负责“写作文”。GPT系列主打陪你聊天、帮你写文案。编解码架构既能看懂又能写。同声翻译软件、图文问答模型。三、大语言模型LLM术语大白话解释生活/工作场景举例LLM大语言模型读了海量文章、脑子特别大的AI。GPT-4、文心一言、通义千问能聊天、写东西、做算术。LMM多模态大模型“多面手”文字、图片、视频都能看懂和处理。GPT-4V、Sora视频模型。Base Model 基座模型刚上完“九年义务教育”的AI没经过专门培训。直接跟它聊天它可能会胡言乱语。Token 词元AI看文字的最小单位用来算钱和算字数。一个汉字大概算1到2个Token。上下文窗口AI的“短期记忆力”。8K窗口只能记住这么多字128K能记住好几本书。Embedding 嵌入向量把文字变成电脑能懂的一串数字方便搜资料。企业私有知识库文本匹配。Prompt 提示词你给AI下的指令你怎么问它就怎么答。输入问题让文心一言作答。Zero-Shot 零样本啥例子都不给直接让它干活。直接说“帮我写篇春天的作文”。Few-Shot 少样本先给它打个样它写得就准。给两首古诗让它照着风格再写一首。CoT思维链让AI“把解题步骤写出来”不容易算错。做数学题时让它一步步算。RAG检索增强生成给AI配个“实时搜索引擎”防瞎编。企业知识库问答、最新时政问答。Agent 智能体“高级打工人”能自己拆解任务、找工具、检查错误。GPTs、AutoGPT、企业自动化办公AI。模型幻觉AI在“一本正经地胡说八道”。编造根本不存在的论文或者假数据。Alignment 对齐教AI做个“好人”说话符合规矩。不爆粗口、不教人干坏事。四、模型微调与轻量化技术术语大白话解释生活/工作场景举例LoRA低秩适配给大模型做“微创手术”只动一小部分参数。普通电脑也能调教出专属写作风格的AI。QLoRALoRA升级版配合压缩技术。用家里的普通游戏显卡就能调教大模型。量化Quantization把大模型“压缩打包”普通电脑也能跑得动。原来占100G的模型压缩完只要20多G。浮点精度/整型量化AI的“画质”。FP32是原画INT4是标清省空间。本地部署运行模型适配端侧与家用显卡。模型蒸馏“大模型带小徒弟”。让GPT-4教一个小模型还能装进手机里。五、推理优化与分布式训练术语大白话解释生活/工作场景举例KV Cache给AI加了个“草稿本”回复特别快。连续多轮对话时不用把前面的话重新算一遍。PagedAttention显存管理技术人多也不卡顿。企业AI服务高峰期同时承载上千用户对话。DP/MP/TP/PP把大模型拆开来分给一堆显卡一起算。加快训练速度解决单卡显存不足问题。六、模型训练细节与数据集术语大白话解释生活/工作场景举例训练集/验证集/测试集AI的“课本、模拟考卷和高考卷”。课本用来学模拟卷调状态高考卷测真实水平。Epoch 轮次AI把课本从头到尾看了一遍。完整跑完一整份全部训练数据。Batch 批次AI一次往脑子里塞多少题。单次送入模型进行计算的一组数据。过拟合AI“死记硬背”了换题就抓瞎。做原题全对全新题型正确率极低。欠拟合AI“没学进去”啥都不会。课本上的题不会新题更不会。数据污染喂给AI的教材里有错别字或坏内容。导致模型输出异常、能力缺陷。七、算力、硬件与评测指标术语大白话解释生活/工作场景举例GPU 图形处理器AI的“大脑”最火的算力硬件。RTX 3090/4090、A100、H100。VRAM 显存大脑的“工作记忆空间”。显存越大能跑的模型就越大。TPU / NPU专用AI芯片。谷歌云端AI训练手机本地AI美颜、智能字幕。TFLOPS衡量显卡算得快不快的单位。每秒万亿次浮点运算。PPL困惑度测AI说话通不通顺的指标。分数越低说话越像正常人。MMLUAI界的“高考综合测试卷”。考它常识、逻辑、推理到底行不行。
学AI,先AI大模型专业术语开始打好基础
对普通人来说AI人工智能仿佛太遥远了又感觉就在眼前现在咱们生活、工作中到处都能听到某某某用AI提高工作效率或者用AI做了一些作品用AI做图做视频等等。下面从AI基础概念用大白话讲讲诸如像深度学习、大模型、推理、训练、算力等多个方面的术语出发让咱们一起来认识AI了解AI。一、AI基础术语大白话解释生活/工作场景举例AI人工智能让机器学着像人一样看东西、听声音、想事情、做决定。手机语音助手、人脸识别解锁、AI帮你写文章。ML机器学习让机器自己去海量数据里找规律不用咱们一行行写代码教它。刷短视频越刷越懂你、淘宝猜你喜欢、自动拦截垃圾邮件。DL深度学习现在AI画画、聊天、认脸的主流技术底层靠它支撑。GPT聊天、Stable Diffusion画画、手机刷脸支付。AGI通用人工智能啥都会、跟真人一样聪明的AI目前还没实现。网上吹的“全能AI”其实都是把几个单项功能拼凑起来的。AIGC生成式人工智能AI自己原创内容。让AI写请假条、画头像、配音、剪短视频。窄AI弱AI现在咱们用的AI全都是这种只会干一件事。Siri只会听指令Midjourney只会画画电商客服只会回话。模型Model训练好、能直接干活的AI程序。聊天的GPT-4、通义千问画画的Midjourney。参数ParamsAI脑子里的“脑细胞”数量。参数越多懂的就越多越聪明。7B就是70亿参数GPT-4万亿参数脑子特别大。权重WeightAI在学东西时自己总结出来的经验用来分清重点。分清一句话里的重点或者认出照片里的人脸。数据集Dataset喂给AI吃的“教材”。拿几百万篇维基百科教它认字拿一堆照片教它认猫认狗。预训练PTAI的“九年义务教育”学完成了什么都懂一点的“基座模型”。拿全网海量资料教它常识、语法。微调FT“岗前培训”用专门资料教它让它变成懂行的专家。拿医生、律师或者客服的资料教通用模型。训练Train让AI不停地看数据、找规律做错了就纠正直到学会为止。用海量文本数据教大模型。推理Inference咱们平时用AI的过程问它问题它给答案。你问它问题它给你答案你给个词它给你画张图。二、神经网络与深度学习术语大白话解释生活/工作场景举例神经网络模仿人脑搭出来的计算网。手机相册自动把风景照分一类、人脸照分一类。神经元网里最小的计算零件负责接收和处理信息。海量神经元组合运算让AI识别图片轮廓。层Layer神经网络一层一层的层数越多叫“深度”学习。一步步深入能学的东西就越复杂。CNN卷积神经网络“看图专家”。手机相册分类、小区摄像头抓人、医院看X光片找病灶。RNN/LSTM早期的“文字和语音处理专家”现在基本被淘汰了。早期机器翻译、语音识别。Transformer现在所有厉害的聊天AI、多模态AI的底层架构。GPT系列、Qwen、Claude能看懂长文上下文。Encoder 编码器专门负责“阅读理解”。百度用它来做文章相似度匹配、情感分析。Decoder 解码器专门负责“写作文”。GPT系列主打陪你聊天、帮你写文案。编解码架构既能看懂又能写。同声翻译软件、图文问答模型。三、大语言模型LLM术语大白话解释生活/工作场景举例LLM大语言模型读了海量文章、脑子特别大的AI。GPT-4、文心一言、通义千问能聊天、写东西、做算术。LMM多模态大模型“多面手”文字、图片、视频都能看懂和处理。GPT-4V、Sora视频模型。Base Model 基座模型刚上完“九年义务教育”的AI没经过专门培训。直接跟它聊天它可能会胡言乱语。Token 词元AI看文字的最小单位用来算钱和算字数。一个汉字大概算1到2个Token。上下文窗口AI的“短期记忆力”。8K窗口只能记住这么多字128K能记住好几本书。Embedding 嵌入向量把文字变成电脑能懂的一串数字方便搜资料。企业私有知识库文本匹配。Prompt 提示词你给AI下的指令你怎么问它就怎么答。输入问题让文心一言作答。Zero-Shot 零样本啥例子都不给直接让它干活。直接说“帮我写篇春天的作文”。Few-Shot 少样本先给它打个样它写得就准。给两首古诗让它照着风格再写一首。CoT思维链让AI“把解题步骤写出来”不容易算错。做数学题时让它一步步算。RAG检索增强生成给AI配个“实时搜索引擎”防瞎编。企业知识库问答、最新时政问答。Agent 智能体“高级打工人”能自己拆解任务、找工具、检查错误。GPTs、AutoGPT、企业自动化办公AI。模型幻觉AI在“一本正经地胡说八道”。编造根本不存在的论文或者假数据。Alignment 对齐教AI做个“好人”说话符合规矩。不爆粗口、不教人干坏事。四、模型微调与轻量化技术术语大白话解释生活/工作场景举例LoRA低秩适配给大模型做“微创手术”只动一小部分参数。普通电脑也能调教出专属写作风格的AI。QLoRALoRA升级版配合压缩技术。用家里的普通游戏显卡就能调教大模型。量化Quantization把大模型“压缩打包”普通电脑也能跑得动。原来占100G的模型压缩完只要20多G。浮点精度/整型量化AI的“画质”。FP32是原画INT4是标清省空间。本地部署运行模型适配端侧与家用显卡。模型蒸馏“大模型带小徒弟”。让GPT-4教一个小模型还能装进手机里。五、推理优化与分布式训练术语大白话解释生活/工作场景举例KV Cache给AI加了个“草稿本”回复特别快。连续多轮对话时不用把前面的话重新算一遍。PagedAttention显存管理技术人多也不卡顿。企业AI服务高峰期同时承载上千用户对话。DP/MP/TP/PP把大模型拆开来分给一堆显卡一起算。加快训练速度解决单卡显存不足问题。六、模型训练细节与数据集术语大白话解释生活/工作场景举例训练集/验证集/测试集AI的“课本、模拟考卷和高考卷”。课本用来学模拟卷调状态高考卷测真实水平。Epoch 轮次AI把课本从头到尾看了一遍。完整跑完一整份全部训练数据。Batch 批次AI一次往脑子里塞多少题。单次送入模型进行计算的一组数据。过拟合AI“死记硬背”了换题就抓瞎。做原题全对全新题型正确率极低。欠拟合AI“没学进去”啥都不会。课本上的题不会新题更不会。数据污染喂给AI的教材里有错别字或坏内容。导致模型输出异常、能力缺陷。七、算力、硬件与评测指标术语大白话解释生活/工作场景举例GPU 图形处理器AI的“大脑”最火的算力硬件。RTX 3090/4090、A100、H100。VRAM 显存大脑的“工作记忆空间”。显存越大能跑的模型就越大。TPU / NPU专用AI芯片。谷歌云端AI训练手机本地AI美颜、智能字幕。TFLOPS衡量显卡算得快不快的单位。每秒万亿次浮点运算。PPL困惑度测AI说话通不通顺的指标。分数越低说话越像正常人。MMLUAI界的“高考综合测试卷”。考它常识、逻辑、推理到底行不行。