2026年5月北京人工智能-Python深度学习进阶与大模型核心技术原理实战高级培训班

课程详情

一、研修时间：2026年5月29-31日

二、研修地点：北京

三、主办单位：北京中际孚歌科技有限公司

北京中际赛威文化发展有限公司

四、研修内容：

第一节：Python深度学习基础

►深度学习在图像处理、文本分类中的应用场景

►深度学习和神经网络基础

►激活函数、损失函数与优化算法

►反向传播算法

►深度神经网络模型

►BP神经网络

►卷积神经网络（CNN）

►循环神经网络（RNN）

►动手实践：构建简单的神经网络

►使用Python和TensorFlow/PyTorch构建和训练神经网络模型

►数据预处理与模型评估

第二节：卷积神经网络原理及其应用

►AlexNet、VGGNet、GoogleLeNet

►Inception-V3/V4

►ResNet、DenseNet

►使用迁移学习实现蒙古文识别

►获取中间隐层的特征及可视化

►隐层特征的意义和使用

►迁移学习的trick

►学习率、衰减

►模型预训练方式（为后面大模型做技术铺垫）

代码和案例实践：

►数字图片分类

►卷积核与特征提取

►以图搜图

►海量蒙古文识别

►隐特征可视化及其应

第三节：目标检测

►视频关键帧处理

►卷积的位置不变形与图像定位的关系

►物体检测与定位

►RCNN，Fast-RCNN，Faster-RCNN，MaskRCNN

►YOLO、SSD

►UNet及其与残差网络的结合

►FaceNet与特征

►EfficientNet、EfficientDet

►视频帧的目标定位

►时空卷积网络

►SlowFast

代码和案例实践：

►人脸检测

►OCR字体定位和识别

►睿客识云

►气象识别

►视频分类的trick

►政务大厅视频监控的真实系统

第四节：循环神经网络及其应用

►数据预处理与序列填充

►数据集划分（训练集、验证集、测试集）

►使用深度学习框架（PyTorch和TensorFlow）构建RNN模型

►自定义RNN层

►堆叠RNN层（多层RNN）

►损失函数的选择（如均方误差、交叉熵等）

►评估指标的选择（如准确率、召回率、F1分数等）

►验证集与测试集上的性能评估

►GRU（门控循环单元）

►双向RNN（Bi-RNN）

►序列到序列（Seq2Seq）模型

►注意力机制（Attention Mechanism）

►机器翻译、语音识别等应用场景

第五节：自注意力Self-Attention和Transformer模型

►编码器、解码器

►自注意力机制详解

►Transformer

►Mask Multi-Head Attention

►位置编码

►特定于任务的输入转换

►无监督预训练、有监督Fine-tuning

►BERT思路的理解

►GPT基本思想

►基于Transformer模型的分类任务

►数据不平衡与领域适应性

►模型选择与调优

►根据项目需求选择合适的深度学习模型

►模型的训练与优化（如调整学习率、使用正则化等）

代码和案例实践：

►基本问答系统的代码实现

►深入阅读理解的代码实现

►段落相关性代码实现

►高考作文神器

►作文生成

第六节：本地大模型私有化部署实操

1 Deepseek-R1蒸馏版的部署实操

1. 模型获取：

※ 通过HuggingFace官方仓库申请权限

※ 下载deepseek-r1-7B、8B、32B、70B的safetensors格式权重

2. 推理服务启动

※ 关键参数trust_remote_code、max_model_len等的讲解

※ 解释器多种启动服务方式对比

3. 服务验证

※ 代码调用

※ 服务API的参数设置

2 Deepseek-R1 671B满血版的部署流程

1. 模型获取：

※ HuggingFace/Modelscope/github的参数下载

2. 硬件配置说明

※ 16张A100，700G显存的刚性支持

※ 2T硬盘空间，权重文件和临时文件

3. 对标模型的比较

※ QwQ系列的突然开源

※ 解释阿里的32B是如何对抗671B的模型的

3 Llama-3-8B快速部署

1. 量化加速

※ FP8的特点

※ 对比Deepseek原论文中量化章节的解读

2. REST API调用：

※ 深度学习系统部署的常用方式

※ 针对AI算法的部署框架

第七节：使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践

1 Deepseek-R1领域数据微调

1. 数据准备：

※ 格式：JSONL文件，每条含instruction/input/output

※ 数据源：财报、券商研报、金融问答对、运营商问答对、意图识别数据

※ 关键处理：使用SentencePiece重组专业术语tokenization

2. QLoRA训练配置

※ 微调在大模型中的常用方法

※ 多种LoRA方式的对别

3. 启动训练

※ 显存优化

※ GPU并行

2 探讨适合微调的业务场景

※ 阐述项目中RAG模式和LoRA模式的选择

※ 探讨微调方案的优势，分析不适合微调的场景

3. UI缺陷检测-多模态微调实践

※ 图像、文本、音频等多模态数据融合原理

※ 基于预训练模型进行多模态微调操作

※ 收集、标注多模态UI 缺陷数据

※ 模型选择与训练

※ 从数据预处理到模型部署的完整操作流程

※ 缺陷检测效果评估

※ 大型软件项目中的UI 缺陷检测

第八节：知识库建设与自定义知识问答RAG

1 私有数据的文档生成系统全流程实操

架构设计：

1. 数据层：Wind API实时获取宏观指标 + PDF解析模块

2. 推理层：

※ Deepseek-R1作为生成核心

※ Mistral-8x7B进行事实核查

3. 评估层：

※ Rouge-L评估内容一致性

※ FinBERT检测财务数据矛盾

以部署拓扑理清整体脉络

常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出

2 基于知识库的问答系统实操

关键技术点：

1. RAG增强：

※ 使用LlamaIndex构建行业知识图谱

※ FAISS向量库实现百万级文档秒级检索

2. 记忆管理：

※ 缓存最近轮次的对话摘要

※ 采用CoT（Chain-of-Thought）提示工程技术

3. 风控拦截：

※ 关键词过滤（如“保证收益”、“100%”等违规表述）

※ 置信度阈值设定（softmax概率<0.7时触发人工接管）

五、培训费用及注意事宜：

1、培训费：4600/人（含培训费、午餐、讲义资料费等）。

2、培训期间食宿统一安排，费用自理。

3、收款、开发票、培训会务工作由北京中际孚歌科技有限公司负责。

六、证书颁发：培训结束后由主办单位向学员颁发结业证书。

七、课程咨询：010-64113137

北京中际赛威文化发展有限公司

2026年5月 北京人工智能-Python深度学习进阶与大模型核心技术原理实战高级培训班

2026年5月北京人工智能-Python深度学习进阶与大模型核心技术原理实战高级培训班