2026年5月 北京人工智能-Python深度学习进阶与大模型核心技术原理实战高级培训班

  • 课程详情

一、研修时间:2026年5月29-31日   

二、研修地点:北京

三、主办单位:北京中际孚歌科技有限公司

                          北京中际赛威文化发展有限公司

四、研修内容:

第一节:Python深度学习基础

深度学习在图像处理、文本分类中的应用场景

深度学习和神经网络基础

激活函数、损失函数与优化算法

反向传播算法

深度神经网络模型

BP神经网络

卷积神经网络(CNN)

循环神经网络(RNN)

动手实践:构建简单的神经网络

使用Python和TensorFlow/PyTorch构建和训练神经网络模型

数据预处理与模型评估

第二节:卷积神经网络原理及其应用

AlexNet、VGGNet、GoogleLeNet

Inception-V3/V4

ResNet、DenseNet

使用迁移学习实现蒙古文识别

获取中间隐层的特征及可视化

隐层特征的意义和使用

迁移学习的trick

学习率、衰减

模型预训练方式(为后面大模型做技术铺垫)

代码和案例实践:

数字图片分类

卷积核与特征提取

以图搜图

海量蒙古文识别

隐特征可视化及其应

第三节:目标检测

视频关键帧处理

卷积的位置不变形与图像定位的关系

物体检测与定位

RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN

YOLO、SSD

UNet及其与残差网络的结合

FaceNet与特征

EfficientNet、EfficientDet

视频帧的目标定位

时空卷积网络

SlowFast

代码和案例实践:

人脸检测

►OCR字体定位和识别

睿客识云

气象识别

视频分类的trick

政务大厅视频监控的真实系统

第四节:循环神经网络及其应用

数据预处理与序列填充

数据集划分(训练集、验证集、测试集)

使用深度学习框架(PyTorch和TensorFlow)构建RNN模型

自定义RNN层

堆叠RNN层(多层RNN)

损失函数的选择(如均方误差、交叉熵等)

评估指标的选择(如准确率、召回率、F1分数等)

验证集与测试集上的性能评估

GRU(门控循环单元)

双向RNN(Bi-RNN)

序列到序列(Seq2Seq)模型

注意力机制(Attention Mechanism)

机器翻译、语音识别等应用场景

第五节:自注意力Self-Attention和Transformer模型

编码器、解码器

自注意力机制详解

Transformer

Mask Multi-Head Attention

位置编码

特定于任务的输入转换

无监督预训练、有监督Fine-tuning

BERT思路的理解

GPT基本思想

基于Transformer模型的分类任务

数据不平衡与领域适应性

模型选择与调优

根据项目需求选择合适的深度学习模型

模型的训练与优化(如调整学习率、使用正则化等)

代码和案例实践:

基本问答系统的代码实现

深入阅读理解的代码实现

段落相关性代码实现

高考作文神器

作文生成

第六节:本地大模型私有化部署实操

1 Deepseek-R1蒸馏版的部署实操

1. 模型获取:

通过HuggingFace官方仓库申请权限

下载deepseek-r1-7B、8B、32B、70B的safetensors格式权重

2. 推理服务启动

关键参数trust_remote_code、max_model_len等的讲解

解释器多种启动服务方式对比

3. 服务验证

代码调用

服务API的参数设置

2 Deepseek-R1 671B满血版的部署流程

1. 模型获取:

HuggingFace/Modelscope/github的参数下载

2. 硬件配置说明

16张A100,700G显存的刚性支持

2T硬盘空间,权重文件和临时文件

3. 对标模型的比较

QwQ系列的突然开源

解释阿里的32B是如何对抗671B的模型的

3 Llama-3-8B快速部署

1. 量化加速

FP8的特点

对比Deepseek原论文中量化章节的解读

2. REST API调用:

深度学习系统部署的常用方式

针对AI算法的部署框架

第七节:使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践

1 Deepseek-R1领域数据微调

1. 数据准备:

格式:JSONL文件,每条含instruction/input/output

数据源:财报、券商研报、金融问答对、运营商问答对、意图识别数据

关键处理:使用SentencePiece重组专业术语tokenization

2. QLoRA训练配置

微调在大模型中的常用方法

多种LoRA方式的对别

3. 启动训练

显存优化

GPU并行

2 探讨适合微调的业务场景

阐述项目中RAG模式和LoRA模式的选择

探讨微调方案的优势,分析不适合微调的场景

3. UI缺陷检测-多模态微调实践

图像、文本、音频等多模态数据融合原理

基于预训练模型进行多模态微调操作

收集、标注多模态UI 缺陷数据

模型选择与训练

从数据预处理到模型部署的完整操作流程

缺陷检测效果评估

大型软件项目中的UI 缺陷检测

第八节:知识库建设与自定义知识问答RAG

1 私有数据的文档生成系统全流程实操

架构设计:

1. 数据层:Wind API实时获取宏观指标 + PDF解析模块

2. 推理层:

Deepseek-R1作为生成核心

Mistral-8x7B进行事实核查

3. 评估层:

Rouge-L评估内容一致性

FinBERT检测财务数据矛盾

以部署拓扑理清整体脉络

常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出

2 基于知识库的问答系统实操

关键技术点:

1. RAG增强:

使用LlamaIndex构建行业知识图谱

FAISS向量库实现百万级文档秒级检索

2. 记忆管理:

缓存最近轮次的对话摘要

采用CoT(Chain-of-Thought)提示工程技术

3. 风控拦截:

关键词过滤(如“保证收益”、“100%”等违规表述)

置信度阈值设定(softmax概率<0.7时触发人工接管)

五、培训费用及注意事宜:

1、培训费:4600/人(含培训费、午餐、讲义资料费等)。                 

2、培训期间食宿统一安排,费用自理。

3、收款、开发票、培训会务工作由北京中际孚歌科技有限公司负责。

六、证书颁发:培训结束后由主办单位向学员颁发结业证书。

七、课程咨询:010-64113137