一、研修时间:2026年5月29-31日
二、研修地点:北京
三、主办单位:北京中际孚歌科技有限公司
北京中际赛威文化发展有限公司
四、研修内容:
第一节:Python深度学习基础
►深度学习在图像处理、文本分类中的应用场景
►深度学习和神经网络基础
►激活函数、损失函数与优化算法
►反向传播算法
►深度神经网络模型
►BP神经网络
►卷积神经网络(CNN)
►循环神经网络(RNN)
►动手实践:构建简单的神经网络
►使用Python和TensorFlow/PyTorch构建和训练神经网络模型
►数据预处理与模型评估
第二节:卷积神经网络原理及其应用
►AlexNet、VGGNet、GoogleLeNet
►Inception-V3/V4
►ResNet、DenseNet
►使用迁移学习实现蒙古文识别
►获取中间隐层的特征及可视化
►隐层特征的意义和使用
►迁移学习的trick
►学习率、衰减
►模型预训练方式(为后面大模型做技术铺垫)
代码和案例实践:
►数字图片分类
►卷积核与特征提取
►以图搜图
►海量蒙古文识别
►隐特征可视化及其应
第三节:目标检测
►视频关键帧处理
►卷积的位置不变形与图像定位的关系
►物体检测与定位
►RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN
►YOLO、SSD
►UNet及其与残差网络的结合
►FaceNet与特征
►EfficientNet、EfficientDet
►视频帧的目标定位
►时空卷积网络
►SlowFast
代码和案例实践:
►人脸检测
►OCR字体定位和识别
►睿客识云
►气象识别
►视频分类的trick
►政务大厅视频监控的真实系统
第四节:循环神经网络及其应用
►数据预处理与序列填充
►数据集划分(训练集、验证集、测试集)
►使用深度学习框架(PyTorch和TensorFlow)构建RNN模型
►自定义RNN层
►堆叠RNN层(多层RNN)
►损失函数的选择(如均方误差、交叉熵等)
►评估指标的选择(如准确率、召回率、F1分数等)
►验证集与测试集上的性能评估
►GRU(门控循环单元)
►双向RNN(Bi-RNN)
►序列到序列(Seq2Seq)模型
►注意力机制(Attention Mechanism)
►机器翻译、语音识别等应用场景
第五节:自注意力Self-Attention和Transformer模型
►编码器、解码器
►自注意力机制详解
►Transformer
►Mask Multi-Head Attention
►位置编码
►特定于任务的输入转换
►无监督预训练、有监督Fine-tuning
►BERT思路的理解
►GPT基本思想
►基于Transformer模型的分类任务
►数据不平衡与领域适应性
►模型选择与调优
►根据项目需求选择合适的深度学习模型
►模型的训练与优化(如调整学习率、使用正则化等)
代码和案例实践:
►基本问答系统的代码实现
►深入阅读理解的代码实现
►段落相关性代码实现
►高考作文神器
►作文生成
第六节:本地大模型私有化部署实操
1 Deepseek-R1蒸馏版的部署实操
1. 模型获取:
※ 通过HuggingFace官方仓库申请权限
※ 下载deepseek-r1-7B、8B、32B、70B的safetensors格式权重
2. 推理服务启动
※ 关键参数trust_remote_code、max_model_len等的讲解
※ 解释器多种启动服务方式对比
3. 服务验证
※ 代码调用
※ 服务API的参数设置
2 Deepseek-R1 671B满血版的部署流程
1. 模型获取:
※ HuggingFace/Modelscope/github的参数下载
2. 硬件配置说明
※ 16张A100,700G显存的刚性支持
※ 2T硬盘空间,权重文件和临时文件
3. 对标模型的比较
※ QwQ系列的突然开源
※ 解释阿里的32B是如何对抗671B的模型的
3 Llama-3-8B快速部署
1. 量化加速
※ FP8的特点
※ 对比Deepseek原论文中量化章节的解读
2. REST API调用:
※ 深度学习系统部署的常用方式
※ 针对AI算法的部署框架
第七节:使用蒸馏大模型完成微调、数据准备过程、模型训练代码实践
1 Deepseek-R1领域数据微调
1. 数据准备:
※ 格式:JSONL文件,每条含instruction/input/output
※ 数据源:财报、券商研报、金融问答对、运营商问答对、意图识别数据
※ 关键处理:使用SentencePiece重组专业术语tokenization
2. QLoRA训练配置
※ 微调在大模型中的常用方法
※ 多种LoRA方式的对别
3. 启动训练
※ 显存优化
※ GPU并行
2 探讨适合微调的业务场景
※ 阐述项目中RAG模式和LoRA模式的选择
※ 探讨微调方案的优势,分析不适合微调的场景
3. UI缺陷检测-多模态微调实践
※ 图像、文本、音频等多模态数据融合原理
※ 基于预训练模型进行多模态微调操作
※ 收集、标注多模态UI 缺陷数据
※ 模型选择与训练
※ 从数据预处理到模型部署的完整操作流程
※ 缺陷检测效果评估
※ 大型软件项目中的UI 缺陷检测
第八节:知识库建设与自定义知识问答RAG
1 私有数据的文档生成系统全流程实操
架构设计:
1. 数据层:Wind API实时获取宏观指标 + PDF解析模块
2. 推理层:
※ Deepseek-R1作为生成核心
※ Mistral-8x7B进行事实核查
3. 评估层:
※ Rouge-L评估内容一致性
※ FinBERT检测财务数据矛盾
以部署拓扑理清整体脉络
常规分析、复杂计算、数据采集、向量数据库、路由决策、Deepseek-R1/Mistral-8x7B、合规审查、PDF输出
2 基于知识库的问答系统实操
关键技术点:
1. RAG增强:
※ 使用LlamaIndex构建行业知识图谱
※ FAISS向量库实现百万级文档秒级检索
2. 记忆管理:
※ 缓存最近轮次的对话摘要
※ 采用CoT(Chain-of-Thought)提示工程技术
3. 风控拦截:
※ 关键词过滤(如“保证收益”、“100%”等违规表述)
※ 置信度阈值设定(softmax概率<0.7时触发人工接管)
五、培训费用及注意事宜:
1、培训费:4600/人(含培训费、午餐、讲义资料费等)。
2、培训期间食宿统一安排,费用自理。
3、收款、开发票、培训会务工作由北京中际孚歌科技有限公司负责。
六、证书颁发:培训结束后由主办单位向学员颁发结业证书。
七、课程咨询:010-64113137