课程内容
课程采用“四阶段进阶”体系,构建全栈技术能力。
基础筑基:覆盖Python与PyTorch核心工具,解析Transformer架构及BERT、GPT等经典模型原理,搭配数学基础(线性代数、概率统计)的工程化应用。
专项突破:聚焦LLM微调(LoRA技术)、模型量化(TensorRT)、多模态融合(CLIP架构)等核心技术,新增星盾安全架构、AI多模态交互等前沿内容。
工程化实战:通过金融风控、医疗文档分析、智能制造预测性维护等企业级项目,掌握LangChain、向量数据库、K8s部署等全流程技能。
架构进阶:学习千亿参数模型训练pipeline、DeepSpeed并行计算及模型服务平台设计,探索量子-经典混合模型等前沿方向。
课程特色
技术栈前沿性:同步2025年最新工具链,涵盖PyTorch 2.1、LangChain 1.5、DeepSpeed 1.12等,适配华为云ModelArts等主流平台。
实战场景落地:采用银行脱敏交易数据、三甲医院病历等真实数据,提供NVIDIA A100集群实训环境,还原从需求分析到上线监控的全流程闭环。
能力双轨培养:兼顾技术专家路线与架构师路线,融入产品思维与项目管理内容。
经验迁移适配:针对传统开发者设计转型路径,实现Java等技术经验向AI系统设计的迁移复用。
课程目标
技术能力:掌握大模型架构设计、训练优化、部署运维全链路技术,能独立完成垂直领域大模型解决方案设计。
工程能力:具备多机多卡分布式训练、模型轻量化及高并发服务架构设计能力,保障系统性能与可扩展性。
职业适配:满足企业对AI架构师的核心需求,能将业务需求转化为技术方案,实现商业价值量化。
前沿视野:建立技术雷达体系,具备追踪学术前沿、适配新技术的持续学习能力。
适合对象
有3年以上开发经验的技术人员,希望转型AI架构师,实现经验升维迁移者;
人工智能、计算机相关专业在校生或初级从业者,寻求技术深度突破,瞄准高端岗位者;
企业技术团队核心成员、研发负责人,需主导AI项目落地,设计企业级大模型系统者;
具备基础编程能力,想深耕分布式AI系统领域,掌握前沿技术的技术爱好者。
