Udemy線上課程 (Ken Cen出品)Generative AI第18部 如何訓練DeepSeek大語言模型 講師:Ken Cen 影音教學 中文發音 繁體中文(DVD版)
Udemy線上課程 (Ken Cen出品)Generative AI第18部 如何訓練DeepSeek大語言模型 講師:Ken Cen 影音教學 中文發音 繁體中文(DVD版)
內容說明:
掌握AI未來:用Python代碼拆解DeepSeek-R1,開啟低成本大模型訓練之旅——從理論到實踐,手把手教你成為下一代AI開發者
DeepSeek-R1:一場全球AI競賽的顛覆性突破
2025年初,中國AI企業DeepSeek憑借開源模型DeepSeek-R1震撼全球,其性能與OpenAI的頂級推理模型o1旗鼓相當,但成本僅為後者的1/40!這一突破不僅讓亞馬遜、
微軟等科技巨頭爭相接入,更引發美國政界與科技界的雙重震動
課程包括內容:
DeepSeek的發展與技術特點(DeepSeek V1, DeepSeek V2, DeepSeek V3, DeepSeek R1-Zero, DeepSeek R1, )神經網絡Neural Networks的組成和原理前饋神經網絡的原理&數據加載(輸入層,隱藏層, Soft
Max,Logits,激活函數,輸出層)如何用Python訓練前饋神經網絡(tensor, epoch)什麼是Transformer & Attention & MHA & GQA & MQA(Transformer, Attention, Positional Embedding)什麼是MLA & RoPE & MoE用Python編寫MLA的各層和結構如何添加RotaryEmbedding到MLA如何用Python編寫混合專家架構如何實現訓練和編寫DeepSeekModel如何實現 Transformer(Encoder, Decoder)
課程內容:
01 - 介紹
001 課程工具準備.mp4
002 如何安裝和使用包管理器.mp4
003 Windows安裝使用Poetry的方法.html
02 - Deepseek V1
001 DeepSeek的發展與技術特點.mp4
002 神經網絡Neural Networks的組成和原理.mp4
003 前饋神經網絡的原理&數據加載.mp4
004 如何用Python訓練前饋神經網絡.mp4
03 - DeepSeek V2
001 什麼是Transformer & Attention & MHA & GQA & MQA.mp4
002 什麼是MLA & RoPE & MoE.mp4
003 用Python編寫MLA的各層和結構.mp4
004 如何添加RotaryEmbedding到MLA.mp4
005 如何用Python編寫混合專家架構.mp4
006 如何實現訓練和編寫DeepSeekModel.mp4
04 - Transformer
001 如何編寫多頭注意力機制.mp4
002 如何編寫Positional Encoding - 位置編碼.mp4
003 如何編寫Transformer 的編碼器和解碼器.mp4
004 如何實現Transformer的訓練和評估.mp4
站內搜索
購物車
熱門關鍵字
51job
前程無憂
Frank
學院
Qingming
Wpf詳解
Zhao
工作效率
女性領導力
三節課
下篇
六卦詳解
王思迅
文富
打造獨角獸
光佑
有個小院
行銷
東東
東東好課
佳旋
易經開門課
的環境預備
若水
美伊
思迅
星空
面對痛苦
渡人渡己
紫微篇
資承
遍路文化
漢化課程
養心
養身
養神
編程入門
養體
霍大俠
觸發器