深色模式
来源提示
本系列内容部分借鉴和学习了柳浩老师的博客,已得到作者许可,转载请标注来源!
柳浩老师的Transformer系列文章,写的深入且具体,很值得阅读和学习。 同时推荐一本作者的书籍《分布式机器学习》,正在阅读中(2025年三月)
一部分是我自己的整理