学习大纲
目录
LLM —— Parameter Calculation
详解大模型的参数计算与效率分析——以LLaMA为例
Daily LLM —— MoE
详解MoE
LLM —— KV Cache
有哪些KV Cache方法?MLA如何实现KV Cache?
LLM —— Efficient Training
LLM中的高效训练技术
LLM —— Mixed Precision Training
为什么LLM中使用BF16而不是FP16?
Daily LLM —— Norm
为什么LLM都使用RMSNorm和Pre-Norm?
Papers Reading about LLM
LLM论文阅读笔记
Daily Leetcode
每日刷题
Technical Summary —— Pytorch & Numpy
技术总结——深度学习常用Pytorch, Numpy
Technical Summary —— Common Command
技术总结——常用命令Shell、Git、Vim
Get Target Mask for Zero-shot Learning
Zero-shot根据文字提示分割出图片目标掩码
Technical Summary —— Big Data Processing
技术总结——大数据处理常用Pyspark, Pandas
Technical Summary —— Database Usage
技术总结——数据库常用MySQL, Hive SQL, Spark SQL
Causal Inference
因果推断
avatar
贪钱算法还我头发
Follow Me
Announcement
👋你好呀,欢迎围观~搭建这个小站源于一个朴素的愿望:对抗遗忘,沉淀思考。期待在代码与逻辑的世界里探索技术的深度与广度,永远保持热情与好奇。