📄️ 周报
20250410
📄️ Qwen 进化史:27 篇论文深度复盘 Qwen 模型家族
自 2023 年生成式人工智能迎来爆发以来,LLM 技术的发展已从单纯的堆训练数据、堆参数量,转向了架构效率、模态融合以及长上下文推理能力的深水区。
📄️ Making Sense of AI: From LLMs to Agents and Beyond
Keeping up with AI today is exhausting.
📄️ Wan 学习笔记
Wan 视频扩散模型学习笔记
📄️ 金融场景的增长营销
金融领域算法应用场景:
📄️ RAG 的六大难题
RAG 本身并不算是个坏主意。我们认真实践过,也确实在某些场景下跑通了。
📄️ LLM Pretrain
背景篇
📄️ Kimi K2
论文
📄️ DeepSeek v3.2
论文
📄️ Deepseek-R1-Zero复现实验整理
原文
📄️ Mamba 模型学习笔记
笔记来源:bilibili
📄️ 我心中的SOTA
一、AIGC
📄️ LLM
ML
📄️ 一站式 LLM入门
1.1 人工智能概念与分支
📄️ VERL
VERL (Volcano Engine Reinforcement Learning) 是一个专为大语言模型(LLM)后训练设计的灵活、高效且可用于生产环境的强化学习(RL)训练框架。它是发表在 EuroSys 2025 的论文 《HybridFlow: A Flexible and Efficient RLHF Framework》的开源实现。
📄️ DeepSpeed
为什么需要分布式训练?
📄️ 强化学习
磨菇书
📄️ Kaggle Ensembling Guide
代码
📄️ 工程矩阵
工程矩阵的定义
📄️ DOA估计
MIMO阵列信号来向DOA估计实现
📄️ Cramer-Rao Lower Bound
参数估计
📄️ Csi-feedback
这个代码仿真实现了CsiNet,CsiCNNTransformerNet,CsiTransformerNet,CS_Net
📄️ 通信笔记
推荐看原书《通信之道——从微积分到5G》
📄️ DFT
基本知识
📄️ 信息论基础知识
信息论回答了通信理论中的两个基本问题:
📄️ 我的八股
- 华为杯