跳到主要内容

学习

Learning.

📄️ 周报

20250410

📄️ Qwen 进化史：27 篇论文深度复盘 Qwen 模型家族

自 2023 年生成式人工智能迎来爆发以来，LLM 技术的发展已从单纯的堆训练数据、堆参数量，转向了架构效率、模态融合以及长上下文推理能力的深水区。

📄️ Making Sense of AI: From LLMs to Agents and Beyond

Keeping up with AI today is exhausting.

📄️ Wan 学习笔记

Wan 视频扩散模型学习笔记

📄️ 金融场景的增长营销

金融领域算法应用场景：

📄️ RAG 的六大难题

RAG 本身并不算是个坏主意。我们认真实践过，也确实在某些场景下跑通了。

📄️ LLM Pretrain

背景篇

📄️ Kimi K2

论文

📄️ DeepSeek v3.2

论文

📄️ Deepseek-R1-Zero复现实验整理

原文

📄️ Mamba 模型学习笔记

笔记来源：bilibili

📄️ 我心中的SOTA

一、AIGC

📄️ LLM

ML

📄️ 一站式 LLM入门

1.1 人工智能概念与分支

📄️ VERL

VERL (Volcano Engine Reinforcement Learning) 是一个专为大语言模型（LLM）后训练设计的灵活、高效且可用于生产环境的强化学习（RL）训练框架。它是发表在 EuroSys 2025 的论文《HybridFlow: A Flexible and Efficient RLHF Framework》的开源实现。

📄️ DeepSpeed

为什么需要分布式训练？

📄️ 强化学习

磨菇书

📄️ Kaggle Ensembling Guide

代码

📄️ 工程矩阵

工程矩阵的定义

📄️ DOA估计

MIMO阵列信号来向DOA估计实现

📄️ Cramer-Rao Lower Bound

参数估计

📄️ Csi-feedback

这个代码仿真实现了CsiNet,CsiCNNTransformerNet,CsiTransformerNet,CS_Net

📄️ 通信笔记

推荐看原书《通信之道——从微积分到5G》

📄️ DFT

基本知识

📄️ 信息论基础知识

信息论回答了通信理论中的两个基本问题：

📄️ 我的八股

- 华为杯