2026
-
自私的基因:第 4 章 基因机器
TLDR:身体和大脑是基因构建的行动机器:基因建立了机器,但快速行为必须委托给感知、记忆和决策系统。
-
自私的基因:第 5 章 进犯行为
TLDR:攻击性不是越狠越好。稳定的策略取决于伤害成本、资源价值、对手行为和更大的种群组合。
-
自私的基因:第 6 章 基因种族
TLDR:亲属选择解释了为什么帮助亲戚仍然可以服务于自私的基因,因为相同的基因可能通过另一个身体保存下来。
-
CS336:第 3 讲 LM 架构与超参数
TLDR:现代 LM 架构是一组工程权衡:归一化、激活函数、注意力、位置编码、超参数、稳定性和推理成本会互相牵制。
-
CS336:第 4 讲 Mixture of Experts
TLDR:MoE 通过稀疏专家路由扩大参数量,但真正的难点是平衡 token 负载、容量、通信成本和专家分工。
-
田远东谈:搜索质量就是动作空间质量
TLDR:更多 rollout 还不够。只有当动作空间、表示、评估器和记忆让好轨迹更容易被找到时,搜索才会真正变强。
-
Concordia:把 LLM 智能体作为社会模拟参与者
Concordia 很有用,因为它将 LLM 智能体视为具有记忆、角色、规范、部分观察和由游戏大师调节的世界状态的情境社会参与者。
-
压缩就是你所需要的:衡量数学进步
TLDR:数学抽象在压缩下游工作时很有价值:证明变得更短,重复的模式消失,并且库变得更容易扩展。