MiniMax Sparse Attention 将长上下文转化为可搜索记忆:学习索引选择相关的键值块,然后精确的 Softmax Attention 仅读取这些块。
2分钟阅读 · 2026年6月15日
2026 · llm · long-context · sparse-attention · research · systems