抛开复杂的数学定义,单看核心架构,DeepSeek 这次提出的 mHC,其核心 idea 最早其实来自字节跳动豆包团队 2024 年提出的 Hyper-Connections (HC)。 DeepSeek 保留了 HC ...
作者|周一笑邮箱|zhouyixiao@pingwest.com2026年的第一天,DeepSeek 在 arXiv 上发布了一篇新论文《mHC: Manifold-Constrained Hyper-Connections》,提出了名为 ...
智东西1月1日报道,昨日晚间,DeepSeek团队送出一份新年“贺礼”,正式发布新论文《Manifold-Constrained Hyper-Connections》, 提出一种能稳定训练并提升大模型可扩展性的残差连接新方案 。