HASHKFK
BETHASH官方网站(访问: hash.cyou 领取999USDT)
主流AI推理架构深度依赖片上SRAM以换取高速,但SRAM正面临严峻的微缩困境。传统SRAM每个存储单元由6个晶体管(6T)组成,存储密度低,存储容量小,存储典型的DeepSeek-R1-671B大语言模型可能需要数千片Groq LPU芯片,且5nm以下节点尺寸几乎停止缩减;而MRAM天然采用1T1M(1个晶体管+1个磁隧道结)结构,单个MTJ可以执行SRAM 6个晶体管的存储功能,同等芯片面积和工艺节点下,存储密度是SRAM的5-6倍。
据了解,英伟达GPU的架构最初面向大规模训练与图形渲染场景设计,强调峰值算力与吞吐能力,并通过多级缓存、动态调度和共享存储来适配高度并行但相对粗粒度的工作负载。在大模型推理的Decode阶段,GPU性能瓶颈主要来自对外部存储(HBM)和复杂内存层级的高度依赖。该计算过程呈现出强序列性、小批量和带宽主导等特征,与GPU设计初衷明显错配。在实际执行中,GPU仍需要通过多级缓存和共享存储来访问,数据到达计算单元的时间并不固定,不同计算单元之间也需要反复等待和协调。这使得访存延迟和执行顺序经常波动,矩阵加乘单元很难按照固定节拍持续运行,算力难以稳定发挥。
据报道,寒序科技是国内首个有能力跑通从物理、材料、器件到异质集成、芯片设计、算法的交叉团队,核心成员源自北京大学物理学院应用磁学中心——国内磁学研究的顶尖高地,拥有近70年的磁学积淀,核心成员横跨凝聚态物理、电子科学、计算机技术、人工智能等多领域:首席执行官朱欣岳兼具凝聚态物理、人工智能算法与集成电路的交叉背景,曾主导多模态AI算法开发、多颗高性能专用芯片研发,带领团队完成四轮市场化财务融资与产品化;首席科学家罗昭初作为MIT TR35入选者,曾于清华大学、苏黎世联邦理工学院完成自旋电子学、磁性计算的科研工作,深耕微纳磁电子学与磁存储/计算,拥有深厚的学术积累与Nature、Science正刊成果,团队历经多次流片验证,既保有前沿技术探索的锐气,又具备工程化落地的能力。
恩智浦与台积电合作推出16nm FinFET车规级eMRAM,应用于其S32系列高端MCU,实现写入速度比传统闪存快10-15倍、耐久性超百万次;瑞萨电子也推出了基于22nm工艺的STT-MRAM技术,瞄准汽车MCU市场;GlobalFoundries、Everspin在12nm和22nm工艺上紧密合作,将MRAM纳入工业级和车规级量产方案;Avalanche与联电携手合作推出22nm STT-MRAM,在工业级和航天级市场拥有深厚积淀。
RRAM领域涌现出昕原半导体、铭芯启睿、燕芯微等玩家;MRAM赛道,寒序科技、致真存储、驰拓科技、凌存科技、亘存科技等纷纷崭露头角,为国内MRAM的发展奠定了产业基础。相对于RRAM基于电子电荷迁移,是一种统计物理范畴下的阻变器件;MRAM的存取机理是基于自旋的确定性两态翻转,更加可控、精准,大规模制造下器件一致性、器件寿命极限都更有优势与潜力。两者均被台积电等半导体巨头作为下一代面向AI的存储技术重点押注。