「玉盘AI」发布SRDA计算白皮书,为下一代AI算力基础设施赋能

「玉盘AI」发布SRDA计算白皮书,为下一代AI算力基础设施赋能

芯云伙伴企业「玉盘MoonQuest.AI」近日正式发布《SRDA计算架构白皮书》,首次提出从芯片设计到系统层级的I/O全栈优化的方案路线,对可重构计算、存算一体、分布式3D-dram、RISC-V、光电融合互联等前沿技术系统级应用的工程实现方案进行了介绍。
更多详情

2025,开启以“数据为中心”的下一代AI算力基础设施新篇章

「玉盘AI」发布SRDA计算白皮书,为下一代AI算力基础设施赋能

据Garner预测,2028年非GPGPU架构的AI专用处理器市场规模将超过328亿美元,超过50%的大模型推理荷载将由非GPGPU架构的AI-DSA(AI特定场景专用)处理器承担。

  • 工业界,Google、Meta、OpenAI等巨头,以及Etched、Groq、Furiosa等初创企业,已率先投资于AI-DSA架构创新,以替代大模型智算对通用GPU处理器的硬件依赖,降低模型应用成本。

  • 需求侧,大模型底层架构收敛,主流算力需求聚焦少数模型训推场景;大模型技术应用的广度与深度取决于模型算力性价比。

  • 学术界,存算一体、可重构计算、RISC-V等计算范式研究持续突破。国内外高校,如南京大学等研究团队在相关方向上均取得前沿进展,为新一代AI-DSA计算架构技术产品化奠定理论基础。

  • 供应链,对AI计算起到革命性意义的供应链关键环节(例如大容量3D-DRAM堆叠技术)走向成熟,可支持原生适配分布式内存的AI-DSA全栈优化方案量产。

 

据调查统计,2025年主流大模型中,基于Transformer的架构占比达92%,且主要算力消耗集中于R1、Qwen等头部开源模型。

这一趋势催生了新一代AI-DSA ASIC(特定领域架构专用芯片)的规模化落地——无需构建全场景通用生态,仅需深度优化2-3个核心模型的训练与推理流程,即可覆盖80%以上市场需求。

 

芯云伙伴企业「玉盘MoonQuest.AI」近日正式发布《SRDA计算架构白皮书》

白皮书首次提出从芯片设计到系统层级的I/O全栈优化的方案路线,对可重构计算、存算一体、分布式3D-dram、RISC-V、光电融合互联等前沿技术系统级应用的工程实现方案进行了介绍。

「玉盘AI」发布SRDA计算白皮书,为下一代AI算力基础设施赋能

SRDA计算架构白皮书详见地址:https://github.com/moonquest-ai/SRDA

玉盘技术负责人表示:“下一代AI基础设施用户核心需求的不再是通用算力峰值性能,而是快且性价比高的系统应用算力,SRDA的本质是让算力‘如水流般’动态适配系统级集群计算的数据,而非让数据适应计算,这是国产AI芯片换道超车的时代机遇。”

 

指数级增长的海量的AIGC算力需求正在重构技术普惠化阶段的行业格局

芯云将持续关注超越摩尔时代的新计算架构(存算一体可重构计算、光电异质融合计算)以及颠覆性创新的关键器件/IP技术(硅基量子计算、光电子器件等)。

在AIGC领域模型算力需求收敛趋同(少数开源主导),商业化模式标准化(模型API调用计量收费)的大背景下,玉盘Moonquest.AI SRDA计算架构技术,将有望以“单位算力成本最优解"的范式拥抱人工智能时代变革机遇。