开云app 这家国产GPU厂商, 再获超10亿元融资!

开云app 这家国产GPU厂商，再获超10亿元融资!

4月20日，国内全栈自研 AI 推理 GPU 企业——杭州曦望芯科智能科技有限公司（简称“曦望”）通过官方微信公众号告示，照旧完成新一轮超10亿元东谈主民币融资。

而在前年7月初，曦望才刚完成近10亿元融资。那时这轮融资由三一集团旗下华胥基金、第四范式、游族网罗、北京利尔、松禾本钱、海通开元等多家机构共同参与。

没意想，时隔仅10个月不到，曦望又完成了新一轮超10亿元的融资。

至此，分拆零丁仅一年多的曦望已累计完成七轮融资，总融资额约 40 亿元，成为国内首家估值超百亿的纯推理 GPU 独角兽。

据先容，本轮融资资金将主要用于新一代启望 S3 推理 GPU 的鸿沟化量产寄托、全栈软件生态建筑，以及 S4/S5 后续芯片的研发迭代。

曦望在官方新闻稿中指出，2026 年被行业公合计“AI 智能体元年”。跟着大模子从“会聊天”进化为“会念念考、会推行”的数字职工，推理需求迎来爆发式增长。英伟达 GTC 2026 大会精良宣告 AI 产业全面迈入“推理落地、智能体普及”的新期间，将“每瓦 Token 蒙胧量”界说为 AI 期间的中枢竞争力。这与曦望自创立之初就锁定的中枢战场高度契合。

“AI 算力基建的要点已澈底切换。”曦望董事长徐冰暗示，“2026 年 AI 推理计较需求将达到磨练需求的 4-5 倍，推理算力租借价钱半年涨幅近 40%。”

贵寓裸露，曦望前身是商汤大芯片部门，2024年底分拆零丁运营，专注于高性能GPU及多模态场景AI推理芯片的研发与交易化。公司研发团队凭借8年本事千里淀、20亿研发插足及两代量产芯片的工程化考证，已成为国产GPU替代的中枢力量。公司致力于于为千行百业提供成本裁汰10倍、能效比冲突的智能算力基石，通过本事立异和深度产业协同，推动各行业的智能化发展，并助力实现通用东谈主工智能（AGI）的普惠化办法。

当今，曦望团队鸿沟已增长至 400 东谈主，研发东谈主员占比超 80%，集聚了来自英伟达、AMD、华为海念念等国表里顶尖芯片企业的中枢东谈主才，硕士及以上学历占比超 80%。团队交融了芯片策画、高性能计较、AI 算法、软硬产物的跨行业东谈主才。

在具体产物方面，曦望当今的产物线主要包括照旧量产的曦望S1、S2和行将量产的S3。

△从左至右：曦望 S1、曦望 S2-M1模组、曦望 S2-X1加快卡

其中，S1是面向云霄和旯旮详察觉推理的专用芯片，主要用于视频分析模子推理，复古CV类东谈主工智能应用的计较需求，出货量已越过2万片；

S2是面向大模子推理的GPGPU产物，汲取汲取7nm工艺，兼容主流的英伟达CUDA生态，其性能水平可对标英伟达A100。S2的研发涵盖辅导集、GPGPU IP架构、算子开采及编译器器具链等一谈中枢本事，实现全齐自研。

曦望于2026年1月精良发布了新一代旗舰产物启望 S3 推理 GPU。这是国内首款搭载 LPDDR6 且兼容 LPDDR5X 内存的推理 GPU，开云体育官网它莫得盲目照搬高端磨练 GPU 的 HBM 显存阶梯，而是基于 Agent 推理的本体需求，从 AI Core 计较架构到内存 IO 系统进行了全链路重构。

据先容，启望 S3 通过计较层的深度定制，处理了通用 GPU“算力用动怒”的核肉痛点，推感性能较上一代 S2 提高 5 倍，办法实现 Token 成本着落 90%。

具体来说，启望 S3 将GEMM 和 Flash Attention 两项核默算子（在大模子推理中，占估量较量的 90%以上）的欺诈率辩认推至约 99%与 98%，标称算力真的齐滚动为灵验蒙胧，相同硬件插足可事业更多并发申请。

启望 S3 汲取 128-bit 辅导集+支执 3D 辅导，辅导密度当先传统 SIMT 架构；零丁线程疗养精确匹配智能体复杂适度流，撤销要求跳转带来的活水线代价；通过 Block cluster 和 Broadcast 等本事实现片上数据复用，减少对外带宽依赖，大幅提高 Agent 多轮推理效果。

启望 S3 收复生支执 FP16 至 FP4 全链路低精度运算，在 DeepSeek V3/R1 等主流模子上实现接近无损的 FP4 推理，蒙胧量较 FP16 提高 3-4 倍，平直滚动为客户侧的毛利空间和价钱弹性。

在接口方面，启望 S3 立异性地集成了LPDDR6内存接口、高速 SerDes+SUE 交融互联本事、PCIe Gen6接口这三大先进高速接口本事，从内存和 IO 两个推理期间最中枢的瓶颈脱手，处理了智能体三大中枢瓶颈。

从产业周期看，磨练侧神色已相对固化，而推理侧正随 Agentic AI 放量进入指数级增长通谈——多家机构探究，以前五年推理算力阛阓鸿沟将杰出磨练侧数倍，其中 Agent 类负载将孝顺最主要的增量。

曦望暗示，启望 S3 同期具备三个难以共存的成分：推理原生的架构前瞻性；实现 98-99% 算子欺诈率的顶尖工程才调；圆善的生态适配才调。

“启望 S3 不是大概的性能升级，而是一次对 AI 推理成本弧线的重构。”徐冰暗示，“咱们的办法是将推理成本降至‘百万 Token 一分钱’，让 AI 像水电一样成为普惠基础重要。”

在本轮融资的助力下，2026 年，曦望将围绕“落地、终了、增长”中枢原则，将全力鼓吹启望 S3 芯片量产寄托开云app，完成与国表里主流大模子、多模态模子和Agent框架的全面适配。同期，公司已完成启望 S4 高性能推理 GPU 和启望 S5 安全可控推理 GPU 的本事阶梯权略，执续加码近存计较、光电共封等前沿本事探索。

澳门新浦京游戏下载官网

开云app 这家国产GPU厂商, 再获超10亿元融资!

QQ咨询

QQ：