• 开云app 这家国产GPU厂商, 再获超10亿元融资!
  • 开云体育中国官方网站
开云滚球
热点资讯
推荐资讯

开云app 这家国产GPU厂商, 再获超10亿元融资!

发布日期:2026-04-22 04:05 点击次数:74

开云app 这家国产GPU厂商, 再获超10亿元融资!

4月20日,国内全栈自研 AI 推理 GPU 企业——杭州曦望芯科智能科技有限公司(简称“曦望”)通过官方微信公众号告示,照旧完成新一轮超10亿元东谈主民币融资。

而在前年7月初,曦望才刚完成近10亿元融资。那时这轮融资由三一集团旗下华胥基金、第四范式、游族网罗、北京利尔、松禾本钱、海通开元等多家机构共同参与。

没意想,时隔仅10个月不到,曦望又完成了新一轮超10亿元的融资。

至此,分拆零丁仅一年多的曦望已累计完成七轮融资,总融资额约 40 亿元,成为国内首家估值超百亿的纯推理 GPU 独角兽。

据先容,本轮融资资金将主要用于新一代启望 S3 推理 GPU 的鸿沟化量产寄托、全栈软件生态建筑,以及 S4/S5 后续芯片的研发迭代。

曦望在官方新闻稿中指出,2026 年被行业公合计“AI 智能体元年”。跟着大模子从“会聊天”进化为“会念念考、会推行”的数字职工,推理需求迎来爆发式增长。英伟达 GTC 2026 大会精良宣告 AI 产业全面迈入“推理落地、智能体普及”的新期间,将“每瓦 Token 蒙胧量”界说为 AI 期间的中枢竞争力。这与曦望自创立之初就锁定的中枢战场高度契合。

“AI 算力基建的要点已澈底切换。”曦望董事长徐冰暗示,“2026 年 AI 推理计较需求将达到磨练需求的 4-5 倍,推理算力租借价钱半年涨幅近 40%。”

贵寓裸露,曦望前身是商汤大芯片部门,2024年底分拆零丁运营,专注于高性能GPU及多模态场景AI推理芯片的研发与交易化。公司研发团队凭借8年本事千里淀、20亿研发插足及两代量产芯片的工程化考证,已成为国产GPU替代的中枢力量。公司致力于于为千行百业提供成本裁汰10倍、能效比冲突的智能算力基石,通过本事立异和深度产业协同,推动各行业的智能化发展,并助力实现通用东谈主工智能(AGI)的普惠化办法。

当今,曦望团队鸿沟已增长至 400 东谈主,研发东谈主员占比超 80%,集聚了来自英伟达、AMD、华为海念念等国表里顶尖芯片企业的中枢东谈主才,硕士及以上学历占比超 80%。团队交融了芯片策画、高性能计较、AI 算法、软硬产物的跨行业东谈主才。

在具体产物方面,曦望当今的产物线主要包括照旧量产的曦望S1、S2和行将量产的S3。

△从左至右:曦望 S1、曦望 S2-M1模组、曦望 S2-X1加快卡

其中,S1是面向云霄和旯旮详察觉推理的专用芯片,主要用于视频分析模子推理,复古CV类东谈主工智能应用的计较需求,出货量已越过2万片;

S2是面向大模子推理的GPGPU产物,汲取汲取7nm工艺,兼容主流的英伟达CUDA生态,其性能水平可对标英伟达A100。S2的研发涵盖辅导集、GPGPU IP架构、算子开采及编译器器具链等一谈中枢本事,实现全齐自研。

曦望于2026年1月精良发布了新一代旗舰产物启望 S3 推理 GPU。这是国内首款搭载 LPDDR6 且兼容 LPDDR5X 内存的推理 GPU,开云体育官网它莫得盲目照搬高端磨练 GPU 的 HBM 显存阶梯,而是基于 Agent 推理的本体需求,从 AI Core 计较架构到内存 IO 系统进行了全链路重构。

据先容,启望 S3 通过计较层的深度定制,处理了通用 GPU“算力用动怒”的核肉痛点,推感性能较上一代 S2 提高 5 倍,办法实现 Token 成本着落 90%。

具体来说,启望 S3 将GEMM 和 Flash Attention 两项核默算子(在大模子推理中,占估量较量的 90%以上)的欺诈率辩认推至约 99%与 98%,标称算力真的齐滚动为灵验蒙胧,相同硬件插足可事业更多并发申请。

启望 S3 汲取 128-bit 辅导集+支执 3D 辅导,辅导密度当先传统 SIMT 架构;零丁线程疗养精确匹配智能体复杂适度流,撤销要求跳转带来的活水线代价;通过 Block cluster 和 Broadcast 等本事实现片上数据复用,减少对外带宽依赖,大幅提高 Agent 多轮推理效果。

启望 S3 收复生支执 FP16 至 FP4 全链路低精度运算,在 DeepSeek V3/R1 等主流模子上实现接近无损的 FP4 推理,蒙胧量较 FP16 提高 3-4 倍,平直滚动为客户侧的毛利空间和价钱弹性。

在接口方面,启望 S3 立异性地集成了LPDDR6内存接口、高速 SerDes+SUE 交融互联本事、PCIe Gen6接口这三大先进高速接口本事,从内存和 IO 两个推理期间最中枢的瓶颈脱手,处理了智能体三大中枢瓶颈。

从产业周期看,磨练侧神色已相对固化,而推理侧正随 Agentic AI 放量进入指数级增长通谈——多家机构探究,以前五年推理算力阛阓鸿沟将杰出磨练侧数倍,其中 Agent 类负载将孝顺最主要的增量。

曦望暗示,启望 S3 同期具备三个难以共存的成分:推理原生的架构前瞻性;实现 98-99% 算子欺诈率的顶尖工程才调;圆善的生态适配才调。

“启望 S3 不是大概的性能升级,而是一次对 AI 推理成本弧线的重构。”徐冰暗示,“咱们的办法是将推理成本降至‘百万 Token 一分钱’,让 AI 像水电一样成为普惠基础重要。”

在本轮融资的助力下,2026 年,曦望将围绕“落地、终了、增长”中枢原则,将全力鼓吹启望 S3 芯片量产寄托开云app,完成与国表里主流大模子、多模态模子和Agent框架的全面适配。同期,公司已完成启望 S4 高性能推理 GPU 和启望 S5 安全可控推理 GPU 的本事阶梯权略,执续加码近存计较、光电共封等前沿本事探索。

澳门新浦京游戏下载官网
------

QQ咨询

QQ: