@      开yun体育网阿里云展示了第一代无影云电脑-开云(中国)Kaiyun·官方网站

你的位置:开云(中国)Kaiyun·官方网站 > 资讯 >

开yun体育网阿里云展示了第一代无影云电脑-开云(中国)Kaiyun·官方网站

开yun体育网阿里云展示了第一代无影云电脑-开云(中国)Kaiyun·官方网站

作家 | 周雅开yun体育网

评测 | 至顶AI实验室

往常泰半年,咱们一直在作念端侧AI算力的评测。从英伟达DGX Spark,到各家厂商的桌面AI超算,跑模子推理、测ComfyUI职责流、试各式AIGC场景。这些居品各有亮点,但测得越多,越能看清一个事实:端侧硬件很强,但并非整个东说念主、整个阶段都合适径直「买一台」来责罚问题。

比如你是一个初学级AI开垦者,今天的需求仅仅跑一个7B参数的小模子,但几个月后你也许会想试试70B致使更大的模子。根源是,算力需求逐级爬升,一步到位买顶配,前期期骗率很低,因为你还没初学;先买个够用的,过不了多久又濒临升级,因为你如故初学——这个节律很难踩准。

再比如一个徐徐广泛的施行:你的扮装可能不啻一种。

这两年有个认识,叫作念OPC(One Person Company),是指一个东说念主借助AI器具,不错干传长入通盘小团队的活,成为超等个体。似乎听起来很好意思,但它对算力的条目不异亦然“一个东说念主顶一个团队”。上昼你是AI开垦者,在调模子写代码;下昼造成内容创作家,作念AI漫剧;晚上可能还想玩一把《黑外传:悟空》减轻。每个扮装吃的算力皆备不同,一台固定配置的机器,很难同期喂饱整个场景。

Gartner曾作念过一个估量:在改日5到10年内,DaaS(桌面即功绩)将成为主流,云电脑或将成为企业与组织首选的办公盘算推算机。它背后的逻辑,其实是算力供给模式的变革——当摩尔定律的边缘效应递减,而AI模子的参数目却在以摩尔定律几倍的速率扩张时,算力势必向云表挪动。

这就是咱们启动存眷云表桌面AI的原因,为此咱们还在一又友圈玩起了梗,话题叫作念 #办公室的新玩物#。

最近,咱们又拿到了一台——阿里云无影个东说念主云超算。准确说,是在线上“盛开”了一台云表的电脑,咱们体验了一周,写了这篇上手记。

不错塞进衣裳口袋的个东说念主超算

阿里云无影,约略来说,这是一款不错遍地随时接入的云上电脑。

它最大的秉性是完结了「算力与终局的绝对解耦」,这种解耦带来了极大便利性。在咱们的内容体验中,岂论手头上用的是MacBook,照旧Windows笔电,致使是一台 iPad,只须装了无影客户端App,就能瞬迤逦入合并个云表桌面。

2020年,阿里云展示了第一代无影云电脑,它的终局是一个柬帖夹大小的C-Key,贯穿表现屏就能进入云表桌面。那时这个品类还需要反复表现注解,许多东说念主把它和汉典桌面画等号。四年后的2024年,无影个东说念主版亮相,个东说念主玩家能径直跑《黑外传:悟空》,1080P下帧率平稳在60帧。

到了CES 2026,桌面AI超算成了简直整个PC厂商的标配,惠普把AI PC塞进了键盘里,期望让札记本屏幕自动旋转追踪东说念主脸,一大宗厂商基于DGX Spark推出了巴掌大的腹地AI超算。在这个舞台上,连气儿第二年参展的阿里云行为云厂商,就拿出了无影个东说念主云超算。

单看起来,它是一个终局硬件,叫「无影魔方ultra」,巴掌大小,比一册精装书还轻,有点像一个接口丰富的“瘦客户机”,塞进口袋也绝不劳苦。

但别被尺寸骗了,它背后连着的云表配置是这么的:两块RTX 5880(单卡48GB显存,Ada Lovelace架构专科级显卡)、64核vCPU,统统96GB GPU显存。

96GB 显存是什么认识?市面上顶级的消费级显卡RTX 5090也才32G显存,96GB是它的三倍,意味着你不错爽直加载100B以上参数大模子作念推理,或者跑视频生成任务也不成问题,无须顾忌爆显存。在腹地,要搭建这么一套硬件环境,资本至少要三万元以上。而在无影上,这种雄壮的前期参加被消解了,它造罗列内外的一个图标,躺在屏幕里任我专揽,让也曾鸡犬相闻的超等算力变得易如反掌。

魔方本人不作念任何盘算推算,整个算力都在云表,不错交融为一个「无尽算力的水龙头」:插上电源、连上屏幕、就能掀开云表那台超等电脑、绵绵不休流出更高的性能。

这是因为咱们盛开的是双卡配置,顶配还不错选拔:4块RTX 5880(推断192GB GPU显存)、96核功绩器级CPU、384GB内存,这个性能参数放到大部分场景下应该都够用。

传统个东说念主电脑是一锤子商业,而无影的算力是弹性的,今天跑轻量任务用小规格,来日作念模子磨练一键切到顶配,数据通过无影存储中心无缝同步,切换流程不丢进程。

掀开后台,咱们不错通过「镜像管束」,区分为「云电脑」、「AI学习机」、「职责站」一键镜像多个系统,这次咱们主要镜像了Windows、Linux Ubuntu、Kylin三种不同的系统进行测试。

此外,左侧列表中的「无影内容广场」,就像是一个“AI超市”,这里有多量的第三方分享镜像。想作念图?选“ComfyUI-含主流模子和节点”镜像。想真金不怕火丹?选“AI-Toolkit LoRA磨练”镜像。想跑模子推理或搞开垦? PyTorch、TensorFlow基础框架一应俱全。致使还有ModelScope(魔搭社区)、DiffSynth-Studio等阿里达摩院的独家生态镜像。

光看参数仅仅说梅止渴,确凿的教育在于实战,咱们决定烧毁惯例的办公场景评测,径直上强度。

实测:把96GB显存“榨干”

用现在AI圈最主流、同期也最浪费显存的ComfyUI视频生成职责流来进行极限压测,运行阿里开源的Wan 2.2 14B(万相)视频生成模子,这是一个对显存条目极高的任务,尤其是14B参数,在往常家用显卡上简直无法全血运行。值得一提的是,wan2.2是现在最流行的开源视频大模子,莫得之一,在开源领域的占比在40%以上。

咱们设定了一个下里巴人的请示词“马在行走,丝带飘零,心境灵动(A horse walking, ribbons flowing, vivid expression)”,分辨率设定为1280×720,开启FP8矩阵乘法优化和FLOW流匹配架构,后台日记启动迅速滚动。

模子加载阶段,即便使用了FP8量化优化,光是模子权重就占用了13629MB,快要13.6G显存。如若加上推理流程中的中间变量(KV Cache),24G显存的腹地显卡不仅衣衫不整,致使径直爆显存。

但在无影上,日记表现现时可用显存28969MB。关于96G的总池子来说,这就像一条大河流过一个小水坝,毫无压力。

生成速率方面,中枢采样流程耗时1分20秒,从点击启动到视频生成罢了,总耗时3分34秒。日记里还有一排“lowvram patches: 357”,这是针对低显存环境的自动优化补丁。对96G来说这简直是过剩的,但也表现无影在软件层面的兼容性作念得迷漫紧密。

咱们至顶AI实验室的小伙伴实测,很昭彰的两个感受是:快、浅易,因为不错径直把ComfyUI配置到我方电脑的Chrome浏览器上使用,不错交融为在你的浏览器上径直挂着ComfyUI。

更值得说的是,镜像商场里预配好的ComfyUI环境。两卡96G显存不错同期加载多个大模子和LoRA权重,不需要反复卸载和重装。这对作念AI漫剧的创作家来说尤其关节。一条漫剧职责流通常要串联扮装一致性模子、布景生成模子、心境胁制LoRA,再接上Wan 2.2作念动态视频片断,在24G显存的腹地显卡上,光是模子切换就要反复腾挪,96G则不错一说念常驻,专心调参出活。关于靠短视频批量坐褥吃饭的创作家来说,这径直决定了产能,让高端的坐褥力器具变得夷易近东说念主。

诚然了,职责之余,这台“怪兽”能弗成用来减轻?

切换到云电脑模式,无影的内容广场里预置了《黑外传:悟空》、《鸣潮》、《我的全国》、《万古连续》等15款热点游戏大作,可能之后还会上线更多游戏。

不外,当我进入其中某款游戏,登陆干系账号之后,也能径直通过账号进口登陆更多游戏。

时延,是云游戏最敏锐的方针之一。阐发官方给出的网罗提议,要赢得1080p、30fps的运动基础体验,需要保证15Mbps以上的带宽,网罗延伸低于60ms。而若要追求1080p、60fps的电竞级高帧率丝滑体验,带宽门槛则进步至25Mbps,延伸不错达到30ms以内。

这次实测下来,玩《鸣潮》这类动作游戏时操作跟手度极高,延伸基本平稳在16ms高下浮动,简直嗅觉不到是在云表。在《我的全国》这种对加载速率条目较高的游戏中,大部分时分也十分运动,惟有一丝数复杂场景下,时延会顷然波动到60ms傍边,也不影响操作。

前边一直在用无影客户端作念测试,但其实无影魔方ultra也因循多端接入,也就是说,当你只带了那一块盒子的情况下,任何一块屏幕也都能成为进口。

这在游戏场景下特地有预想:我在办公室用MacBook玩,回家路上用iPad接着玩,归档和进程无缝不绝。这也就表现,当算力在云表、延伸迷漫低的本事,你手里那台确立是什么品牌、什么配置,如故不进攻了。屏幕就是一说念。

尤其用Mac客户端接入的本事,有个细节让我印象很深:腹地Mac和云表无影之间不错径直拖拽文献,操作嗅觉就像在合并台电脑的两个文献夹之间挪东西,用着用着会产生一种错觉,你的MacBook好像短暂多长出了几块RTX 5880显卡。

还铭记前边说的OPC吗?超等个体的一天不错是这么的:上昼用容器模式调模子写代码,下昼切到Windows环境作念AIGC内容创作,晚上掀开云游戏减轻。一台固定配置的物理主机很丢丑护到每个扮装,但在无影上,切换身份就像切换频说念。

更进一步而言,超等算力不再是少数专科东说念主士或机构的专属品,而是一个能陪同用户从赞佩、探索到醒目标成长伙伴。

算好经济账

性能说完,必须聊钱。无影的中枢上风之一,就是将一次性的昂贵硬件投资,改动为极致可控的按需付费劲迹,它接受了一目了然的「核时」计费模式。

阐发实测后台数据,「开机」景色下,岂论是云电脑照旧容器,平均浪费150.82核时/小时。「关机」景色下,云电脑浪费0.06核时/小时,容器浪费0.04核时/小时。

这里有个容易被忽略的细节,如若不手动点击「关机」,后台会持续运行,会持续浪费核时。阿里云架构师告诉咱们,无影的遐想逻辑是:如若莫得手动点击「关机」,系统会默许你可能在后台跑长任务(比如磨练模子),它实则是在7*24小时职责景色。想想也合理:你花了几周配置好的真金不怕火丹环境,服气不但愿关机一次就一说念清空,这些核时买的是数据安全存储和下一次启动的便利。

此外友情提醒,即便你手动点击了「关机」,后台依然会浪费极低的存储费(即上头的0.04-0.06核时),因为你的数据(硬盘、镜像、环境配置)依然占用着云表资源。下图可见,夜间时段也在浪费核时。不外换算下来,关机景色下,24小时浪费的核时统统几毛钱。如若细则无须,点击「就义」即可。

具体破耗怎么算?阐发阿里云官方的说法,即等于4卡RTX 5880顶配(192GB显存),每月按量付费也仅在1000元傍边。咱们手上这台双卡配置,每天高强度用8小时,其余时分关机的话,月费大要500-600元。

行为对比,CES上同台亮相的DGX Spark,搭载GB10 Grace Blackwell超等芯片和128GB长入内存,单台售价3999好意思元起步。

但两者遐想想路皆备不同:DGX Spark走腹地化门路,一次买断,性能固定,胜在离线可用、数据不出本机;无影走云表弹性门路,按需取用,随时升降,胜在配置天花板高、无硬件折旧。

咱们也着重到,在一些公开测评中,无影顶配的概述跑分不错达到DGX Spark的数倍,而月费远低于后者的一次性购入资本。诚然,两款居品面向的场景和弃取不同,径直比价随机自制。

比超等电脑多走一步

如若仅仅把传统PC的算力搬到了云上,无影充其量是“更浅易的高性能电脑”,但无影的另一个拳头居品AgentBay,则表示了一个更大的盘算推算。

AgentBay是无影为AI Agent(智能体)打造的云表基础按序。往常来说,它让AI助手赢得了“手和脚”,AI不再仅仅坐在聊天框里回话问题,而是不错在云表沙箱里操作浏览器、胁制桌面应用、实施代码、致使操控手机界面。整个操作都在安全驱逐的环境中稳固运行,不影响用户我方真实立。

设想一个场景:你对AI说“帮我从这五个PDF里提真金不怕火关节数据,整理成Excel,然后发邮件给团队”。往常,AI只可帮你写出提真金不怕火剧本,剩下的你我方最先。有了AgentBay,AI不错在云表掀开一台好意思满的电脑,我方操作浏览器下载文献、掀开Office处理数据、登录邮箱发送,全程不需要你介入。

是不是很像最近爆火的clawdbot?没错,Agentbay也加多了内置Clawdbot模式,同期还领有Clawdbot不具备的browser use才融合企业多Clawdbot部署才调。

这就是为什么咱们在著作标题里用了「隐身」这个词。无影追求的终极面容,不是让你嗅觉在使用一台更强的电脑,而是让「电脑」这个认识本人徐徐消失,你只需要说出想作念的事,算力、软件、环境、实施,一切在看不见的场所自动发生。

这次上手最让我印象长远的,不是某个具体的跑分数字或者启动速率,而是一种错位感,手里捏着一个比充电宝大不了些许的小方盒,屏幕上却跑着需要功绩器机房才能驱动的大模子。莫得电扇呼啸,莫得机箱发烧,连一根过剩的线都不需要。

好的盘算推算也许就像好的遐想:当你不再需要想考显卡够不够、内存满不悦、驱动装没装的本事开yun体育网,就不错把一说念着重力放回到你确凿想作念的事上。