@      体育游戏app平台到为创作家绘出假想中的魔幻虚幻-开云(中国)Kaiyun·官方网站

你的位置:开云(中国)Kaiyun·官方网站 > 新闻 >

体育游戏app平台到为创作家绘出假想中的魔幻虚幻-开云(中国)Kaiyun·官方网站

体育游戏app平台到为创作家绘出假想中的魔幻虚幻-开云(中国)Kaiyun·官方网站

  新浪科技讯 12月30日下昼音信,当天体育游戏app平台,字节豆包大模子对外线路2024全限度时代进展。距5月15日初次亮相仅7个月,豆包大模子在通用讲话、视频生成、语音对话、视觉瓦解等方面模子才调均已跨入国外第一梯队。豆包大模子团队示意,“从孩童般学语,到懵懂看宇宙,到为创作家绘出假想中的魔幻虚幻,一切依然处于最早期。”

  章程2024年12月,最新版豆包通用模子Doubao-pro-1215,笼统才调较5月普及32%,已全面临皆GPT-4o,在数学、专科学问等部分复杂场景任务中,效果发达以致更好。通过海量数据(维权)优化、普及模子寥落度、引入强化学习、系统性工程优化等形势,团队大幅普及了Doubao-Pro瓦解精度和生成质地,并已毕了性能与遵循的均衡,推理管事价钱仅为GPT-4o的八分之一。

  图像与视频才调方面,团队于9月推出两款豆包视频生成模子PixelDance与Seaweed,主打复杂教导词精确瓦解、镜头一致、多交互主体和镜头活泼章程。豆包文生图模子束缚迭代,还推出了通用图像剪辑才调,让“一句话P图”和“一键海报生成”成为履行。此外,12月发布的豆包视觉瓦解模子Doubao-vision,可会通视觉与讲话多感官深度念念考和创作,当今模子才调在十多个主流数据集上并排Gemini 2.0与GPT-4o。

  语音大模子赋予机器“听”与“说”的才调,豆包大模子团队本年推出了全新的语音识别模子Seed-ASR和语音生成基座模子Seed-TTS,通过引入各种、平淡的数据,会通推理链,赋予模子极强的泛化性。据悉,豆包语音模子可听懂20种以上方言羼杂的对话,也能边听边念念考,并在会话中抒发心情,保留吞音、口音等东谈主类习气,以致在交互中可随时被打断。

  较语音更进一步,豆包大模子已领有高品性的“唱作”才调,从词曲剪辑、演奏生成到东谈主声演唱,“一个AI也不错是一个乐队”如故成为履行。其背后依托的音乐生成模子框架Seed-Music,消灭了讲话模子与扩散模子的上风,已毕了音乐生成的通用框架,领有极高的剪辑可控性。

  团队还初次对外线路了豆包大模子300万字窗口的长文本才调,可一次往往阅读上百篇学术讲演,每百万tokens处分延伸仅需15秒。这一高下文窗口长度和时延水平达到当今业界极限。背靠STRING等高下文关联数据算法和模子加快优化,团队大幅普及了LLM欺诈海量外部学问的才调,并通过寥落化及分散式决策将时延降到十秒级。

  代码才调方面,豆包代码大模子Doubao-coder编程才调达到专科级,深度支抓超16种编程讲话、11类果然应用场景,可得志前后端拓荒、机器学习等全栈编程拓荒需求。

  设置极短时刻内,豆包大模子团队还对AI基础商议潜入布局。当年几个月,团队57篇论文中选ICLR、CVPR、NeurIPS等顶会,商议后果包括下载量超百万的开源模式及GitHub万星爆款。

  同期,豆包大模子团队与近20所高校潜入合营,支抓朝上40位顶尖学者参与关节AI时代攻坚,并与清华AIR、北大别离设置辘集实验室。为储备最具后劲的商议东谈主才,豆包大模子团队脱手了“Top Seed东谈主才有筹算”,在各人领域招募顶尖博士毕业生加入,共同挑战宇宙级AI课题。

  凭据线路,豆包大模子联系时代才调当今救济了包括豆包、即梦、豆包MarsCode等50多个C端应用场景,其中,豆包APP已成为国内最受迎接的AI居品。通及其山引擎,豆包大模子管事了30多个行业,日均tokens调用量超4万亿,较5月发布时增长33倍。(罗宁)

海量资讯、精确解读,尽在新浪财经APP

连累剪辑:王若云 体育游戏app平台