云计算再升级云原生时代来临 (云计算云原生云服务)

在阿里云云峰会2023北京站《互娱&游戏创新与商业增长论坛》中,阿里云智能基础产品部副总裁,弹性计算&无影产品线总经理张献涛,发表了《云原生计算基础设施,加速互联网迈入智能时代》的主题演讲。

他表示:未来将有更多的互联网企业借助AI等新技术实现数字化转型和业务升级。

ChatGPT作为一种开放式人工智能技术,可以通过学习海量数据和深度神经网络模型,实现自然语言理解和生成的任务。这一技术可以广泛应用于聊天机器人、语音识别、翻译等领域,将人工智能应用推向新的高度。随着技术的不断进步,ChatGPT未来还将有更多的应用场景和商业价值,对数字内容和互联网行业的改变将是深远的。

基于这一趋势,互联网企业需要及时跟进新技术的发展,提升自身的数字化能力和创新能力。而弹性计算服务则可以为企业提供灵活、高效的计算资源,帮助企业快速响应市场变化和业务需求的变化,实现数字化转型和业务升级。

此外,阿里云还提供了一系列AI能力和解决方案,如人脸识别、图像识别、语音合成等,可以帮助企业实现更多的智能化应用。阿里云还通过建立智能生态系统,与合作伙伴共同推进AI技术的开发和应用,为行业数字化转型和创新注入新动力。

以下内容根据张献涛的演讲整理而成:

云原生技术加速,云计算云原生云服务

阿里云智能基础产品部副总裁,弹性计算&无影产品线总经理 张献涛

云原生技术加速,云计算云原生云服务

过去,我们经历了传统互联网和移动互联网时代,目前我们正在经历视频互联网时期,特别是在互娱视频领域,在过去几年中得到了迅猛的发展。然而,随着AIGC等新技术的不断涌现,我们相信未来,互联网将进入一个以数据为中心的智能互联网时代。

在这个新的时代中,人工智能和大数据将成为互联网企业的核心竞争力。通过对海量数据的收集、存储、分析和挖掘,企业可以更好地了解用户需求和市场趋势,并快速响应变化,提供更优质、个性化的服务和产品。同时,人工智能的应用也将使得原本需要人工完成的任务得以自动化,提高效率和降低成本。

在这一趋势下,互联网企业需要加快技术转型和创新,抓住机遇。阿里云作为全球领先的云计算服务提供商,可为企业提供全方位、立体化的云端技术方案,帮助企业实现数字化转型、智能化升级和业务创新。同时,阿里云还积极推广AI和大数据技术的应用,为企业提供更多的技术支持和合作机会,共同推进智能互联网时代的到来。

云原生技术加速,云计算云原生云服务

在智能互联网时代,基础设施面临着更高的要求。首先,随着数据量的增加,高效的算力基础智能推荐、大数据挖掘数据处理的效率都需要不断提高。此外,客户也需要更低延迟、更高性能的计算基础设施。

其次,“小步快,快速试错”一直是互联网行业的迭代策略,为了迅速响应消费者需求的变化,企业需要弹性灵活的基础设施来对业务波峰波谷的出现。因此,如何高效地管理基础设施也是一个重要问题。

最后,出了更高的要求,基设施的投资也将持续增性、敏捷性和成本之础是一个巨大的挑战。

云原生技术加速,云计算云原生云服务

总之,阿里云弹性计算构建了针对互联网企业的云技术基础架构,不仅可以提供高效、稳定的底层服务,还可以支持大规模分布式训练和推理性能,以及快速、敏捷的开发,同时实现了成本最优化。无论是小型创业公司还是大型企业,都可以利用阿里云弹性计算的优势,轻松实现业务转型和创新。

云原生技术加速,云计算云原生云服务

阿里云一直在底层基础设施方面不断进行技术创新,以确保客户能够获得流畅稳定的业务体验。

今年三月,弹性计算第八代企业级实例已经全面商业化。基于CIPU+飞天的技术架构,全系标配eRDMA能力可以让数据获得更高的流转效率,并新增了加密虚拟机TDX能力。这两者结合了云上安全计算和数据计算能力,为阿里云打造了一个全栈式云原生安全计算服务。

除了性能和安全能力的提升,网络及存储I/O也得到了大幅度提升。存储层面适配了NvME云盘存储接口,这样的接口可以实现超高性能ESSD支持共享块存储,使得传统软件上云时,可以获得更加极致的性能。同时,阿里云还解决了传统软件上云过程中遇到的技术难题。

云原生技术加速,云计算云原生云服务

eRDMA是阿里云最新推出的第八代实例标配的产品能力特性,是中国推出的首个云上大规模RDMA加速能力,能够大幅提升大规模分布式计算通信效率,并且能够随着阿里云的集群规模动态扩展,能够轻松构建中国最大的RDMA分布式计算网络,在大规模训练方面,通过eRDMA可以实现上千台机器同时进行训练。

在性能维度,Redis数据库、结合大数据加速套件 MRACC的Spark大数据处理、AI训练场景、HPC应用也都分别有着100%、25%、30%、20%的提升。

云原生技术加速,云计算云原生云服务

为了满足不同场景下的需求,我们在第八代企业级实例中提供了多种选择。用户可以选择最新的英特尔*四代第**至强可扩展处理器、AMD最新的Genoa处理器或阿里云自研的倚天710处理器,以适应不同架构和场景。

其中,基于英特尔*四代第**至强可扩展处理器SPR的第八代企业级实例g8i,提供了场景化的超高性能。除了通用算力的提升外,还原生支持硬件加速能力,使AI训练性能提升2倍以上,加解密、压缩/解压缩等场景下性能提升4倍以上。这为客户提供了超高性价比的场景化计算服务。

基于AMD的第八代企业级实例g8ae,则具有强劲的算力,单核性能相比上一代提升高达55%。这可以满足用户所有计算机密型业务对更高算力的需求,并且在实际高性能计算场景中,相比提升了100%。

对于面向通用类应用场景的企业客户,基于AMD的另一款第八代企业级实例g8a则性价比极高。总和性价比提升15%,在通用企业级应用场景下,性价比提升高达50%以上。

最后,值得一提的是,基于阿里云自研的倚天710处理器打造的g8y实例,编解码性能提升了80%,大数据性能也提升了70%。这为用户提供了更强大的性能和更优秀的用户体验。

云原生技术加速,云计算云原生云服务

倚天710是阿里巴巴第一颗为云而生的自研芯片,在CPU算力层面无超线程概念,用户可享受极致的物理核性能和缓存QoS能力,以充分应对复杂的业务负载变化,CPU利用率即使达到85%以上,也不会出现算力争抢的情况,所以非常适合大数据/数据库类型业务的发展。

不仅如此,业界主流的开源软件以及阿里云主流的PaaS产品均已支持倚天实例,用户无需担心业务适配的问题,零代码改造即可完成业务部署,就可以体验g8y带来的性能收益。

云原生技术加速,云计算云原生云服务

除了一般计算能力,我们正在开发面向AIGC大模型的训练和推理方案,并对支持GPT模型和Stable Diffusion大模型进行全栈优化。

我们拥有超级计算集群、CPU/GPU集群和高性能并行文件存储等算力资源,以及弹性RDMA高速互联的网络层面,这使得我们在AI训练和推理方面表现出色。

我们还提供 FastGPU 等高效部署工具,并在阿里云平台上支持客户任务的高效创建GPU集群。我们还支持cGPU技术,可实现GPU算力的切分、池化和虚拟化,以及分布式大型训练部署。

此外,我们还支持语言大模型和视觉大模型,并发布了模型服务。模型服务可与整栈软件无缝对接,且使用阿里云 PaaS 和 IaaS 都可以获得良好的技术支持。

云原生技术加速,云计算云原生云服务

阿里云从2017年布局异构计算,2022年重点构建了面向元宇宙XR的应用开发、部署、发布生态;支持合作伙伴演唱会、数字人等场景应用;当前以语言大模型服务为契机,提供面向模型服务的弹性基础设施,从底层到中间件的全系优化,用户可以获得开箱即用的效果。

云原生技术加速,云计算云原生云服务

阿里云ECS采用cGPU,支持对多种多卡GPU实现灵活分割,结合CPU VM/容器虚拟化,实现对异构计算灵活切割与调度能力。通过cGPU技术,容器技术等可以在算力切分和池化方面做到无缝效果。

云原生技术加速,云计算云原生云服务

尽管AIACC-Training主要集中于AI通讯方面的优化,但与eRDMA技术相结合,它实际上能够提供比传统IDC和其他云基础设施更为强大的能力。

在当下火爆的大型模型和AI图形计算场景中,AIACC-Training同样能够提供进一步的优化。例如,它可以将大型语言模型的分布式训练性能提高50%,使AIGC的finetune训练性能提高40%,将大型语言模型的推理性能提高50%,同时提高AIGC的推理性能80%,从而进一步提升客户的AI业务竞争力。

云原生技术加速,云计算云原生云服务

我们认为,无影是阿里云算力的接入点。无论是通用算力还是智能化算力,用户都可以通过无影端轻松获取阿里云计算、存储、网络、AI、大数据等整体能力,让智能化算力触手可及。

无影兼容大多数智能显示终端,使开发和使用体验进一步得到提升。同时,无影也更容易被各类软件集成,拓宽了应用的业务边界。我们还研发出自有硬件,如笔记本、盒式终端和一体机,供广大消费者选择。

云原生技术加速,云计算云原生云服务

为了让客户在使用云上资源时希望能够更好的管理和运维,过去几年弹性计算产品线一直在构建云上自动化运维体系CloudOps来提升企业的运维效率,旨为云上业务安全高效的持续运营提供全方位的支持。

云原生技术加速,云计算云原生云服务

在效率至上的互联网时代,CloudOps从成本、效率和稳定性三个维度,为企业带来了显著的效能提升,包括可以实现30%以上的成本优化、50%以上的人工效率提升,以及35%以上的故障恢复周期缩短,为业务稳定永续保驾护航。

云原生技术加速,云计算云原生云服务

在之前,大家购买资源更多是为了恒定的业务需求,所以大多使用的是包年包月,但实际云更多时候是需要按量付费的,如何确保整个资源做到合理利用,我们有丰富的计费方式,企业使用云的时候,可以随心所欲,实现成本的下降和资源弹性的双重平衡。

云原生技术加速,云计算云原生云服务

我们希望通过全方位、立体化的弹性计算服务能力,为互联网企业提供弹性、高性能与成本三方位兼顾的云原生基础设施,让企业更好地获得弹性高性能低成本的资源,助力互联网企业加速业务创新。