近日,2020浪潮云数据中心合作伙伴大会(IPF2020)在线上拉开序幕,浪潮信息在此期间发布了业界首款智算中心算力调度软件产品-全新AIStation人工智能推理服务平台。AIStation 拥有多元部署能力,能够为不同应用场景提供一站式的AI推理服务,实现高效地优化、调度计算资源,进一步简化AI的开发、训练、优化和部署全流程。
当前,企业希望可以无缝衔接AI模型训练开发与推理部署,进行高效的资源调度和模型管理,缩短业务上线周期。然而,在现实环境中,AI模型开发进入到生产部署阶段面临着多重困难和挑战:AI模型需要经过大量的调试和测试才能部署上线,这一过程通常需要2-3天;AI线上服务计算资源一般较固定,对于突发需求资源响应慢,业务扩展难;AI模型来源不同,统一管理也很困难。
最新发布的浪潮AIStation推理平台就可以很好地解决这一问题。AIStation可通过弹性可伸缩架构、A/B测试滚动发布、低延迟轻量化设计、多模型加权评估等技术创新,帮助企业快速部署推理服务,具有一键部署、快速响应、日志监控、资源管控、数据处理等功能,是功能全面、处理能力强大的AI资源平台。
首先,在交互时效性方面,AIStation推理平台可将模型的部署时间从两三天降低到几分钟。通过支持本地On-Premise和云端Cloud部署,保证服务的可获得性和业务连续性,实现了AI模型从开发环境到生产部署繁杂过程的自动化快捷操作。
其次,在资源调度方面,AIStation推理平台能够敏捷调配服务资源。采用创新的弹性可伸缩架构,可根据推理服务资源需求的变化及时调整资源配给,将响应突发需求的实例部署时间从几小时缩短到几分钟。并且支持新模型发布前A/B测试,在实际业务场景中验证模型有效性,保证推理业务的安全、可靠,同时避免了流量切换所导致的集群负载压力。
最后,在模型管理方面,通过统一平台管理多源、多场景模型的推理服务AIStation推理平台实现了多源模型统一调度,可实时掌控全局资源,对模型服务实现综合调度和动态部署。同一资源池可同时支持多家模型服务,将资源利用率从40% 提高到80%。并且可实现多模型加权评估,通过对不同预训练模型的计算结果进行自定义权值设置,构建可靠可信的智能系统,有效降低误判率。
相比之前浪潮推出的AIStation训练平台,该平台通过计算资源细粒度调度技术策略调整,使用户的AI计算资源利用率提高到90%以上,大幅缩短了模型开发周期。随着本次浪潮AIStation推理平台的面世,AIStation资源平台全面支持训练与推理两大场景,实现模型开发服务的全流程一站式高效交付。
浪潮AI&HPC产品线总经理刘军表示:“人工智能技术要想逐步产业化,就需要爆款的产品拉动。浪潮AIStation的使命就在于此,希望做人工智能产业化过程中的T型车,从计算平台到整个管理套件到深度学习框架的优化和端到端的解决方案,为人工智能提供最基础、最本源的创新支撑。AIStation能够帮助企业加速AI研发创新、提速AI生产交付,让企业更专注于AI开发本身,从而赋力更多创新可能,加速AI落地应用。”
今年上半年,中共中央在一次会议上强调要加快数据中心、5G、AI和工业互联网等新型基础设施建设进度,“新基建”将助力疫后经济复苏,成为我国经济增长的新引擎,数据中心也将全面进入AI时代。作为“新基建”重点领域AI服务器领域,浪潮信息AI服务器的性能已获得互联网公司和运营商的认可,中国市场份额保持50%以上,并与人工智能领先科技公司保持在系统与应用方面的深入紧密合作,浪潮信息将与合作伙伴共建元脑生态,共享AI计算、资源与算法三大核心平台能力,加速推进产业AI化落地,助力新基建智能化产业落地。
1、凡本网专稿均属于都市视窗所有,转载请注明来源及都市视窗的作者姓名。
2、本网注明“来源:×××(非都市视窗)”的信息,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若作品内容涉及版权和其它问题,请联系我们,我们将在核实确认后尽快处理。
3、因使用都市视窗而导致任何意外、疏忽、合约毁坏、诽谤、版权或知识产权侵犯及其所造成的各种损失等,都市视窗概不负责,亦不承担任何法律责任。
4、一切网民在进入都市视窗主页及各层页面时视为已经仔细阅读过《网站声明》并完全同意。