算力比谷歌便宜九成 AI时代“Windows”系统什么样?
作者:admin浏览数:2020-08-20 23:23:16
IT时报记者 孙鹏飞
“PC时代的里程碑是操作系统。”在第四范式创始人、CEO戴文渊看来,操作系统解决进程管理、作业管理、文件管理、设备管理以及存储管理,实质解决的是标准化问题,而在AI时代,第四范式也想要创造一套AI领域的“Windows系统”。
在8月20日召开的年度发布会上,第四范式交出了答案—— 企业级AI操作系统Sage AIOS。同时,第四范式还发布了自动化AI生产力平台Sage HyperCycle ML、线上化智能运营系统天枢以及全新AI算力平台SageOne等多款产品,覆盖算力、操作系统、生产平台及业务系统。
那么,这些产品有何不同?
Sage AIOS:1-2天落地一个AI应用
“第四范式Sage AIOS产品界面”
Sage AIOS被定义为AI领域的Windows系统。在发布会展示中,Sage AIOS的界面和Windows、MAC、OS操作系统颇为类似。而实际功能上,Sage AIOS封装各类AI 应用,能针对某一场一键上线业务类应用。
数据治理,是AIOS的重要设计。戴文涛发现,目前AI企业在数据治理上占据的时间高达95%。即便如此,数据质量仍影响着实际效果。
“有AI科学家自嘲,每天做的工作叫‘炼丹’,把数据炼一下,可能出来的是仙丹,也可能是废物。” 戴文渊笑称。
这是因为,AI需要一套支持数据一致性、时序性和闭环的治理系统。
具体来看,AIOS平台规定了数据的准备和使用方式,操作人员可根据数据治理需求从相应的IT系统上调取,并处理成为AI准备的数据,再“投喂”到系统中。
据了解,在AIOS平台上,企业从0开始处理数据,到落地一个AI应用,只需1-2天。
值得一提的是,类比于Windows的“进程调度器”, Sage AIOS采用自研的容器冻结和迁移技术——Hyper Scheduler,能动态对各个任务进行合理的资源分配,管理调度CPU、GPU、加速卡等各类异构设备资源,避免任务响应慢、宕机等情况。
“就像玩俄罗斯方块,根据不同任务特性分配资源,比原先的方式,更能提升空间利用率。”AIOS产品负责人黄缨宁称。
资源利用率提升50%,全流程耗时节约2/3,是Hyper Scheduler带来的效果。
HyperCycle ML:小白也能上手的AI语言
据第三方公司调查显示,每年新增100万个AI应用场景,而每年最多新增1000名科学家。供需之间有着矛盾。
“不夸张地说,99%的AI企业缺少科学家,包括我们。” 戴文渊直言,如果一家企业只有2个科学家,即使24小时工作,也只能解决几十个场景,但仍有几百个场景等待解决。
而要成为一名AI科学家还需要名校PhD高学历、TensorFlow经验等元素,这样的人才本是稀缺,也需要培养周期。
为此,第四范式在AIOS平台上为非AI专业人士准备了AI高级语言HyperCycle ML。据悉,HyperCycle ML将AI过程简化为“行为、反馈、学习、应用”四步,自动完成从数据引入、数据定义、特征处理、模型训练、模型应用和模型自学习的AI全流程。
此外,HyperCycle ML还提供100多个高性能模块以及60多种算法,能将高难度、繁琐重复工作交给机器,建模时间能从原来的400个小时缩短为10个小时,自动化模型的精准度达到排名前10%的AI科学家水平。
值得一提的是,HyperCycle ML还是一个线上闭环,会自动收集线上的行为和反馈数据进行自学习,以确保稳定、持续迭代的模型效果。
Sage One:1/10谷歌成本,全局算力优化
AI算力有多值钱?戴文渊给出了这样一组数字:1克黄金值480元,而1克算力值100元,相当于1/5克黄金。在他看来,如果AI要运用于更复杂的环境中,算力成本很可能超过黄金。
现实中,AI对算力的需求无止尽。
据Gartner预测,2022年平均每个企业在AI算力上的支出会是18年的4倍,总体市场支出将超过50亿美元。
但另一方面,昂贵的算力成本背后,还有浪费。即使企业数据中心对AI负载进行针对性优化,算力平均使用率依然达不到60%。
事实上,第四范式曾遇到过千亿维度的数据量,但当时的计算芯片无法处理,他们不得不开发高位机器学习框架GDBT,从软件层面解决计算问题。然而,新问题随之而来,数据毫秒级存储及供应难以实现,由此又诞生了第四范式的AI实时内存数据库RTiDB。
随后,瓶颈再度降临在通信上,数据同步、信息交换,效率也影响着算力。
算力之痛,关联在AI的每个环节。
Sage One是第四范式的AI算力平台,能针对计算资源、存储网络差异化要求进行AI生命周期全局优化。
据介绍,在某连锁餐饮企业实际应用中,第四范式曾以一顶十,用8台Sage One替换了88台通用服务器集群。
据相关负责人介绍,经过与谷歌500块GPU和价值1500万元的算力投入对比,第四范式第二代Sage One的算力成本仅为谷歌的1/10。
天枢:提升80%下单率背后的AI大脑
Sage AIOS平台上首个平台型应用,是为传统企业提供线上用户留存优化和增长优化的运营产品“天枢”。
据App Annie报告,因为疫情,在线化和移动化进程快进了2-3年。此前,传统线下行业的竞争仅限于商圈同品类的店铺,而迁移到了线上,争夺的是无差异用户的时间,终点是用户留存。
据介绍,天枢如同给线上门店植入AI大脑,能快速响应用户需求,通过实时数据流连接场景,以场景、细节推送信息,提升终端用户体验。
天枢产品曾运用于某汽车品牌的售中和售后客服,令其专人工率下降了5倍。而作为售前客服,天枢比人工客服下单率提升80%。
据现场工作人员介绍,目前天枢已服务于零售、银行媒体和互联网等行业上千家企业。
热门评论