快捷导航
百度应用混部技术高效解决服务器资源利用率较低问题
    服务器资源利用率较低,TCO(IT 基础设施的总拥有成本) 逐年上涨,对于拥有大量机器资源的公司来说无疑是一个头疼的问题。混部技术就是在这种情况下应运而生,目前,混部技术在业界还属于比较小众的领域,只有一些资源量级较大的公司在研究、发展混部技术,以期获得收益。

     对于百度而言,通过应用混部技术,主混部集群数十万台,提升 CPU 利用率到 40+%,累计节约了数十亿人民币。目前百度容器引擎产品 CCE 已支持在离线混部,并完成了大规模业务落地。

    在百度内部,我们认为在线业务特点包括但不限于:运行时间长,延时敏感,对稳定向要求较高,服务不稳定业务会立马感知并且带来损失,有明显的波峰波谷,白天高,深夜低,比如广告搜索业务;而离线业务的特点包括但不限于非延时敏感,可重试,运行时间一般较短在几十分钟左右,内部一般为大数据计算,机器学习等服务。

     在线业务以搜索为例,白天用户工作学习时查询量会非常大,但是当大部分用户夜间休息时,查询量相对白天就会变得非常小,此时我们就可以引入离线业务。离线业务没有严格的时间要求,随时都能跑,用户关心的是任务能不能跑完,对于什么时候跑完并没有太大的需求,同时如果单机上资源有冲突,此时我们会压制离线业务,甚至会驱逐离线业务,这对用户是无感的,计算平台重新拉起任务,继续计算。
http://www.hnjjnews.com/netnews/10-2022226-43484.html
http://www.hnjjnews.com/contents/15-2021813-41649.html
举报 使用道具
| 回复

共 0 个关于本帖的回复 最后回复于 2022-3-1 20:39

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

推荐板块

精彩推荐

热门排行

明星用户

QQ|小黑屋|天之润护肤乳液官方网站

GMT+8, 2024-5-16 07:49 , Processed in 0.092870 second(s), 24 queries .