-
奔溃、卡顿、死机……互联网企业还需打造这一环
刘旷 / 2020-07-11 13:07 发布
配图来自Canva
互联网企业总是会反复经历业务极限场景,非常考验服务器的承压能力。爆点事件造成访问崩溃的事件早已屡见不鲜。
国内互联网圈仅在近几个月内就屡次发生“崩溃”事件。3月份在线课堂和办公很火,钉钉、企业等被曝多次崩溃,比如有用户反应上课到一半突然黑屏,钉钉还紧急找阿里云扩容了上万台服务器,以支撑随时可能到来的流量高峰;4月份董明珠在抖音首秀直播时,开局便遇到了技术问题,要么直播卡到没法看,要么直播没有声音,董明珠因此痛批了技术团队;5月份罗志祥的一篇头条文章让微博一度面临奔溃,文章无法加载或是加载卡顿,此前微博已被爆款热搜折磨多次,面对瞬时涌入了巨大流量,服务器几度宕机。
这些极限场景往往有远超于日常规模的数据和流量快速流通,因此对企业的服务器质量和能力是一次极限挑战。
互联网企业的“服务器之痛”
近日股市火爆,有不少券商集中向云服务商发出了扩容的迫切需求,以解决券商APP使用时数据延迟、交易卡顿等明显影响体验的问题。由此可见服务器能力在很大程度上决定了企业的业务能力。
互联网线上业务虽然都由数据组成,且数字化的信息在生产和流通上都已经非常便捷,但软件不能独立存在,它必须依附于硬件设备,因此服务器容量大小、处理能力高低往往决定了企业的运营效率和发展上限。尽管现在云服务在互联网领域的渗透率已经比较高,但是在面对很多用户瞬时大量涌入、集中下订单、集中提交申请的极限场景时,“服务器之痛”依然会时隐时现。
第一,服务器扩展能力低,无法精准适配业务运营需求,造成服务器资源闲置或浪费。比如某电商平台需要举办购物节,需要在现有服务器容量上再扩展一半,但是由于服务器无法扩展或只能扩展10%,所以不得不购买更多的服务器,这样就徒增了不少成本。
第二,服务器储存能力不足,一到数据高峰就卡顿或崩溃。以短视频平台为例,晚上用户大量涌入会造成很大的负载,但由于服务器储存能力不足,用户在打开和刷新短视频时会遇到加载变慢等问题。
第三,服务器不够智能,无法对业务进行额外的运算或负载支持。普通的服务器没有任何算法或算力上的加成,根本不存在智能化功能,这样很多数据就无法得到有效利用,企业也就很难在业务能力上有所提升。
第四,服务器容易罢工,自检自愈能力差。很多企业购买服务器时会走量,来满足足够的储存和扩展需求,但是由于服务器可靠性差,一有高峰往往会面临服务器大面积崩溃的情况,业务受到严重的负面影响。
好服务器必须能打
用户下不了单、客户用不了服务,很影响企业的收入和口碑,甚至会导致用户和客户大量流失。尤其是在双十一、秒杀、直播、股市火热、集中政务活动等特殊场景下,服务器出问题带来的后遗症可能会被无限扩大。
据此,一个好的服务器必须可靠,不论是在日常流量规模下,还是在高峰流量期,都要能稳定、高效的运作,而且无惧持续袭来的高峰负载考验,甚至可以凭借智能化能力辅助企业业务的优化改善。简单说,一台好的服务器就像企业的“作战指挥部”一样,身经百战依然能打。
具体看,一台可靠的服务器必须满足一些硬性条件。第一,有足够高的储存和分析能力,能够流畅处理快速产生的海量数据。如果把服务器比作一个控水系统,业务运作产生的数据是流水,有时候水流会很急有时很缓,那么好的服务器就能一边进水,一边出水(数据分析)并将水进行分类储存和利用。
第二,有很强的极限负载能力,面对数据波动和高峰能够游刃有余。极限业务场景的特征集中反复出现的请求,比如电商的每小时秒杀,能打的服务器可以有效扛住每次秒杀的波峰负载请求,并保证每笔订单的全流程畅通。
第三,有灵活的模块化扩展能力,能够让企业实现自由定制。一般而言,企业的业务流量变化都是周期性的,波峰和波谷可能略有位移,像618这样的购物节电商就需要对服务器进行扩展。优秀的服务器可以精准满足企业的扩展需求,比如刚好超过波峰的负载要求,这样就能最大化地利用服务器,企业也可以避免不必要的扩容成本。
企业需要高端服务器
可靠服务器的标准已经有了,但是不同企业的业务场景有不小的差异性,要同时满足不同企业的复杂极限业务场景,就必须在性能参数、扩展性、可靠性等方面达到顶尖水平。按此定位的话,只有高端服务器能够胜任。
从整个全球市场来看,目前高端服务器由于技术门槛高,所以只有少数厂商具备完整的高端服务器研发、生产、销售的一整套能力。联想作为高端服务器领域的主要参与者,近年来一直在高端服务器领域不断发力,以技术和产品推动企业快速进行数字化转型,为高端服务器进一步拓宽了应用范围。
联想近日推出了ThinkSystem SR850 V2和SR860 V2两款四路服务器,据悉这两款服务器在性能、可靠性、可扩展性方面有很大升级,比如使用了英特尔最新一代至强可扩展处理器,定位都是高端产品。根据其设计理念和配置,这两款高端服务器能够从三个方面来满足企业对数据处理的需求。
首先是高效可靠的处理能力。两款产品都搭载了基于英特尔全新Cedar Island平台打造的第三代至强可扩展处理器,具备6个UPI链路的网络拓扑结构,比第二代至强处理器性能提升最高达25%。SR860 V2可支持最多4个双宽NVIDIA V100S GPU或最多8个单宽NVIDIA T4 GPU,可以为计算密集型应用比如深度学习、3D建模实现效率增益,帮助企业实现更复杂的数据处理工作。
此外,两款新品还都支持全新的200系列傲腾持久内存,基于强大内存和虚拟化能力,能有效利用计算资源,不仅可以快速完成数据处理工作,还能保证工作负载的相互独立运行。因此,很多对智能化转型有明确需求的互联网企业,可以通过这种服务器来装备或升级自己的数据分析能力,从而提高对业务的洞察力,有机会找到更大的变现空间。比如直播和短视频企业,可依靠这两款服务器的智能分析能力,大量实时处理和分析平台用户的行为数据,结合自有的运营系统,将用户进行智能分类,为后续运营变现提供更多可能。
其次是简单灵活的可扩展性设计,使得这两款服务器能够在处理器、储存器上实现大容量扩展,比如SR860 V2可支持2到4个处理器,提供最多48个2.5英寸存储托架(安装最多48个SAS/SATA HDD或SSD)。
这样的扩展范围能够满足企业在不同业务量下的对负载的不同需求。比如在业务量较少时,就可以不扩展或少扩展,在业务火爆时,就可以全部扩展,电商、金融、教育、视频等领域的互联网企业都适用这种特性。
最后是完善及时的自检和自愈能力。联想服务器的可靠性一直在业内排名第1,SR850 V2和SR860 V2的可靠性、可用性和可维护性(RAS)特性使它们能够在出现故障时及时检测并启动快速自愈,保证企业业务能够持续稳定运转,避免经济损失。
对大型企业或是核心业务来说,服务器可靠性至关重要。比如电商、外送等靠交易量营收的平台,宕机一次就可能损失成千上万的订单,而高端服务器的自检和自愈能力能够有效保证业务在连续波峰时正常运行。
综上,ThinkSystem SR850 V2和SR860 V2这两款服务器拥有的这些特性很好地体现了高端服务器对企业的重要性。在保障业务运行、增强业务上限方面,高端服务器有不可比拟的优势。
高端服务器是企业跳板
其实近年来服务器崩溃使企业大面积业务停滞的事情并不少,很多企业甚至因此丢掉了核心客户,竞争力受到严重打击。在很多场景下,服务器问题带来的损失往往是不可逆的。
更关键的一点是,很多企业似乎还没有很好地意识到服务器对企业的重要性。大企业在关键时刻、关键业务上会毫无保留地使用可靠的高端服务器,以保证万无一失。在当前这个云时代,服务器关乎到每一笔订单、每一个浏览量、每一次提交、每一次刷新,服务器优劣与否,也会影响到企业业务的每一分每一秒。
高端服务器的出现正是吃透了这个逻辑。像联想新推出的SR850 V2和SR860 V2,比前一代升级明显,且针对互联网企业常见和极限的需求进行设计,灵活的扩展还可以满足企业个性化的服务器扩展需求,是一种具有代表性的高端服务器设计思路。
目前来看,在极限场景的刺激下,高端服务器会成为互联网企业的刚需,在购物、刷视频、买股票、做直播、搞摇号等情形下,成为保证业务稳定运作的关键。
IDC的报告指出,2019Q4全球高端服务器市场规模增长达到8.9%。随着企业数字化和智能化转型升级需求的不断扩大,能够保证业务极限能力以及为企业进行数字化赋能的高端服务器,由于综合能力的强大,会成为更多企业的重点选择对象,甚至是标配。像联想这样数十年深耕于高端服务器领域的厂商,会以全球推动者的角色,驱动高端服务器对各领域企业不断渗透,使高端服务器成为企业增长和升级的强有力跳板。