看透可靠性看透容错

沙地建楼,搞不好就会 “楼歪歪”。信息化也是如此,没有可靠性,业务也会没有保障。据有关机构统计,金融企业每次宕机损失平均为1000万美元,公司声誉等无形资产损失更是无法估量。系统可靠性,是信息化应用的前提。

为了追求系统可靠性,企业在信息化建设上投入大量的资金,从“两地三中心”,到系统冗余,数据备份,目的就是一个保障系统的安全可靠。对于关键业务应用而言,需要系统7×24×365不间断运行,对可靠性要求为99.999%,也就是全年累计的宕机时间不超过5分钟。

为了追求可靠性,双机冗余是最常采用的解决方案,也就是双机热备。通过采购2套系统,当一台机器出现故障的时候,另外一台机器接替其工作,确保系统不中断运行,两台机器之间依靠心跳线侦测进行判断和切换,接管服务。为了提高投资效率,两套系统之间尽可能采用互备、主从、并行等不同工作方式。尽管如此,采用双机热备,软件/硬件投资加倍,增加了用户负担。更为重要的是,采用心跳线侦测的方法,有时候会出现误报的问题,增加了新的不安全的因素。

从技术上看,双机热备的系统可靠性只有99.9%的水平,全年累计宕机时间不会超过8.8小时。要想实现99.999%,也就是5个9的水平,只有选用容错服务器

容错服务器的代表厂商是美国的Stratus公司。从1980年Bill Fost创办Stratus至今,容错服务器已有30多年历史。期间容错服务器得到了很多投资人青睐,英特尔就是Stratus的第2大股东。

与双机热备方案相比,容错容易被用户忽略,价格高是其中很重要的原因。以往,容错服务器以往动辄上百万元,接近了小型机价格。高价位影响了容错的服务器的推广应用。但随着x86芯片技术不断进步,特别是多核技术的发展,容错服务器迎来新的发展机遇。以Stratus为首,容错开始抛弃专用芯片,采用x86通用芯片。如今Stratus入门级产品只需要10多万元。

单就硬件成本来说,容错还是高于双机热备。但从系统角度来考虑,特别是考虑软件的成本,容错服务器是一台机器,操作系统、数据库等软件只需要购买一套,可以大大节省软件的成本。也是因为这个原因,软件厂商从商业利益的角度出发,不会帮助Stratus等推广容错解决方案。软件厂商更愿意帮助服务器厂商推广双机热备的方案,追求双赢。容错只能是用户的选择。

影响系统可靠性的因素非常多,很多并不是双机可以解决的。以Windows应用为例,常有这样的用户体验,重启Windows有时候就可以解决问题。其中的原因就在于,无论是CPU、内存,还是I/O在计算或者传送数据过程中,都有可能受到电源波动、电磁等因素的干扰,产生错误的计算,影响系统可靠性。

只要是关键业务需要,无论计算量的大小,都需要高可靠性。以机场无人值守“Shuttle”火车为例,全部依靠系统控制,计算量不大,但要求具有很高可靠性,运行时间、开关门操控准确无误。稍有差池,就会酿成事故。在钢铁、电力、政府等很多应用领域,对于可靠性都具有非常高的要求,容不得半点差池。

在技术上,借助“锁步技术”,容错服务器可以***程度校正硬件故障。在容错服务器设计上,CPU、内存、I/O等,全部采用冗余设计,并通过锁步技术,对每个计算过程进行比对,准确无误才会进入下一个步骤。因此其系统的可靠性可以达到5个9的 水平。

在国际上,容错技术得到用户的广泛认可。但在国内,用户受厂商、集成商的影响比较大。从商业利益考虑,厂商往往不会主动推荐容错技术,影响了容错在国内的发展。根据数据统计,国内采用容错技术的用户尚没有国外的1/3。此外,关键业务应用市场规模大,但单机数量小。在出货量上没有办法与PC服务器相比,市场份额不大,在各种统计报表中,容错往往被忽略,客观上也影响力了用户对容错的关注。

4月23日,亚马逊云计算数据中心故障为用户提了个醒。对于可靠性是没有办法完全假手他人的,就连云计算也没有办法真正做到可以完全不关注底层基础设施。可靠性还是需要引起高度关注的话题。在众多高可靠性解决方案中,容错技术是可选方案之一。

 

【编辑推荐】

  1. 绿盟科技应邀出席甘肃省政府行业信息化安全建设高峰论坛
  2. 构建安全可靠的医院信息化系统
  3. 北信源终端体系在吉林区域客户信息化研讨会上引关注
  4. 观察:青岛国税局信息化的“鲜活绝招”
  5. 趋势科技为社保信息化建设一路“挡风遮雨”

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/141671.html<

(0)
运维的头像运维
上一篇2025-03-04 12:34
下一篇 2025-03-04 12:35

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注