跳至内容

数字基础设施管理(DIM)

数字基础设施管理 (DIM) 是一种基于信息技术服务管理 (ITSM) 最佳实践的主动式运维管理服务。其目标是维护客户基础设施在物理和虚拟环境中的可用性、性能、治理和安全性。

DIM 支持 Equinix 内部的物理和虚拟目标,包括 Equinix 数字服务和位于 IBX 数据中心的资产,但仅限于技术矩阵中确定的技术。

Equinix Managed Solutions (EMS) 团队由经过认证的多学科专业人员组成,他们拥有管理各种基础设施目标的工具和专业知识,同时满足已定义的服务和可用性级别协议 (SLA)。

除了日常维护和定期分析外,还提供及时、相关的见解以支持战略决策,并为受管项目提供无限支持。

主要功能

DIM通过以下功能提供全面的基础设施管理:

  • 可用性和性能管理 - 持续监控并提出主动建议,以保持基础设施的可用性和性能,从而实现业务目标。

  • 快速响应 - 全天候支持,以解决检测到的异常情况、解决事件并满足客户通过服务目录提出的请求。

  • 增长规划 - 定期进行产能管理分析和增长建议,以帮助客户高效扩展规模并规划未来需求。

  • 治理、安全和合规性 - 系统更新、访问控制和强化措施的可见性,以降低风险并保持一致的安全态势。

  • 变更管理 - 支持管理变更流程,以减少服务中断和相关风险。

  • 服务级别协议 - 为受管基础设施组件制定响应预期和可用性目标的明确服务级别协议。

Equinix Solutions 的管理

数字基础设施管理可应用于完整的托管解决方案,其方法以环境为中心,而非侧重于单个组件。Equinix 解决方案包含特定用例所需的所有元素,包括硬件、软件和其他 Equinix 服务,这些元素部署在 Equinix 设施内客户的机柜或机笼中,并基于经 Equinix 和(在大多数情况下)相关技术供应商批准的已验证蓝图。这种方法可对已定义的环境和解决方案进行全面管理。

在这些情况下,数字基础设施管理 SLA 可以涵盖整个解决方案,并优先于各个组件级别的服务级别协议,从而抽象出解决方案中包含的其他组件。

此类解决方案的示例包括但不限于以下几种:

  • 网络边缘
  • NVIDIA DGX 托管私有 AI
  • 专用网络核心环境,配备专用防火墙和交换机
  • 专用私有云解决方案

活动范围

活动范围指的是数字基础设施管理基础服务,并可能因所管理的具体技术而异。

Digital Infrastructure Management scope of activities diagram

监测

Equinix 利用基于预定义严重程度的配置警报,在系统层面监控基础设施,从而提供受管环境运行状况的可见性。其目标是实时掌握系统可用性、性能和潜在风险,以便在问题影响运营之前及时响应。

基于监控结果,Equinix 提供洞察分析、预警信息和变更建议,以减少影响并最大限度地降低潜在的服务中断。这些信息还用于通过持续评估和配置优化来维持预期的性能水平。这一支柱可能包括旨在提升当前性能和长期改进系统运行的各项活动。

快速反应

客户的基础设施由 Equinix 管理,以确保持续可用性并支持关键组件的高效运行。如果服务中断,Equinix 将按照与客户协调制定的计划,执行纠正性运维活动以恢复服务。

此活动属于事件管理的一部分,不收取支持工时费。事件可能由客户请求发起,也可能由 Equinix 对观察到的情况做出响应而发起。数字基础设施管理提供 24x7x365 全天候支持。

以下措施属于事件管理范畴:

  • 执行必要的故障排除活动
  • 与技术供应商或第三方互动
  • 事件调查和持续改进
  • 问题管理
  • P1 事件事后审查 (RCA)(应客户要求)

超出DIM范围的事件解决,例如客户行为或外包第三方服务(例如软件、应用程序)导致的问题,将通过高级托管服务支持按小时计费。事件优先级基于以下评估,并可能随着分析的进行而调整:

PriorityImpact/UrgencyDescription
P1 HIGHUnforeseen unavailability of a service or environment managed by Equinix, in accordance with the service description. The customer cannot fulfill obligations to its users. The customer experiences direct demonstrable damage due to the unavailability of this service.The service must be restored immediately. The production environments are unavailable, with platform-wide disruptions.
P2 MEDIUMThe service does not offer full functionality, has partial functionality, or reduced performance, affecting users. The customer experiences direct demonstrable damage due to limited availability of the functionality.The service must be repaired the same day.
P3 LOWThe service functions with limited availability for one or more users, and a workaround is in place.The repair timeline is determined in consultation with the reporting person.

服务请求

当客户需要向 Equinix 团队请求执行某项操作时,可以使用服务请求。客户可以提交服务请求,用于无法通过操作控制台中的自助服务完成的服务变更,或者在 EMS 门户中需要帮助的情况。

有两种类型的服务请求:

  • **包含:**属于服务范围且不产生额外费用的服务请求。
  • **附加:**超出服务范围并导致额外收费的服务请求。

对于可通过自助服务完成的服务请求,我们提供相应的指导。在这种情况下,我们会提供操作步骤说明,并监督客户完成任务的过程。此外,Equinix 技术矩阵中列出的每项技术都包含其自身的一系列服务请求选项。

Type of Service RequestSelf-serviceType
Ask information about the productNoIncluded
Move DIM service from one target to anotherNoIncluded
Request Change Management supportNoIncluded
Request Escalation List updatesNoIncluded
Request Identity and access management changesNoIncluded
Request ad-hoc reportingNoAdditional
Request ad-hoc critical patching updateNoAdditional
Request ad-hoc capacity evaluationNoAdditional

增长支持

为确保可用性,还需要管理环境容量。Equinix 团队会监控所托管技术的关键 KPI,并在需要进行更改以避免影响可用性时通知客户。

变革管理

基础设施运维中的变更管理确保计划变更以可控、有序且安全的方式执行,从而最大限度地降低风险和服务中断。该流程使客户和 Equinix 管理团队都能在变更执行前了解即将发生的变更,包括提前沟通和协调规划。

变革管理包含的活动有:

  • 变更的规划和协调
  • 风险和影响评估
  • 变更的授权和批准
  • 变更通知和沟通
  • 变更的执行和监控
  • 实施后验证和测试
  • 更改回滚

变更管理中的变更类型:

  • Equinix 发起的变更: 基础设施维护和更新活动,例如网络设备的安全补丁和版本升级。
  • **客户要求的变更:**为满足客户需求而发起的变更,例如软件升级、配置调整或向环境添加新功能或组件。

有效实施的变更管理有助于提高运营效率和服务连续性,同时提高基础设施运营的安全性和可预测性。

治理与安全

数字基础设施管理中的治理和安全框架确保服务及其支持基础设施采用结构化的生命周期管理方法进行管理。

该框架遵循行业最佳实践,并向客户提供报告和建议,以支持其环境演进方面的决策。

主要目标是在保持客户环境完整性和可用性的同时,生成合规性证据和运营保证。

主要活动包括:

  • **定期报告:**资产管理洞察、已执行的服务水平协议、近期事件和问题、已完成的变更以及当前风险。
  • 关键安全补丁: 定期开展的活动,旨在识别安全漏洞并启动变更管理,以便将所需的更新应用到客户环境中。
  • 身份和访问管理: Equinix 团队对差异进行映射和报告。
  • **防火墙规则评估:**实施前对所请求的防火墙规则变更进行审查。

Equinix 还会根据客户的使用案例提供增强基础设施架构的建议,以支持提高安全态势和运营弹性。

周期性活动

EMS团队定期执行既定活动,包括检查新的关键补丁更新和固件版本,以帮助维护受管客户设备的可用性、性能和容量。定期执行这些活动使Equinix能够及早发现问题并降低环境中断的可能性。

有些活动仅适用于特定地区或技术,其频率由 Equinix 管理。

服务说明

服务选项

数字基础设施管理提供三种服务方案,客户可根据自身需求选择最合适的方案。针对每个管理目标,客户均可选择最恰当的服务方案。

Equinix 应用这些变体来使成本与管理的复杂性保持一致,而管理的复杂性取决于估计的劳动力需求和交付数字基础设施管理所需的工具。

起动机

此服务选项的范围有限,仅侧重于基础设施监控。其他活动可在高级支持计划下执行,但须遵守技术矩阵和服务目录中规定的限制。

标准

此服务选项包括本文档中定义的虚拟或物理网络设备、具有基本功能的防火墙和专用存储的完整服务范围。

先进的

此服务选项包括本文档中定义的 AI/GPU 设备、具有高级功能的防火墙和超融合设备的完整服务范围。

服务划分与赋能服务

作为数字基础设施管理的一部分,Equinix 定义了客户与 Equinix 之间的责任界限,收集了客户指定的管理目标的信息,并执行了为持续管理做准备所需的活动。

该程序可能包括:

  • 初步会议和活动安排
  • 建立客户与 Equinix 环境之间的连接
  • 验证需求和访问权限
  • 在受支持的设备上安装管理工具
  • 配置监控元素
  • 对受支持的技术应用标准(最佳实践)设置(加固)
  • 记录初始客户环境
  • 建立客户与 Equinix 之间的升级机制
  • 验证环境服务级别协议

过渡阶段

完成上述流程后,Equinix 将启动最长 90 天的过渡期。在此期间,Equinix 团队将管理所有目标,但数字基础设施管理服务级别协议 (SLA) 暂不生效。

过渡阶段的目的是为了统一预期并验证环境特性。在此期间,不会发放任何服务级别协议 (SLA) 补偿,Equinix 对未能履行 SLA 不承担任何责任。

局限性

数字基础设施管理仅涵盖在 Equinix 技术矩阵中选定为管理目标并列出的基础设施项目。这些项目可能属于客户所有,也可能属于 Equinix 所有。服务级别协议 (SLA) 仅适用于受管理的项目。

Equinix 会定期检查关键补丁更新(包括次要更新),并执行变更管理以应用这些更新。对于主要版本发布和其他非关键更新,Equinix 会在新版本可用时通知客户;执行这些更新可能需要额外的服务。

Equinix 仅为运营目的维护受管项目的管理凭证。但是,Equinix 不会监督、监控或控制客户存储或传输的内容或数据,也没有法律义务或技术能力这样做。

Equinix 使用符合运营和安全标准的专有且经批准的工具。这些工具包含在服务费用中。Equinix 可能会推荐针对特定技术的其他原生工具;采用这些工具是可选的,并且可能需要客户投资。

如果客户要求在其环境中使用特定工具,Equinix 会评估该工具的兼容性,并确定其是否满足运行和安全要求。此评估包括确认该工具是否支持服务执行。

Equinix不对客户数据内容承担责任,包括其来源、完整性、准确性、保密性以及是否符合知识产权或合同义务。客户应对所有传输行为负责,包括任何可能违反法律或道德规范的行为。

客户对电子商务和电子业务交易负全部责任,包括处理信用卡号、验证码和密码等机密信息。Equinix 对由此类交易引起的问题不承担任何责任。

Equinix 对客户的数据内容没有控制权或访问权限。

防火墙管理仅包含基本的防火墙功能。应用层控制或数据丢失防护 (DLP) 等高级功能不包含在内。

购买单位

数字基础设施管理的定价是根据要管理的目标项目的数量,并根据分配给每个项目的组件类型来确定的。

COMPONENT TYPEUNITNRCMRCOVERAGE
StandardEachYesYesMay apply
AdvancedEachYesYesMay apply
  • 非经常性安装费 (NRC) - 涵盖在服务启用期间,根据 Equinix 运营最佳实践和协议中定义的服务级别,对客户使用的组件进行服务实施和配置。
  • 每月循环费用 (MRC) - 表示根据服务范围中定义的组件类型,按管理中包含的组件数量对服务进行的持续计费。
  • 超额费用 - 当管理数量超过基准数量时收取的费用。

角色与职责

客户责任

客户必须及时提供服务所需的必要信息和访问权限。这可能包括对客户拥有或管理的设备的管理访问权限,以及确保提供给 Equinix 的所有数据和信息的准确性。

服务要求

数字基础设施管理仅适用于托管在 Equinix IBX 中的环境,并且仅限于 Equinix 技术矩阵中列出的已批准技术(包括型号和版本)。

为了管理环境,Equinix 为每项受支持的技术定义了一系列限制和先决条件。这些限制和先决条件可能是强制性的,也可能是基于最佳实践的。客户对这些先决条件的遵守程度直接影响在服务启用和过渡期间商定和验证的可用性服务级别协议 (SLA)。

可能影响适用服务水平协议 (SLA) 的因素包括:

  • 具有一定冗余度或高可用性的架构
  • Equinix 未提供的组件支持服务
  • 是否存在备份解决方案(通过 Equinix 或第三方)
  • 环境总体治理
  • 与特定技术领域的最佳实践保持一致

连接要求

为了执行管理活动,Equinix 需要按照推荐的连接框架,对客户环境进行远程、私有和直接访问。

客户必须配置 Fabric 连接,以确保其环境与 DIM 服务之间的安全通信。此 Fabric 连接不包含在 DIM 定价中。

必须通过 Fabric 连接提供一条专用的 DIM 访问路径。这种方法可以降低延迟,确保通信通道的独占性,并降低拥塞风险。

如果 Equinix 与环境的连接中断,我们将采取一切合理措施恢复连接。在此类中断期间,如果客户环境中可用,则可以使用带外 (OOB) 网络。如果连接中断是由于客户操作导致 Equinix 无法访问,Equinix 将通知客户并请求恢复连接。如果没有带外网络或冗余备份,或者客户操作导致无法访问,则服务级别目标 (SLO) 和服务级别协议 (SLA) 将暂停,直至连接恢复。

客户的其他责任

客户还需负责:

  • 为 Equinix 提供指定的业务和技术联系人,以便进行沟通和升级。
  • 提供服务活动所需的适当且完整的说明,包括与服务目录工单相关的环境详细信息。
  • 承担除 Equinix 提供的所有软件、服务和组件的责任,包括选择、使用、兼容性、监控和故障排除。
  • 管理EMS门户中的权限。
  • 提交的工单分类和紧急程度正确,并包含足够的信息。
  • 管理 Equinix 门户网站的主管理员角色。
  • 承担通过 EMS 门户执行的任何活动的责任。
  • 管理存储在客户环境中的所有数据的内容。
  • 向 Equinix 通报与受管环境相关的所有业务连续性策略。
  • 批准 Equinix 通过 EMS Portal 提出的更改建议。

RACI矩阵

R = 负责,A = 可问责,C = 咨询,I = 知情

ActivitiesEquinixCustomer
Define escalation listCIRA
Ensuring Equinix is an authorized partner for 3rd-party infrastructure supportCIRA
Network required to connect to Equinix Management toolsCIRA
Setup infrastructure monitoringRACI
Provide Equinix all available and requested documentation about the environmentCIRA

入伍

ActivitiesEquinixCustomer
Validation of escalation listRACI
Inform internal teams on how to report issues or open requestsCIRA
Check if all teams succeed in accessing EMS PortalCIRA
Provide Equinix team information about the environment and its importance to businessCIRA
Share with Equinix all business Service Levels used to drive workCIRA
Pre-schedule meeting to present first Periodic Reporting to customerRACI

操作

ActivitiesEquinixCustomer
Infrastructure / platform upgrades (Major releases)CIRA
Management of targets outside DIM scope or Equinix Technology MatrixCIRA
Opening of issue or request ticketsCIRA
Approve change windowsCIRA
Request root cause analysisCIRA
End user supportCIRA
Application managementCIRA
Selecting and providing Equinix Management systems / toolsRACI
Engaging with third-party supplier as necessaryRACI
Responsible for all Software Licenses in use in the environmentCIRA
Provide Equinix any updates in personnel to allow permission and access management changesCIRA
Inform updates on escalation listsRACI
Problem Management follow-upRACI
Request change management support from EquinixCIRA

服务水平

本服务级别协议 (SLA) 的目的是定义与 DIM 服务相关的可衡量的性能水平,并描述如果 Equinix 未能达到这些水平,客户可获得的补救措施。

支持 SLO

支持服务级别目标 (SLO) 适用于事件登记和解决活动(参见“快速响应”)。Equinix 的目标是在下表规定的时间内响应并解决 95% 的已提交故障单。

PRIORITYRESPONSE TIMERESOLUTION TIMEEXECUTION OF WORKSLA
P1< 30 min< 4 hours24 x 795%
P2< 60 min< 24 hours24 x 795%
P3< 120 min< 5 days24 x 795%
注意
  • 响应时间是从提交故障单到 Equinix Managed Solutions 专家发送正式回复的时间段计算的。
  • 解决时间是从 ITSM 工具中登记工单到关闭或取消工单,或移交给客户为止计算的。
  • 服务级别协议不适用于支持响应时间或问题解决时间;有关服务级别协议的详细信息,请参阅产品政策。

服务水平协议

数字基础设施管理仅为 Equinix 运营管理范围内的环境提供服务级别协议 (SLA) 保障。在 SLA 计算中,环境被定义为一组协同运行、可由 Equinix 主动监控且代表客户环境逻辑组成部分的受管组件。此映射在服务实施期间完成。

服务级别协议 (SLA) 仅适用于因 Equinix 管理职责范围内的故障导致的中断。由 Equinix 职责范围之外的组件、服务或操作(或非 Equinix 管理的操作)导致的事件或故障不视为违反 SLA。

下表列出了服务级别协议 (SLA) 参考级别,这些级别适用于每个受管环境。适用的 SLA 将在过渡阶段进行验证,并且可能存在一些差异。

月度服务水平协议 (SLA) 水平

SLA per MonthType of EnvironmentInfrastructure Resilience
99.95%ProductionEnvironment has a High Availability (HA) or cluster configuration in place.
95.00%ProductionNo High Availability; recovery depends on replacing the failed component.
No SLAN/AEquinix does not have access to the environment (partial or full) and will not be able to provide management or repairing activities.

对于上述服务级别协议 (SLA),Equinix 会评估托管环境的可用性。如果服务不可用时间超过可用性服务级别,客户有权获得相当于托管环境价值(在实施过程中定义)三十分之一 (1/30) 的补偿,该补偿仅限于适用订单中列出的 Equinix 托管解决方案项目。如果服务不可用时间超过 SLA 阈值,则每超过一小时,客户将获得相当于托管环境价值一小时 (1/720) 的额外补偿。

如果服务级别协议 (SLA) 未达到,这些补偿金是客户的唯一且专属的补救措施。补偿金的计算基于一个月内一次连续的服务中断。如果服务中断被认定为可豁免服务中断,则 SLA 不适用,Equinix 也不承担任何责任,包括以下情况:

  • 由超出 Equinix 合理控制范围的情况造成。
  • 因客户操作或疏忽而导致的结果,包括通过 SSH、第三方工具或其他方式进行的配置更改。
  • 第三方行为或不作为所导致的结果
  • 由客户和供应商直接解决
  • 因超出 DIM 范围或非 Equinix 管理的任何组件、服务或操作的故障而导致的后果
  • 发生在 Equinix 宣布的计划维护期间

Equinix 将在可能的情况下至少提前十四 (14) 天发出计划维护通知,并将干扰降到最低。

附加服务水平协议条款

  • 如果管理目标属于客户所有,则客户负责在发生故障时进行更换;服务级别协议仅适用于 Equinix 检测到故障并通知客户所需的期间。
  • 如果管理目标是 Equinix 拥有的,Equinix 将采取必要的措施进行维修或更换。
  • 如果客户在未遵循 Equinix 变更管理流程的情况下进行变更,则服务级别协议 (SLA) 可能不适用。
  • 如果组件软件版本超出供应商支持的级别,则服务级别协议可能不适用。
  • 服务级别协议仅适用于供货情况;更多详情请参阅产品政策。
  • 在配置为高可用性的环境中,如果服务保持在线,则一个节点的故障不计入不可用;Equinix 将继续进行节点恢复,而不会影响 SLA。

可用性不包含数据恢复服务。客户需自行负责数据恢复。如果客户拥有托管私有备份服务,则可通过自助服务控制台或提交支持工单来恢复数据。

地理可用性

在提供 Equinix 管理解决方案的国家/地区,任何配备 Equinix Fabric 的 IBX 均支持数字基础设施管理。如需了解最新可用性信息,客户应联系其销售代表。

此页面有帮助吗?