|
|
|
|
公众号矩阵

如何在物理机上运行混沌试验?

借助开源Chaos Mesh,您可以模拟种种故障,并使用Chaos Dashboard这个Web UI直接管理混沌试验。

作者:布加迪来源:51CTO|2021-09-28 08:00

【51CTO.com快译】Chaos Mesh®是一个云原生混沌工程(Chaos Engineering)平台,负责编排Kubernetes环境中的混沌。借助Chaos Mesh,您可以模拟种种故障,并使用Chaos Dashboard这个Web UI直接管理混沌试验。自开源以来,Chaos Mesh已被许多公司采用,以确保其系统的弹性和稳健性。但在过去的一年,我们常听到社区的要求,询问服务没有部署在Kubernetes上时如何运行混沌试验。

什么是chaosd?

chaosd是一个增强的工具包,可满足物理机上的混沌测试日益增长的需求。您可能会觉得这个名字很熟悉!那是由于它是从Chaos Mesh中的一个关键组件chaos-daemon演变而来的。

在TiDB黑客马拉松2020上,我们重构了chaosd,使其不仅仅是一个命令行工具。现在有了chaosd v1.0.1,您可以模拟针对物理机的特定错误,然后像什么没发生一样撤消混沌试验。

chaosd的功能特性

chaosd的最新升级版拥有广泛的功能,以下是最突出的几项:

  • 易于使用:可以使用chaosd 命令轻松创建和管理混沌试验。
  • 多种故障类型:可以在不同级别模拟物理机上注入的故障,包括进程故障、网络故障、Java虚拟机(JVM)应用程序故障、压力场景、磁盘故障和主机故障。
  • 多种工作模式:可以将chaosd 用作命令行工具或服务。

事不宜迟,不妨试一试。

如何使用chaosd?

这部分将逐步介绍如何使用chaosd注入网络故障。您的Linux内核版本必须是v2.17或更高版本。

1.下载并解压chaosd

要下载chaosd,请运行以下命令:

  1. curl -fsSL -o Chaosd-v1.0.1-linux-amd64.tar.gz https://mirrors.chaos-mesh.org/chaosd-v1.0.1-linux-amd64.tar.gz 

解压缩文件。它含有两个文件夹:

  • chaosd含有chaosd的工具入口。
  • tools含有进行混沌试验所需的工具,包括stress-ng(模拟压力场景)、Byteman(模拟JVM应用程序故障)和PortOccupyTool(模拟网络故障)。

2. 创建混沌试验

在这个混沌试验中,服务器将无法访问chaos-mesh.org。

运行以下命令:

  1. sudo ./chaosd attack network loss --percent 100 --hostname chaos-mesh.org --device ens33 

示例输出:

  1. Attack network successfully, uid: c55a84c5-c181-426b-ae31-99c8d4615dbe 

在该模拟中,ens33网络接口卡无法向chaos-mesh.org发送网络数据包或无法从chaos-mesh.org接收数据包。之所以要使用sudo命令,是由于混沌试验修改了网络规则,这需要root权限。

另外,别忘了保存混沌试验的uid。您稍后将在恢复过程中输入该信息。

3. 验证结果

使用ping命令查看服务器是否可以访问chaos-mesh.org:

  1. ping Chaos-mesh.org 
  2. PING Chaos-mesh.org (185.199.109.153) 56(84)  bytes of data. 

执行该命令后,该网站很可能不会响应。按CTRL+C组合键以停止ping进程。您应该可以看到ping命令的统计信息:100% packet loss(100%丢包)。

示例输出:

  1. 2 packets transmitted, 0 received, 100% packet loss, time 1021ms 

4. 恢复试验

要恢复试验,运行以下命令:

  1. sudo ./chaosd recover c55a84c5-c181-426b-ae31-99c8d4615dbe 

示例输出:

  1. Recover c55a84c5-c181-426b-ae31-99c8d4615dbe successfully 

这一步还需要使用sudo命令,因为需要root权限。完成恢复试验后,再次尝试ping chaos-mesh.org,以验证连接。

下几步

1.支持仪表板Web

如您所见,chaosd易于使用。但是我们可以让它变得更简单——面向chaosd的仪表板Web目前正在积极开发中。

我们将继续增强其可用性,并实现更多的功能,比如管理使用chaosd运行的混沌试验以及使用Chaos Mesh运行的混沌试验。这将为Kubernetes和物理机上的混沌测试提供一致且统一的用户体验。

下面的架构只是一个简单的例子:

图1. Chaos Mesh的优化后架构

2.添加更多的故障注入类型

目前,chaosd提供六种故障注入类型。我们计划开发得到Chaos Mesh支持的更多类型,包括HTTPChaos和IOChaos。

如果您有兴趣帮助我们改进chaosd,欢迎选择一个问题单,开始入手!

试一试!

如果您有兴趣使用chaosd,并想探索更多,请查看文档。如果您在运行chaosd时遇到问题,或者有功能请求,请随时创建问题单。我们很想听到您的声音!

原文标题:How to Run Chaos Experiments on Your Physical Machine,作者:Xiang Wang

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

【编辑推荐】

  1. 微软又推Windows 11检测工具了 这次据说准了点
  2. 使用 Linux 命令行工具来了解你的 NVMe 驱动器
  3. 创原会|百位技术精英齐聚杭州,共论云原生发展新范式
  4. 推荐八个很棒的 React 工具库,强烈建议收藏
  5. Linux 这些工具堪称神器!你用过哪个?
【责任编辑:华轩 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

带你轻松入门 RabbitMQ

带你轻松入门 RabbitMQ

轻松入门RabbitMQ
共4章 | loong576

47人订阅学习

数据湖与数据仓库的分析实践攻略

数据湖与数据仓库的分析实践攻略

助力现代化数据管理:数据湖与数据仓库的分析实践攻略
共3章 | 创世达人

14人订阅学习

云原生架构实践

云原生架构实践

新技术引领移动互联网进入急速赛道
共3章 | KaliArch

42人订阅学习

视频课程+更多

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微