服务容错保护
Spring Cloud Hystrix
Spring Cloud Hystrix是基于Netflix的开源框架Hystrix实现的,其目的是为了通过控制那些访问远程系统、服务和第三方的节点,从而对延迟和故障提供强大的容错能力。Hystrix具备了服务降级、服务熔断、线程隔离、请求缓存、请求合并以及服务监控等强大功能
断路器类似于我们家里面强电箱里面用到的漏电断路保护器,当服务单元出现故障(类似于电器发生短路),通过断路器的故障监控功能(类似于保险丝),向调用方返回一个错误响应,避免长时间等待,从而避免故障蔓延到整个系统。
当我们调用一个服务出错时,会展示类似以下页面的错误页:
1 | Whitelabel Error Page |
从而导致整个系统的崩溃,为了维持系统的正常运行,当某一单元出问题时,通过服务容错保护机制,来实现服务的降级和隔离,确保整个系统的正常运行。
我们将上篇文章中Ribbon的工程拷贝一份改名为service-consumer-ribbon-hystrix
,并在其pom文件中加入引用:
1 | <dependency> |
spring-cloud-starter-hystrix-dashboard依赖是开启Hystrix监控面板
配置文件bootstrap.yml
:
1 | eureka: |
工程主类需要加入@EnableCircuitBreaker
或@EnableHystrix
声明开启断路器服务,加入@EnableHystrixDashboard
开启监控面板:
1 | /** |
定义一个HystrixController
来实现/testHystrix
接口:
1 | /** |
相对应的服务和服务实现类分别如下:HystrixService
1 | /** |
HystrixServiceImpl
1 | /** |
这里我们在需要进行保护的服务调用方法上添加注解并给于它一个fallback方法的声明
@HystrixCommand(fallbackMethod = "fallback")
,确保在该方法调用出错时会自动调用该类中的fallback方法。
工程至此创建完成了,我们分别启动注册中心,配置中心,服务提供方和该工程,
直接访问服务提供端 http://localhost:6070/testHystrix 会在延迟后出现:
1 | Hello, Spring Cloud! My port is 6070 This is a testHystrix result |
访问该工程加了Hystrix保护的 http://localhost:7040/testHystrix 出现:
1 | service-producer /testHystrix is error |
Spring Cloud Hystrix Dashboard
下面介绍下如何查看监控面板,访问 http://localhost:7040/hystrix 出现以下页面:
这是Hystrix Dashboard的监控首页,该页面中并没有具体的监控信息。从页面的文字内容中我们可以知道,Hystrix Dashboard共支持三种不同的监控方式,依次为:
- 默认的集群监控:通过URL http://turbine-hostname:port/turbine.stream 开启,实现对默认集群的监控。
- 指定的集群监控:通过URL http://turbine-hostname:port/turbine.stream?cluster=[clusterName] 开启,实现对clusterName集群的监控。
- 单体应用的监控:通过URL http://hystrix-app:port/hystrix.stream 开启,实现对具体某个服务实例的监控。
前两者都对集群的监控,需要整合Turbine才能实现,这里我们先来实现单个服务实例的监控。
页面上方还有两个参数:
- Delay:该参数用来控制服务器上轮询监控信息的延迟时间,默认为2000毫秒,我们可以通过配置该属性来降低客户端的网络和CPU消耗。
- Title:该参数对应了上图头部标题Hystrix Stream之后的内容,默认会使用具体监控实例的URL,我们可以通过配置该信息来展示更合适的标题。
在Hystrix Dashboard的首页输入已启动的服务 http://localhost:7040/hystrix.stream ,已启动对“service-consumer-ribbon-hystrix”的监控,点击“Monitor Stream”按钮,出现如下页面:
- 实心圆:共有两种含义。它通过颜色的变化代表了实例的健康程度,如下图所示,它的健康度从绿色、黄色、橙色、红色递减。该实心圆除了颜色的变化之外,它的大小也会根据实例的请求流量发生变化,流量越大该实心圆就越大。
- 曲线:用来记录2分钟内流量的相对变化,我们可以通过它来观察到流量的上升和下降趋势。
右上角那里的数字颜色对应Success | Short-Circuited | Bad Request | Timeout | Rejected | Failure 的颜色
本项目内容为Spring Cloud程序的样例:
样例列表:(SpringCloud版本基于Edgware.SR5)