引言
CDN
在静态资源的加速场景中是将静态资源缓存在距离客户端较近的CDN
节点上,然后客户端访问该资源即可通过较短的链路直接从缓存中获取资源,而避免再通过较长的链路回源获取静态资源。因此 CDN的缓存命中率的高低直接影响客户体验,而保证较高的命中率也成为了站长的核心命题。在本文中我们就一起探讨 CDN 缓存命中率的概念、影响因素以及优化策略。
一、缓存命中率的概念
命中率=(总请求数—回源请求数)/总请求数
控制台可以查询具体的命中率,如图:
在CDN的请求日志中,CDN记录了所有的CDN请求的缓存命中状态,其中“cache命中状态”字段为HIT即表示命中,而MISS即表示未命中的状态。这里特别需要注意的一点是这里的命中状态仅表征CDN的L1节点的命中状态,当CDN的L1节点未命中缓存但是L2节点命中缓存的情况下这里仍然会显示MISS。
二、影响因素及优化建议
1. 文件类型是否适合于在CDN上缓存
CDN在业务架构中负责加速静态资源,因此如果动态资源也经过CDN的话是会导致CDN的命中率下降的。CDN判断动态文件和静态文件的标准是该文件的response头中是否带有Etag头和Last-modified头。这两个头在HTTP协议中分别通过文件内容和文件最后修改时间表征文件的修改情况。
因此建议用户使用过程中优化点:
网站架构是否适合于动静分离。动静分离是常见的网站优化的策略,主要是通过将静态资源和动态资源分离成两个站点提供服务。静态资源由于长时间不会发生变化,因此可以使用CDN加速;而动态资源因为需要实时获取源站的资源并且可能源站加载需要一段时间(CDN回源获取数据有严格的的回源超时时间,动态文件响应较慢可能导致CDN回源直接抛出504错误)而直接解析到源站服务器拉取资源。
配置合理的源站缓存规则。源站服务器可以针对于资源配置其缓存规则。当源站配置了以下response头时CDN将不会对该文件进行缓存:
1)有s-maxage=0,no-cache,no-store,private其中一种
2)如果没有s-maxage或者s-maxage=0,并且有max-age=0.
3)带Pragma: no-cache
而且上述的response头在CDN缓存规则中将有最高优先级(即使CDN上配置了缓存规则也不缓存),因此上述的这些response头并不适合于配置于源站的静态资源的。另外当CDN上没有配置缓存规则时,资源的缓存规则将按照源站的Cache-Control或者Expires头进行缓存(Cache-Control优先级比Expires高),因此建议用户设置合理的Cache-Control或者Expires头。
配置缓存规则。上面所指的没有包括Etag和Last-modified头而导致CDN缓存时间为0的场景是CDN控制台上没有配置缓存配置时会出现这种情况,因此如果用户的静态资源确实无法配置上述两个response头的话是可以考虑针对该文件配置缓存规则,这样该文件即可在CDN上按照缓存规则进行缓存。
2. CDN的刷新和预热功能
刷新功能是指将特定URL或者目录下的所有历史缓存的内容清除掉,该操作常用于源站进行同名更新后导致CDN缓存内容已为历史脏数据,刷新后将使URL下次访问时直接回源。因此会导致命中率下降。
预热功能是将URL提前上传到CDN的L2节点上,这样下次访问的时候就不需要从源站再拉取资源了,因此预热是没有直接导致L1的命中率升高,但提升了CDN的真实命中率。
3. CDN缓存规则是否合理
CDN上是可以针对于目录或者后缀名设置缓存配置的。而在CDN和源站同时配置缓存规则时是会以CDN上的缓存规则优先的(除非源站设置了不允许缓存的规则),因此建议用户在CDN控制台中设置合理的缓存规则,避免走默认的缓存规则导致频繁回源(默认缓存经常缓存3600秒过期)。
4. 可变参数导致命中率下降
在CDN处理的过程中默认的处理逻辑是对于同样的URL而带有不同queryString的请求会认为完全不同的请求,因此缓存也对应的是不同份,这就会导致如果queryString参数发生变化时会导致重新回源,因此命中率会出现下降的情况。
业务系统允许的情况下使用“过滤参数”功能。开启过滤参数功能后,CDN接收到queryString的URL替换成没有带参数的URL。
5. CDN加速域名流量较低
有些判断用户流量很低,我们服务的节点多,由于服务第一次都需要正常回源,所以可能会导致回源率高的情况。
在此感谢各位童鞋阅读,如果能够对大家有所帮助,欢迎点赞转发。
同时欢迎扫码关注京东云技术中台团队的公众号:云服务飞行团;更多精彩内容会持续放送!