Cache Stampede

목표

server side cache는 자주 바뀌지 않는 데이터에 대해서 데이터베이스 읽기 동작을 최소화 하기위해 캐싱한다.
redis를 사용한다고 하면, redis로 데이터를 조회한 후 존재하지 않는다면 데이터베이스로 조회를 하고, 이를 redis에 저장한다.
- 이런 경우 일반적으로 캐시에 TTL(만료 기간)을 설정해둔다.
이 경우 트래픽이 1000rps 인 서비스에서 redis의 데이터가 TTL 만료가 되었다고 했을 때, 1초동안 redis에 캐싱을 하지 못 한다면 1초 동안 1000개의 요청이 모두 데이터베이스를 조회하면서 데이터베이스에 부하를 줄 수 있다.
이를 Cache Stmpede라고 부른다.

TTL이 만료되기 전에 확률적으로 캐시를 재갱신한다.
TTL 만료 시각에 가까워질수록 재갱신 될 확률이 높아진다.
주로 사용하는 PER 갱신 기준은 “TTL까지 남은 시간 <= -∆β log(rand())” 으로 처리한다.
- β(갱신 빈도 관련 상수, default = 1.0)
- ∆(Recompute Time Interval): 캐시를 다시 계산하는데 걸리는 시간. 캐시 재계산이 오래 걸릴 수록 일찍 캐시가 될 확률이 높아진다.
- 관련 논문: https://cseweb.ucsd.edu/~avattani/papers/cache_stampede.pdf