Tối ưu API dùng caching

dangquangminh

Super Moderator

Brainiac

Join Date: Oct 2005

Posts: 5044
- Share
- Tweet
#1

Tối ưu API dùng caching

3 days ago

🧠 Phần 2 – Tối Ưu Hóa Việc Sử Dụng API với Kỹ Thuật Bộ Nhớ Đệm HTTP

🔄 Bộ nhớ đệm HTTP – Không chỉ là phía máy khách

Trong kiến trúc hiện đại, bộ nhớ đệm HTTP (HTTP Caching) có thể được triển khai ở nhiều cấp độ:
Phía máy khách (client-side caching) – trình duyệt, ứng dụng di động

Phía trung gian (proxy caching) – ví dụ: CDN, reverse proxy như NGINX, Varnish

Phía máy chủ (server-side caching) – trong ứng dụng backend, máy chủ web, hoặc thậm chí trong tầng API Gateway

Ở phía máy chủ, bộ nhớ đệm có thể giảm đáng kể lượng công việc phải xử lý – đặc biệt khi tích hợp với truy vấn cơ sở dữ liệu. Ví dụ, khi một truy vấn được thực hiện, dữ liệu vừa được trả về cho máy khách, vừa được lưu vào cache cục bộ. Điều này tránh phải truy cập lại cơ sở dữ liệu quá thường xuyên (ví dụ 1000 lần/phút), giúp giảm tải hệ thống và tăng khả năng mở rộng (scalability).
⚠️ Thách thức lớn nhất của bộ nhớ đệm: Tính hợp lệ của dữ liệu

Tuy bộ nhớ đệm giúp tăng hiệu suất và tiết kiệm tài nguyên, rủi ro lớn nhất là dữ liệu có thể không còn hợp lệ:
Làm sao biết bản sao được cache có còn đúng so với dữ liệu thật?

Làm thế nào để phát hiện và phản ứng khi dữ liệu đã thay đổi?

Tùy vào loại hệ thống, ta có một số kỹ thuật đảm bảo tính nhất quán:
Trigger trong database: tự động làm mất hiệu lực cache khi dữ liệu bị cập nhật

Revalidation từ proxy: proxy sẽ kiểm tra lại với backend server mỗi khi có truy vấn

TTL hợp lý: giới hạn thời gian sống của cache (15s, 1 phút, 5 phút...)

Một chiến lược khôn ngoan có thể là chấp nhận dữ liệu cũ trong trường hợp backend tạm thời không phản hồi. Ví dụ, nếu API backend down trong vài giây, hệ thống vẫn có thể phục vụ dữ liệu đã cache – điều này tránh làm gián đoạn trải nghiệm người dùng, đặc biệt nếu tính thời gian không quá quan trọng.
📱 Trải nghiệm người dùng và bộ nhớ đệm phân tầng

Giả sử bạn tạo một bài đăng mới trên mạng xã hội:
Bạn (người tạo) cần thấy nội dung ngay lập tức → dữ liệu lấy trực tiếp

Người theo dõi bạn có thể thấy nội dung sau vài giây → cache tạm thời dùng để phân tán tải

Cách tiếp cận này giúp giảm băng thông, giảm độ trễ và mở rộng quy mô đến hàng triệu hoặc hàng tỷ người dùng. Bộ nhớ đệm được sử dụng có chọn lọc, phụ thuộc vào mức độ ưu tiên thời gian thực và logic kinh doanh.
🧾 Kiểm soát bộ nhớ đệm trong HTTP

HTTP cung cấp nhiều cách để kiểm soát bộ nhớ đệm thông qua HTTP headers:
Cache-Control: no-store → không được lưu trữ bất kỳ đâu

Cache-Control: no-cache → được lưu tạm, nhưng luôn kiểm tra lại với server

Cache-Control: max-age=30 → được lưu trong 30 giây

ETag, Last-Modified → dùng để so sánh và xác thực tính hợp lệ dữ liệu

Bạn có thể chỉ định chính xác từng loại dữ liệu nên hoặc không nên được cache, giúp cân bằng hiệu năng và độ chính xác.
🔐 Cẩn trọng với dữ liệu nhạy cảm

Một rủi ro nghiêm trọng là khi dữ liệu riêng tư bị cache sai cách:
Khi chưa đăng nhập, dữ liệu thường là công khai → cache thoải mái

Sau khi đăng nhập, dữ liệu có thể rất riêng tư → cache không đúng sẽ dẫn đến rò rỉ thông tin

Ví dụ: nếu proxy hoặc trình duyệt lưu nội dung cá nhân nhưng phục vụ lại cho người dùng khác, bạn đang gặp vi phạm bảo mật nghiêm trọng. Luôn sử dụng Cache-Control: private hoặc no-store khi dữ liệu là riêng tư.
✅ Kết luận – Bộ nhớ đệm là công cụ mạnh nhưng cần dùng đúng cách

Bộ nhớ đệm là nền tảng cho việc mở rộng hệ thống API hiện đại. Tuy nhiên, khi sử dụng bạn cần nhận thức rõ:
Khả năng mất đồng bộ dữ liệu

Rủi ro rò rỉ thông tin nhạy cảm

Nhu cầu tái xác thực và TTL phù hợp

Một số tổ chức thậm chí vô hiệu hóa bộ nhớ đệm hoàn toàn ở những phần nhạy cảm, chỉ để đảm bảo tính nhất quán tuyệt đối.

Đặng Quang Minh, CCIEx2#11897 (Enterprise Infrastructure, Wireless), DEVNET, CCSI#31417

Email : dangquangminh@vnpro.org
https://www.facebook.com/groups/vietprofessional/
Tags: None

Announcement

Tối ưu API dùng caching