HTTP Caching

HTTP Caching ist eine Technik im Hypertext Transfer Protocol (HTTP), um Ressourcen (Dokumente, Bilder, Dateien allgemein) anhand bestimmter Kriterien in einem Cache zwischenzuspeichern, um unnötige Datenübertragungen, Serveranfragen zu vermeiden und Zugriffszeiten zu verringern. Da gleichzeitig sichergestellt werden muss, dass die übertragenen Inhalte nicht veraltet sind, ist es nötig, die Zwischenspeicherung von Internetseiten oder anderen Ressourcen genau steuern zu können. Im HTTP-Standard[1] sind dafür eine Reihe von Tags definiert, die das Caching auf Proxy- und Clientebene (Browser-Cache) unterstützen.

Methoden für die Cachekontrolle

Für HTTP sind drei grundlegende Mechanismen definiert, um Caches zu kontrollieren: ‚Frische‘, ‚Gültigkeit‘ und ‚Entwertung‘ (englisch freshness, validation, invalidation).

Freshness
erlaubt es, eine bereits erhaltene Antwort wiederzuverwenden, ohne beim Ursprungsserver erneut nachfragen zu müssen und kann sowohl durch den Server wie auch den Client gesteuert werden. Zum Beispiel gibt der Expires-Header ein Datum an, zu dem das übertragene Dokument stale („abgestanden, schal“) wird, und die Angabe Cache-Control: max-age sagt dem Cache, wie viele Sekunden lang die Antwort fresh ist.
Validation
kann verwendet werden, um zu überprüfen, ob eine zwischengespeicherte Antwort noch aktuell ist, nachdem sie schon stale geworden ist. Wenn die Antwort zum Beispiel einen Last-Modified-Header („zuletzt verändert um …“) besitzt, kann ein Cache eine konditionale Anfrage mit dem If-Modified-Since-Header („falls verändert seit …“) absenden um festzustellen, ob sie sich inzwischen geändert hat. Falls die Antwort „nein“ ist, muss der Inhalt nicht erneut gesendet werden.
Invalidation
ist normalerweise eine Nebenwirkung einer anderen Anfrage, die den Cache passiert. Wenn zum Beispiel eine URL, für die eine zwischengespeicherte Antwort vorliegt, später mit einer POST-, PUT- oder DELETE-Anfrage (siehe HTTP) angesprochen wird, so wird die zwischengespeicherte Antwort entwertet, da die neue Anfrage sie höchstwahrscheinlich verändert hat.

Seit HTTP 1.1 gibt es die Möglichkeit im Header den HTTP ETag zu übergeben. Er kennzeichnet eine bestimmte Version einer Ressource.

Literatur

  • Chris Shiflett: HTTP developer's handbook. Sams Publishing, Indianapolis IN 2003, ISBN 0-672-32454-7, S. 157 ff.

Weblinks

  • R. Fielding, J. Gettys, J. Mogul, H. Frystyk, L. Masinter, P. Leach, T. Berners-Lee: RFC 2616 – Hypertext Transfer Protocol – HTTP/1.1. Juni 1999 (englisch).
  • Expires Header im Apache2 aktivieren. (Memento vom 27. April 2015 im Internet Archive) phpgangsta.de (deutsch).
  • Expires Header als Teil der Site-Optimierung. (Memento vom 23. September 2013 im Internet Archive) wiggyleaks.de (deutsch).
  • Mit Expires-Header die Performance von Websites verbessern. Teil 1. (Memento vom 8. September 2015 im Internet Archive) webstandard.kulando.de (deutsch).
  • Mit Expires-Header die Performance von Websites verbessern – Der MD5-Hash. Teil 2. (Memento vom 8. September 2015 im Internet Archive) webstandard.kulando.de (deutsch).
  • Mit Expires-Header die Performance von Websites verbessern – Was kommt danach? Teil 3. (Memento vom 8. September 2015 im Internet Archive) webstandard.kulando.de (deutsch).

Einzelnachweise

  1. Protocols Standards. In: web-cache.com. Abgerufen am 24. Juli 2017. 
  2. RFC 2616 Abschnitt 14.6: Age. (englisch).
  3. RFC 2616 Abschnitt 14.9: Cache-Control. (englisch).
  4. RFC 2616 Abschnitt 14.18: Date. (englisch).
  5. RFC 2616 Abschnitt 14.19: ETag. (englisch).
  6. RFC 2616 Abschnitt 14.21: Expires. (englisch).
  7. RFC 2616 Abschnitt 14.24: If-Match. (englisch).
  8. RFC 2616 Abschnitt 14.25: If-Modified-Since. (englisch).
  9. RFC 2616 Abschnitt 14.26: If-None-Match. (englisch).
  10. RFC 2616 Abschnitt 14.27: If-Range. (englisch).
  11. RFC 2616 Abschnitt 14.28: If-Unmodified-Since. (englisch).
  12. RFC 2616 Abschnitt 14.32: Pragma. (englisch).
  13. RFC 2616 Abschnitt 14.44: Vary. (englisch).
  14. RFC 2616 Abschnitt 13: Caching. (englisch).