DevOps für digitale Medien

DevOps für digitale Medien

Itransition bietet DevOps-Dienstleistungen und IT-Support für einen europäischen Verlag für digitale Medien mit einer kombinierten Print- und Digitalauflage von über 1,5 Millionen.

Inhaltsverzeichnis

Kontext

The Economist ist ein führender Verlag für digitale Medien mit über 1,5 Millionen Print- und Digitalabonnenten weltweit. Das Unternehmen verfügt über Hunderte von digitalen Assets, die sowohl für interne Geschäftsbereiche als auch für externe Leser bestimmt sind. So erstellt der Kunde beispielsweise Microsites zu Themen, die von globalen Wirtschaftsereignissen und Unternehmensanalysen bis hin zu Gesundheitsforschung und gesellschaftlichen Trends reichen.

Um die Geschäftskontinuität und eine bessere Nutzererfahrung zu gewährleisten, arbeitet The Economist mit externen Anbietern zusammen, die sich gemeinsam mit dem internen Team um DevOps und IT-Fragen kümmern. Als mehrere Mitarbeiter das Unternehmen verließen, begann die Suche nach weiteren DevOps-Spezialisten.

Außerdem hatte der Kunde ein Problem mit mehreren Microsites: Bei insgesamt etwa 200 Microsites stürzten einige von ihnen täglich ohne objektiven Grund ab. Es gab keine Veränderungen im Datenverkehr, keine Probleme auf der Serverseite, keine DNS-Fehler oder Kodierungsfehler. Der Kunde benötigte Spezialisten, um das Problem zu erkennen und zu beheben sowie weitere Unterstützung zu leisten.

Da Itransition bereits zuvor mit The Economist zusammengearbeitet und eine gute Arbeitsbeziehung aufgebaut hatte, entschied sich das Unternehmen, uns mit DevOps-Beratung zu beauftragen, um speziell das Problem mit den Microsites zu lösen. Als wir das Problem behoben hatten, beauftragte der Kunde die DevOps-Spezialisten von Itransition mit der Einrichtung und Automatisierung der Umgebung.

Lösung

Wir begannen mit der Erkennung und Behebung des Problems mit Microsites im Rahmen des Pilotprojekts. Die Spezialisten von Itransition fanden heraus, dass das Problem durch eine externe API verursacht wurde, die vom GeoIP-Modul zur Definition der Website-Besucher verwendet wurde, und zwar durch die langsame Leistung der API, die zum Ausfall von Websites führte.

Wir haben das Problem gelöst, indem wir einen neuen Algorithmus für die Definition der Besucher der Microsites eingeführt haben. Der Algorithmus umfasst das Herunterladen einer öffentlich zugänglichen GeoIP-Datenbank, das Speichern dieser Daten auf dem Server und das Durchsuchen der Datenbank durch das GeoIP-Modul, anstatt auf das Funktionieren externer IP-Abfragen zu warten. Dies führte zu einer besseren Leistung und Stabilität. Nach Abschluss dieses Pilotprojekts haben wir die Microsites weiter unterstützt, falls neue Probleme auftreten sollten.

Nachdem das Problem mit den Microsites gelöst war, kümmerten sich die DevOps-Experten von Itransition um die Einrichtung und Wartung der Umgebung sowie um die Automatisierung der Serverbereitstellung.

Die Microsites sind entweder statisch oder auf WordPress/Drupal aufgebaut. Unsere Spezialisten entwickeln und aktualisieren die Skripte/Templates, um diese Sites automatisch oder halb-manuell zu erstellen. Wir haben CloudFormation-Vorlagen erstellt, um die Infrastruktur einzurichten und die Site-Versionen bei Bedarf zu aktualisieren. Bei der Annahme neuer Microsites für die DevOps-Wartung führen wir eine gemeinsame Codeprüfung durch und richten ihr Git in Zusammenarbeit mit dem Team des Kunden ein.

Microsite production environment

Ein Beispiel für ein von Itransition geschriebenes Skript ist das Skript für das "Housekeeping", das Kosteneinsparungen und Ressourcenoptimierung ermöglicht. Bevor wir uns dem Projekt anschlossen, wurden die Umgebungen seit 2015 von verschiedenen Teams verwaltet. Der Kunde stellte fest, dass es ungenutzte Ressourcen auf Amazon-Servern gab, wie Volumes, Snapshots, Dateispeicher und Backups. Wir schrieben ein Skript, das die AWS-Befehlszeilenschnittstelle nutzte, um diese Ressourcen ständig zu überprüfen und die Techniker über die Ressourcen zu informieren, die bereinigt werden können.

Das Skript trägt dazu bei, etwa 5 % des Budgets einzusparen, das monatlich für die Verwaltung der Umgebung ausgegeben wird. Der Kunde verwendet das Skript auch für andere AWS-Konten, und der aggregierte Kosteneinsparungsindex liegt bei bis zu 4.000 US-Dollar pro Monat. Die jährlichen Einsparungen belaufen sich auf bis zu 50.000 $.

Wir führten die Migration der Microsites durch, als der Kunde beschloss, die Sites der Abteilung des Unternehmens, die für die Forschung und Analyse globaler wirtschaftlicher und sozialer Trends zuständig ist, von den übrigen Microsites zu trennen. Wir haben ein Backup des Dateisystems und der Datenbank erstellt und dann 10 Microsites (Staging- und Produktionsumgebungen) auf ein separates AWS-Konto verschoben. Dies ermöglichte die Verwaltung der Finanzen und die Zuweisung zwischen verschiedenen Abteilungen sowie die Transparenz des Budgets.

Nach der erfolgreichen Migration begannen wir mit dem 24/7-Support für diese Sites. Gemäß der Service-Level-Vereinbarung zwischen dem Kunden und Itransition reagieren unsere Spezialisten auf dringende Probleme innerhalb von 1 Stunde, auf Probleme mit hoher Priorität innerhalb von 2 Geschäftsstunden und verbringen 1 bis 2 Geschäftstage mit der Behebung anderer Arten von Problemen.

Verfahren

Die Level-1-Support-Spezialisten von Transition überwachen die Websites der Wirtschaftsforschungsabteilung von The Economist rund um die Uhr und erhalten Benachrichtigungen von Pingdom und Pagerduty. Sie sortieren die eingehenden Anfragen und bieten grundlegende Unterstützung und Fehlerbehebung, wie z. B. das Zurücksetzen von Passwörtern, Break/Fix-Anweisungen, die Weiterleitung von Tickets und die Eskalation an den Level-2- und Level-3-Support.

L1-Spezialisten informieren den Kunden auch über Probleme und untersuchen deren Ursachen auf Wunsch des Kunden. Als das System beispielsweise MySQL während eines Backups oder einer Protokollrotation neu lud, stellte Pingdom eine sehr kurze Nichtverfügbarkeit der Website fest. Das Problem musste nicht eskaliert werden, aber wir haben die Ursache dennoch festgestellt.

Die Spezialisten des L2-Supports bearbeiten grundlegende technische Infrastruktur- und Konfigurationsprobleme für alle Microsites, z. B. Kapazitätsprobleme der Infrastruktur, Serverkonfiguration und Datenbankverwaltung. Sie verwalten AWS-Ressourcen mit AWS CloudFormation und verwenden Amazon CloudWatch für die Überwachung der Infrastruktur, Incapsula für die Erkennung und Verhinderung von Eindringlingen, Pingdom für die Überwachung der Verfügbarkeit von Websites und Pagerduty für die Eskalation von Problemen und den Erhalt von Benachrichtigungen von Pingdom.

Die Support-Techniker von L3 bearbeiten und lösen Probleme, die ein Verständnis des Quellcodes erfordern. Sie führen auch regelmäßige Wartungsarbeiten durch und stellen Sicherheitspatches bereit. Sie verwenden PHP Composer, um die Abhängigkeiten der PHP-Software und der erforderlichen Bibliotheken zu verwalten. L3-Ingenieure arbeiten auch mit Drush, um Drupal-Websites zu kontrollieren und zu verwalten.

 

Ergebnisse

Die DevOps-Experten von Transition halfen The Economist, das Problem der abstürzenden Microsites zu lösen, und bieten weiterhin Support, um im Falle eines Ausfalls nicht mehr als 2 Stunden Ausfallzeit zu haben.

Außerdem spart das von unserem Team im Rahmen der Automatisierung der Umgebungseinrichtung geschriebene Skript bis zu 5 % des monatlichen Budgets, das für das Umgebungsmanagement der Microsites ausgegeben wird. Insgesamt kann der Kunde mit diesem Skript 50.000 Dollar pro Jahr einsparen. Die Beziehung, die wir mit The Economist aufgebaut haben, und das Niveau der erbrachten Dienstleistungen führten dazu, dass der Kunde uns den 24/7-Support für die Microsites seiner Wirtschafts- und Sozialforschungs- und Analyseabteilung anvertraut hat.