BNC´S tot?

Hier bekommt Ihr Antworten auf Eure Fragen zum Bouncer-Hosting von Shellfire

Moderatoren: Florian, Matze, Max, Lui

obi
Beiträge: 7
Registriert: 30 Dez 2009 19:22

BNC´S tot?

Beitragvon obi » 30 Dez 2009 19:26

Hallo,

wie es ausschaut sind wohl fast alle BNC´s seit Stunden tot.
Wäre ja schön wenn man mal was drüber erfahren würde.

Man könnte ja seinen zahlenden Kunden mal eine Email rausschicken und Ihnen sagen was los ist oder zumindest auf support Anfragen reagieren.
Oder vielleicht eine kurze Info auf der Seite.

Naja vielleicht kann hier mal einer was zu schreiben...

Nose
Beiträge: 5
Registriert: 30 Dez 2009 19:28

Beitragvon Nose » 30 Dez 2009 19:30

Hiho

Jo meine beiden BNC's von hier sind auch seit 15:35 tot.
Wäre wirklich nicht zuviel verlangt das den Kunden zu melden oder ne Info zu schalten.

Aspire
Beiträge: 3
Registriert: 30 Dez 2009 19:31

Beitragvon Aspire » 30 Dez 2009 19:35

Kann mich meinen Vorredner nur anschließen, finde es eine ziemliche sauerei..... Alle meine BNC`s sind auch down!!!!!!!!!!!!!!!!!! :? :( ... Hoffe das Problem is bald gelöst....

Max
Site Admin
Beiträge: 476
Registriert: 29 Jun 2003 20:52
Wohnort: Shellfire HQ
Kontaktdaten:

Beitragvon Max » 30 Dez 2009 19:46

Hallo,

derzeit ist Server8, auf dem die Bouncer und Eggdrops laufen, ausgefallen. Unsere Techniker forschen momentan noch nach der Ursache. Wir setzen alles daran, den Service sobald wie möglich wieder zum Laufen zu bringen. Bitte entschuldigen Sie die entstandenen Unannehmlichkeiten.
Max Behr
ShellFire Gattung & Behr GbR

Lavey
Beiträge: 9
Registriert: 30 Dez 2009 21:39

Beitragvon Lavey » 30 Dez 2009 21:59

Hallo zusammen,

in der Vergangenheit hatte ich öfter das Phänomen, dass mein BNC einfach offline gegangen ist. Das ist besonders ärgerlich, wenn man aus mehreren invite-only channels fliegt und später dafür sorgen muss, seinen Status überall wieder herstellen zu lassen. In letzter Zeit hatte ich den Eindruck, dass Server 8 stabiler gelaufen ist. Das war auf jeden Fall schon mal prima.

Als ich eben auf meinen BNC zugreifen wollte, war das nicht möglich. Da es keine News oder eMail-Benachrichtigung gab, habe ich erst mal alles mögliche ausprobiert, bis ich hier im Forum diesen Thread gesehen habe. Es kann ja immer mal technische Probleme geben, und an den BNC Kunden verdient Ihr Euch sicher auch keine goldene Nase, aber es sollte doch wirklich kein Problem sein, an die betroffenen Kunden eine eMail zu schicken und eine gut sichtbare Aktualisierung auf die Website zu stellen, damit man wenigstens weiß, dass es ein technisches Problem gibt, dass daran gearbeitet wird und wann man in etwa damit rechnen kann, dass es wieder funktioniert, damit man sich nicht erst mal eine halbe Stunde bemüht, den Fehler zu suchen. Die Rechnung per Mail kommt ja auch immer pünktlich :wink:

Ich hoffe, Ihr bekommt das schnell wieder hin. Wie ist denn da der aktuelle Stand ? Wisst Ihr schon, was los ist und wann es ungefähr wieder in Ordnung ist ?

Danke und viele Grüße,

Lavey

Max
Site Admin
Beiträge: 476
Registriert: 29 Jun 2003 20:52
Wohnort: Shellfire HQ
Kontaktdaten:

Beitragvon Max » 30 Dez 2009 22:44

Hallo,

inzwischen ist die Ursache gefunden: Die Festplatte von Server8, auf dem zur Zeit sämtliche Bouncer und Eggdrops laufen, ist leider defekt. Ich muss euch recht geben, leider haben wir bei diesem Ausfall nicht sofort adäquat reagiert. Als Ursache kann ich hier nur eine Verkettung von ungünstigen Gegebenheiten anführen:

- Aufgrund der Feiertagssaison sind ist sowohl unser eigenes als auch das Hoster-Supporteam derzeit nicht voll besetzt
- Die regulären Serverarbeiten bzw. die Installation eines neuen Servers, bei denen wir die Ursache lange vermuteten, hatten nichts mit dem Ausfall zu tun (die Arbeiten fanden zeitgleich mit dem Ausfall statt und das gesamte verbleibende Team war daran beteiligt)
- Aufgrund elementarer Eigenheiten der OS-Software auf Server8 ist ein Umzug der Produkte auf unsere anderen Server leider nicht möglich
- Trotz intensiver Recoverymaßnahmen konnte die kaputte Festplatte nicht mehr in Betrieb genommen werden, um wenigstens bis zum Eintreffen der Ersatzfestplatte zu laufen

Auf diese müssen wir nun warten, sie wird uns aber leider erst morgen früh zur Verfügung stehen wird. Durch den Festplattencrash werden voraussichtlich keine Daten verloren gehen, da wir aktuelle Backups aus der vergangen Nacht besitzen.

Wir rechnen damit, dass alle Services morgen im Laufe des frühen Nachmittags wieder verfügbar sein werden. Wir möchten alle betroffenen Kunden bitten, die Unannehmlichkeiten und die schwache Informationspolitik zu entschuldigen. Es wird auf jeden Fall eine Wiedergutmachung geben.

Der aktuelle Status von Server8 kann im Quakenet (irc.quakenet.org) im Channel #shellfire abgerufen werden.


:cry:
Max Behr

ShellFire Gattung & Behr GbR

obi
Beiträge: 7
Registriert: 30 Dez 2009 19:22

Beitragvon obi » 30 Dez 2009 23:05

Na das ist ja mal eine Ansage womit wir Leben können.
Gegen Hardware Ausfällen kann man halt nix machen...

Dann hoffen wir mal das morgen vormittag wieder alles rennt und wenn nicht das wir hier was lesen können ;-)


mfg

Zack
Beiträge: 2
Registriert: 19 Dez 2009 12:41
Wohnort: NRW

Beitragvon Zack » 30 Dez 2009 23:05

Hallo,

das etwas Ausfällt ok. Aber die Rep bis morgen Nachmittag dauern soll
ist heftig.

Und die Channels sind bis dahin für jeden anderen offen.

Kein guter Jahresabschluss :(

Gruss
Zack
Möchte gern einen Eggdrop bedienen können !

Lavey
Beiträge: 9
Registriert: 30 Dez 2009 21:39

Beitragvon Lavey » 31 Dez 2009 01:32

Danke Max, für die Erklärung. Da wissen wir doch wenigstens mal, was los ist und können uns drauf einstellen.

Ich hätte eigentlich damit gerechnet, dass so ein wichtiges Teil wie eine Serverfestplatte redundant ausgelegt ist, wie z.B. in einem Raid-System. Dann würde bei einem Crash innerhalb von milisekunden die zweite Platte den Betrieb übernehmen, und man könnte in aller Ruhe die kaputte Platte austauschen, ohne dass es zu Unterbrechungen kommt.

Zumindest sollte doch immer eine Ersatzplatte im RZ vorhanden sein ? :wink:

Wenn die neue Platte bald vielleicht mal ein Problem hat, oder irgend ein anderes Teil - was immer mal passieren kann - dann haben wir das Schlamassel irgendwann wieder. Und für Euch ist's doch auch mies, dass das ganze Team dann vielleicht an Feiertagen arbeiten und schauen muss, wie man schnell Ersatzteile ranschaffen kann und alle User Euch Mails schicken

:shock:

Liebe Grüße...

Zack
Beiträge: 2
Registriert: 19 Dez 2009 12:41
Wohnort: NRW

Beitragvon Zack » 31 Dez 2009 13:31

Hallo,

und weitere 14 Std. sind ins Land gegangen ohne Besserung.

Startseite der HP mit News.......lol.......immer noch kein Hinweis für andere Kunden was Los ist.

Ein Raid System hätte sich für uns "Kunden" schon gelohnt.

In diesem Sinne.....Gruss

Zack
Möchte gern einen Eggdrop bedienen können !

Raddy
Beiträge: 1
Registriert: 31 Dez 2009 15:19

Beitragvon Raddy » 31 Dez 2009 15:25

Also ich habe mich nach den letzten Ausfällen mit dem Gedanken getragen, den Anbieter zu wechseln.
Bin dann aber doch geblieben. Einen weiteren Bouncer habe ich bereits parallel bei einem anderen Anbieter und dort gab es im gleichen Zeitraum keine vergleichbaren Ausfälle.
Auch kam es fast nie vor, dass die Bouncer über Nacht mal die Verbindung zu den Chans verloren haben.
Wie oft mußte ich hier schon neu joinen.

Und nun höre ich, dass auf kommerzieller Basis ein System "Live" im Betrieb ist - OHNE RAID ????
Da bleibt mir beinahe die Spucke weg. Im Bekanntenkreis stapeln sich bereits RAID-Systeme und hier verläßt man sich auf eine Platte und regelmäßige Backups ?

Nunja... Mal abwarten wie lange es noch dauert.

chriiss
Beiträge: 10
Registriert: 05 Aug 2009 22:36

Beitragvon chriiss » 31 Dez 2009 16:28

wie ist denn der stand der dinge zu diesem problem???

Lavey
Beiträge: 9
Registriert: 30 Dez 2009 21:39

Beitragvon Lavey » 31 Dez 2009 16:46

@Raddy

Dann bin ich ja wenigstens nicht der einzige ;) In der Vergangenheit kam's echt häufig vor, dass ich nach 'ner Woche mal wieder im IRC vorbeischauen wollte und mein BNC in keinem Channel mehr war. Zum Glück waren das meistens Channels, in denen ich mich von einem Kumpel oder einem bot wieder oppen lassen konnte. Die anderen Eggdrops dort sind komischerweise im ganzen letzten Jahr nicht einmal offline gewesen :roll:

Aber wie schon oben geschrieben, hat sich die Stabilität meinem Gefühl nach schon stark verbessert. Die letzten 3 Monate war mein BNC jedenfalls immer online. Deshalb bin ich dann auch bei Shellfire geblieben, in der Hoffnung, dass das jetzt auch so bleibt :wink:

In meinem Mini-Heimnetzwerk habe ich auch überall Raid-Systeme. Meine Daten sind mir einfach zu kostbar, und ich könnte mir nicht vorstellen, nach einem Headcrash erst mal ohne PC dazusitzen bis ich mir im Elektronikmarkt ne neue Platte gekauft habe :P

Ich mag Shellfire wirklich nicht schlecht machen. Der Support ist ja immer freundlich und bemüht. Vielleicht ist das Problem hier ja auch vielschichtig und wir kennen nicht alle Einzelheiten. Wer weiß, was mit dem Server alles passiert ist.

Allerdings kenne ich tatsächlich kein Firmennetz, dessen Server im RZ ohne Raid laufen. Meistens sind sogar die kompletten Server redundant. Wenn ein Server kaputt geht, übernimmt sofort ein anderer dessen Job und Datenverkehr, ohne dass die User etwas davon mitkriegen.

Wenn hier wirklich eine einzelne kaputte Festplatte einen kompletten Systemausfall über bisher immerhin einen kompletten Tag verursachen konnte, dann sollte das Sicherheitskonzept echt nochmal überarbeitet werden :wink:

Ich wünsche Shellfire und allen Leidensgenossen auf jeden Fall trotzdem einen guten Rutsch ins Neue Jahr ! :D

Haut rein Jungs, auf dass Server 8 bald wieder rennt :wink:

Max
Site Admin
Beiträge: 476
Registriert: 29 Jun 2003 20:52
Wohnort: Shellfire HQ
Kontaktdaten:

Beitragvon Max » 31 Dez 2009 21:08

Hallo,

die Situation sieht derzeit so aus, dass die defekte Festplatte heute um die Mittagszeit herum ausgetauscht wurde. Nachdem wir das OS neu installiert und konfiguriert hatten, begannen wir mit dem Aufspielen der Backups, Konfigurationen und starten der Prozesse, was prinzipiell auch bis zu ca. 50% funktionierte, dann allerdings kam es plötzlich erneut zu schweren i/o Errors und die Festplatte war abermals nicht mehr erreichbar. Diesen Hardwareproblemen stehen wir momentan leider machtlos gegenüber und so müssen wir erneut um Geduld bis Morgen bitten, wo wir dann einen komplett neuen Server für die Bouncer und Eggdrops in Betrieb nehmen werden.

Zum Thema Raid kann ich nur sagen, dass zu der Zeit, als wir den betroffenen Server ans Netz genommen haben, Raids in solchen Anwendungen noch absolut unüblich und unbezahlbar waren. Bislang haben wir in unserer mehr als 6-jährigen Geschichte bereits mehrere Festplattenausfälle innerhalb sehr kurzer Zeit meistern können, dieses Mal kommen wie bereits erwähnt sehr viele unglückliche Faktoren gleichzeitig zum Tragen, womit ich allerdings nicht bestreiten möchte, dass wir die volle Verantwortung für die Downtime tragen.

Für die Zukunft werden wir aus dem was geschehen ist lernen und unsere Strategie dementsprechend verbessern (u.a. auch durch den Einsatz von Hardwareraids und eine direkte Informationsweiterleitung direkt ins Kundencenter).

Im Namen des Shellfire-Teams, dem ich an dieser Stelle für den Kriseneinsatz danken möchte, wünsche ich dennoch allen Kunden, besonders denen, die vom Ausfall betroffen sind, einen guten Rutsch ins neue Jahr!
Max Behr

ShellFire Gattung & Behr GbR

FeuerTeufel
Beiträge: 3
Registriert: 01 Jan 2010 14:42

Beitragvon FeuerTeufel » 01 Jan 2010 14:43

Kann man schon sagen wann der Server wieder steht??


Zurück zu „Bouncer Support“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast