Kérdések a pécsi rendszerösszeomlás körül

Ahogy az IT café is beszámolt róla, a múlt héten egy karbantartási folyamat miatt összeomlott a pécsi egyetem informatikai rendszere, és ennek következtében egy viszonylag kritikus időszakban – az előző félév lezárása, illetve a következő félév megszervezésének napjaiban – gyakorlatilag a teljes ügyintézés megbénult (helyi tapasztalataink szerint a most már teljes mértékben az informatikai rendszertől függő ügyintézők ez idő alatt jószerivel semmit nem tudtak dolgozni, kávézással töltötték az időt).

Milyen mértékű adatvesztés történt?

Az egyetem vezetése, az informatikáért felelős szakemberek dicséretes módon folyamatosan informálták a dolgozókat, a hallgatókat és a közvéleményt, hogy problémák akadtak, tájékoztattak arról, hogy addigi adataik szerint mi lehetett a hiba oka, és igyekeztek megoldást találni a kialakult helyzet által felvetett gondokra. Ennek a folyamatnak egyik záró fázisa volt, amikor többszörösen elismerték, hogy a rendszerösszeomlás adatvesztéssel is járt.

Ami azonban még most is kérdés, hogy milyen nagyságrendű és minőségű volt az adatvesztés, illetve, hogy mi volt az oka ennek, mivel a sajtóban többféle értelmezésben olvashatóak hírek erről. Az IT café információi szerint a „minimális adatvesztés” teóriája nem állja meg a helyét, illetve erősen kérdéses, hogy mit tekintünk minimálisnak. Szerettünk volna első kézből értesülni erről, és felhívtuk Csillik Lászlót, a PTE informatikai igazgatóját, aki a sajtó számára eddig is a fő információforrásnak bizonyult, ám ő ma, péntek délután azt mondta, hogy jelen pillanatban nem ér rá, mivel megbeszélése van, térjünk rá vissza hétfőn.

Ezek után természetesen lehetnénk türelmesek is, ám a hétfői nyilatkozat előtt is érdemes összefoglalni az eddig történteket, illetve fontosnak tartjuk rámutatni néhány problematikus részletre.

Nézzük először a tényeket, és az arról szóló híradásokat. A bama.hu tudósításai alapján mi is beszámoltunk a rendszerösszeomlásról, ezek szerint a január 22-ei hétvégén következett be az üzemzavar. Ahogy megírtuk, nem működött a tanulmányi rendszer, a levelezés, a honlapok helyén hibaüzenet jelent meg. De más területeken is nagy gondba kerültek a dolgozók, illetve az egyetem ügyfelei: a Klinikai Központ adminisztrációját sem tudták digitálisan elvégezni. Hogy ne álljon le teljesen az élet, ezért az orvosok visszatértek a papíralapú adatfeldolgozáshoz.

Ahogy a közleményekre alapozva megírtuk, a HP egyik eszközének (HP EVA 8400 központi adattároló rendszer) meghibásodásáról volt szó: „az adattároló rendszerben két héttel ezelőtt végrehajtott tárhelybővítést követően a rendszer belső szinkronizációja nem állt helyre, valamint az elmúlt hétvégi újraindítást követően sem volt tapasztalható javulás. Végül a rendszer a hétfő reggeli órákban váratlanul leállt. A Hewlett-Packard helyszíni és nemzetközi szakemberei által nyújtott – egész éjszaka is tartó – gyártói támogatás eredménytelenségét követően az Egyetem döntése alapján az informatikai rendszerek a rendelkezésre álló mentések felhasználásával kerülnek visszaállításra, még a mai napon.”

Így is nézhetjük, meg úgy is

A fokozatos helyreállítás megtörtént, nagyjából az ígéreteknek megfelelő időpontban, ezek után már „csak” az a kérdés maradt fenn, hogy vajon történt-e adatvesztés, és ha igen, milyen mértékű, illetve a felelősség kérdése. Csillik László a bama.hu-nak nyilatkozva azt mondta, hogy szerencsére minimális mértékű volt az információvesztés. Ennek egyik oka, hogy az összeomlás után az egyik fontos területen, a betegellátásban kénytelenek voltak áttérni a papíralapú adminisztrációra, ezért ezek az adatok utólag felvihetőek a digitális rendszerbe. Ugyanakkor a hallgatói rendszerben is voltak problémák, mivel hétfőtől kedd délutánig nem lehetett használni a rendszert, de ez megint nem jelent adatvesztést, csak kellemetlenséget, mivel később kellett az akkorra tervezett adminisztrációt elvégezni.

Ez eddig rendben is van, ám a szokatlanul nagy mértékű üzemkiesés más területeken is gondokat okozott, főként az egyetemi adminisztráció szenvedte meg a hibát. Erről Csillik László a következőket nyilatkozta január 31-én: a „humán erőforrás gazdálkodását támogató rendszerben is sikerült reprodukálni a szerverleállás előtti állapotot, mostanra a levelezőrendszerben sincs nagyobb probléma, valamint a PTE honlapja is látogatható.”

A pécsi egyetem informatikai vezetése láthatóan mindent megtett a probléma megoldására, viszont a munkatársaknak küldött értesítések alapján minimum kétségbe vonható, hogy az adatvesztés „minimális” volt-e (most arról a szélsőséges esetről ne is beszéljünk, hogy akár egyetlen e-mail eltűnése, meg nem érkezése is okozhat adott esetben súlyos károkat).

Fő gond: a centralizált levelezés mentésének hiánya

Értesüléseink szerint a legnagyobb problémát a levelezőrendszer leállása okozta, mivel az adott időszakban küldött levelek nem érkeztek meg, illetve ezekről nem készültek mentések sem. Hogy ilyesmi előfordulhatott, az köszönhető egyrészt egy olyan központi rendszer kialakításának (a PTE 2010-ben állt át a korábbi, többféle rendszerről az Exchange-re), mely önmagában sem jónak, sem rossznak nem minősíthető, viszont a centralizált működtetés következtében erős függés jött létre, ami azzal járt – mint a jelen esetben –, hogy ha az informatikai rendszerbe nincs beépítve egy megbízható és széles körű backup, vagyis biztonsági mentés, akkor egy, a mostanihoz hasonló rendszerösszeomlás komoly adatvesztéssel járhat. Ennek bizonyítékaként idéznénk néhány körlevelet, melyet a PTE dolgozói kaptak meg a helyreállítás után:

[keltezés: január 25. 12:41] „Tisztelt Felhasználók!
A PTE központi adattároló rendszerének hibájából eredően, a központi Exchange levelezőrendszert a rendelkezésünkre álló mentések felhasználásával 2012. január 21-i állapotában tudtuk visszaállítani.
A 2012. január 21-i mentés és a január 23-i váratlan leállás között beérkezett/elküldött üzenetek csak azokban az Outlook kliensekben lesznek hozzáférhetőek, amelyek a fenti időpontok között szinkronizáltak az Exchange szerverrel (az Outlook el lett indítva és csatlakozott a kiszolgálóhoz). Ezek az üzenetek az OWA felületen nem lesznek elérhetőek!
Jelenleg a levelezési szolgáltatás csak az Exchange rendszeren belül működik, a 2012. január 23-án reggel bekövetkezett leállás óta beérkezett leveleket a kiszolgáló tárolja, és kézbesíteni fogja a postafiókokba!”

Emellett még egy érdekes körlevél, mely a teljes januári működést kérdőjelezi meg:

„Tisztelt Hallgató!
Ezúton szeretném tájékoztatni, hogy a Pécsi Tudományegyetem szerverének leállása miatt az infokti@pte.hu e-mail címre küldött levelek egy része sajnálatos módon elveszett.
Tisztelettel kérem, hogy ha Ön 2012. január 1 és 2012. január 27 között az említett e-mail címre levelet küldött, és az abban megfogalmazottak még nem rendeződtek illetve még nem kapott választ, akkor szíveskedjen levelét ismételten részünkre elküldeni.
Segítő együttműködését előre is köszönöm, az okozott kellemetlenségekért pedig szíves elnézését kérem!”

Egy tájékoztató a CooSpace tanulmányi rendszer hibájáról:

„Tisztelt Hallgatók!
2012.01.25 reggel 9 órától újra elérhető a CooSpace rendszer. A PTE Informatikai Igazgatóságának tájékoztatása alapján a január 18. hajnali állapot visszaállítása volt lehetséges. Ennek következtében azok az online tesztek és beadandó feladatok, amelyeknek a határideje január 18 és a ma reggeli indulás közötti időszakra esett elvesztek.”

HIba hiba hátán

Habár úgy véljük, hogy az egyetem informatikai igazgatója igyekezett – már amennyire ezt az egyetempolitikai szempontok megengedték – korrekt lenni a tájékoztatóiban, végül is, a fenti dokumentumok és a nyilatkozatok alapján kijelenthető, hogy nem volt megfelelően egyenes és tiszta a helyzetértékelés.

Még egy nagyon fontos részletet kell felidézni, talán a leglényegesebbet, ami arra utal, hogy – talán pénzügyi okokból – komoly hiányosságok voltak, vannak a backup-rendszerben. Csillik László ugyanis elmondta, hogy az egyetemnek alapvetően korszerű infrastruktúrája van, a mostanihoz hasonló hiba ritkán fordul elő, de a PTE-nek szűkös forrásai okán eddig nem volt pénze biztonsági szerver- és tárolórendszer vásárlására és üzembe helyezésére. E 120-140 millió forintos beruházásra a természettudományi kutatóközpont építésével párhuzamosan, fél éven belül sor kerül, módot adva a teljes körű mentésre, az ilyen nagyságú intézmények működésére jellemző hatalmas adatállomány védelmére. Az informatikai igazgató kitért rá, hogy a szerverhiba okai mellett vizsgálják munkatársak felelősségét is. Felmerült ugyanis, hogy a kisebb rendszereket érintően többen elmulasztották bizonyos dokumentumok kötelező mentésének gyakorlatát.

Ha összefoglaljuk, hogy mit is láthattunk (ezek feltételezések, a hivatalos vizsgálat eredményének kihirdetéséig valóban csak feltételezések):

  • előfordulhatott, hogy a tárolórendszer szállítója nem megfelelő rendszert adott át az egyetemnek
  • előfordulhatott, hogy az egyetemi implementációt nem kellő körültekintéssel végezték
  • előfordulhatott, hogy a kiterjedt, az egyetem teljes ügyintézését végző rendszerben nem a kellő körültekintéssel alakították ki a biztonsági mentések hálózatát – egyrészt a szükséges technológia hiányában, másrészt munkavégzési hanyagság miatt
  • előfordulhatott, hogy az adatvesztés sokkal súlyosabb, mint ahogy kommunikálták, ugyanis itt nem az elveszett információk mennyisége, hanem a minősége a mérvadó

 

  • Kapcsolódó cégek:
  • HP

Előzmények