Hunspell: a magyar varázslat

Biológia és helyesírás

A Microsoft elterjedt irodai csomagjának szövegszerkesztője a helytelen „mennyasszony” alakot nem tartja hibásnak, a helyesen írt „pozicionál” szót viszont aláhúzza – ezeket a bakikat a nyílt forrású Firefox vagy az OpenOffice.org Writer helyesírás-ellenőrzője nem követi el. E két szó persze csak kiragadott példa, de tény: nemcsak egy teszt, hanem a mindennapi tapasztalat is azt mutatja, hogy az utóbbiak érdemelnek jobb osztályzatot helyesírásból.

Pedig papírforma szerint azért nem ezt várnánk. Hiszen a többek között az említett nyílt forrású programokban is használt, tényleg okos nyelvi modulokat mégiscsak egy autodidakta számítógépes nyelvésznek köszönhetjük. Németh Lászlónak, aki 1997-ben biológusként diplomázott, majd kezdett PhD-tanulmányokba Szegeden, ám tanult szakmáját szögre akasztotta, és már több mint tíz éve (szabad)ideje egyre nagyobb részét a magyar mellett sok tucatnyi nyelvet kiszolgáló Hunspell helyesírás-ellenőrző és más, abból kinövő projektek fejlesztésével tölti. Open source sajátosság, hogy a munkáját sokan segítik, mégis meghatározó szerepe van neki abban, hogy ma már nemcsak jól használható helyesírás-ellenőrző, de magyar helyesírási és szinonimaszótár is áll a közösség és az annak szoftvereit használó nagyközönség rendelkezésére, sőt készül a nyílt forrású nyelvhelyesség-ellenőrző modul is, melynek első publikus verziója éppen ma kerül ki az internetre.

Interjú a 34 éves fejlesztővel.

Az OpenOffice.org helyesírási szótára nem ismeri a „trimeszter” szót, és tévesen aláhúzza a helyes „notebooküzletág” alakot. Ha azt szeretném, hogy a következő verziónak ne legyen baja ezekkel, neked kell szólnom?

A nyílt forráskódú, magyar helyesírási szótárat Godó Ferenccel tartjuk karban, amihez rendelkezésre áll az IMEDIA médiafigyelő 5 millió magyar nyelvű cikket tartalmazó adatbázisa. Nagyon örülünk minden észrevételnek, kérésnek, amit akár személyes levélben vagy a magyar szabad szoftveres honosítókat összefogó http://openscope.org/ oldal hibabejelentő lapjain is meg lehet tenni. A trimeszter és a notebooküzletág hibajegye: http://code.google.com/p/openscope/issues/detail?id=182. Köszönöm a hibajelentést, ami a hibajegyben hozzáadott megjegyzés szerint is nemcsak e két szó, hanem egy ismert típushiba megoldásához fog elvezetni.

Miért kezdtél hozzá 1998-ban egy magyar helyesírás-ellenőrző fejlesztéséhez? Volt akkor sejtésed arról, hogy milyen kaliberű munkát veszel a válladra?

Megismerkedtem egy idén 40 éves technológiai vívmány (a Unix programozási környezet) és a valamivel fiatalabb, de nem kevésbé ösztönző GNU mozgalom filozófiájával és eredményeivel. Mikor a kifejlesztése óta felülmúlhatatlan nyílt forráskódú TeX matematikai szedőrendszerhez magyar helyesírás-ellenőrzőre volt szükségem, rájöttem, hogy ezt gyerekjáték a GNU unixos eszközeivel elkészíteni. Ebben nem is tévedtem olyan rettenetesen nagyot, de a szükséges fejlesztési időt alulbecsültem.

Aligha volt egyszerű ehhez a munkához támogatókat szerezni…

Nem is gondoltam rá eleinte, hogy egy szabad programhoz, amit a szabadidőmben fejlesztek, támogatókat keressek. A támogatók önként ajánlkoztak, hol munkájukkal, hol megbízásukkal éltetve a fejlesztést. Így először a magyar szabad szoftveres honosítók, Godó Ferenc az IMEDIA Kft.-től, a TypoTeX Kiadó, a BME MOKK Kutatóközpontja, jelenleg pedig a magyar szabad szoftveres közösség az FSF.hu Alapítványon keresztül a legfőbb támogatója a fejlesztésnek.

Ma hányan vesznek részt aktívan a program és a szótár karbantartásában?

Mintegy tucatnyi ember, aki visszatérő közreműködője a magyar helyesírási szótár fejlesztésének. Érdekes, hogy közülük többen teológus végzettséggel rendelkeznek, de ha a GNU kiáltványban első helyen említett aranyszabályra gondolunk, vagyis arra, hogy a szabad szoftverek fejlesztése etikai választás, talán nem is olyan meglepő ez. A nyelvfüggetlen Hunspell helyesírás-ellenőrző program esetében jóval nagyobb számban érkezik visszajelzés, de az aktív résztvevők száma itt is körülbelül tucatnyi. Mióta a Hunspell hivatalosan is részét képezi több elterjedt programnak és operációs rendszernek, mint az OpenOffice.org, Mozilla Firefox, Red Hat Linux, OpenSolaris, Ubuntu, a fejlesztőktől rendszeresen érkeznek visszajelzések.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények