Loading ...
Sorry, an error occurred while loading the content.

Mozaikszók ellenőrzése

Expand Messages
  • Tímár András
    Sziasztok! Van-e valamilyen terv arra, hogy a hunspell a jövőben kezelje a mozaikszók toldalékot alakjait és a velük alkotott összetételeket? MHSZ
    Message 1 of 2 , May 31, 2004
    • 0 Attachment
      Sziasztok!

      Van-e valamilyen terv arra, hogy a hunspell a jövőben kezelje a
      mozaikszók toldalékot alakjait és a velük alkotott összetételeket? MHSZ
      286-287.

      Munkám során rengeteg ilyen alakkal találkozom, és teljesen reménytelen
      egyenként felvenni őket a szótárba. Például orvosi, gyógyszerészeti
      szövegekben több ezer betűszó fordul elő (egyes anyagok standard
      rövidítései), illetve a számítástechnikai szövegek is tele vannak
      ilyenekkel (IP-cím, SMTP-kiszolgáló).

      Valami általános megoldásra gondoltam, például hogy a program felismeri,
      ha mozaikszóval találkozik (a csupa nagybetűről, vagy akár a vegyes kis-
      és nagybetűkről (pl. bHCG-koncentráció), és ha az utótag helyes, akkor
      elfogadja, a toldalékolást pedig valamilyen kiejtési heurisztika alapján
      megpróbálja ellenőrizni.

      Ezt az általános mozaikszó-kezelést egy kapcsoló aktiválná, különben nem
      lehetne észrevenni, ha egy, a szótárban szereplő betűszót rosszul írunk
      le. Pl. a szövegszerkesztőmben az automatikus javítás mindig kijavítja a
      HBsAg-t HbsAg-re, és az nem jó. Az ilyeneket észre kell venni továbbra is.

      Üdv,
      András
      --
      Tímár András - kurátor - FSF.hu Alapítvány - http://www.fsf.hu/
      GPG-kulcs: http://pgp.mit.edu:11371/pks/lookup?op=get&search=0xCED08083
    • nemeth@mokk.bme.hu
      ... Szia András! Terv és működő dolgok is vannak. Például a szótár szabadon bővíthető forráskód szinten. Az OOo esetében a hu_HU.dic kézzel
      Message 2 of 2 , Jun 1, 2004
      • 0 Attachment
        Idézés Tímár András <timar@...>:

        > Sziasztok!
        >
        > Van-e valamilyen terv arra, hogy a hunspell a jövőben kezelje a
        > mozaikszók toldalékot alakjait és a velük alkotott összetételeket? MHSZ
        > 286-287.

        Szia András!

        Terv és működő dolgok is vannak. Például a szótár szabadon
        bővíthető forráskód szinten. Az OOo esetében a hu_HU.dic kézzel
        való bővítése (és ezzel párhuzamosan az első sorban lévő szótóri
        szavak számának növelése) minden felhasználó számára lehetővé teszi
        a saját mozaikszavainak felvételét, amelyet a program ragozni
        is képes, ha a megfelelő kapcsolókat megadtuk. A Hunspell parancssori
        program valamivel felhasználóbarátabb: egy új szó felvételénél
        megadható egy mintaszó. (Mondjuk mozaikszavaknál a -val/-vá esetragok
        külön vannak felvéve, így ezeket az alakokat külön kell felvenni.)

        Most, hogy ezeket leírtam, meg is van a terv: :)
        a DictOOo mintájára simán elképzelhető egy WordOOo, ami
        a jelenleginél jóval rugalmasabb (tehát ragozható, mozaikszavakra
        jobban figyelő stb.) szófelvételt tesz lehetővé. Még
        a hu_HU.dic-be sem kell belenyúlnia, mert lehetséges külön
        szótár egyidejű kezelése is (egy hu_HU_custom.dic pl.).
        Ebbe kerülnének a felhasználó szavai, a megfelelő ragozási
        mintákkal megadva, amit a WordOOo segít kitalálni.
        A felhasználó megadja az új szót, a mintaszót, amihez
        hasonlóan ragozni szeretné az új szót, ellenőrzi a WordOOo
        által felkínált toldalékolt alakokat, és az OK gombra kattint.
        Ha kiválasztja a mozaikszó (vagy idegen kiejtésű) jelölőgombot
        akkor a szó kiejtett utolsó hangját kell ,hogy megadja, (bár
        még ez is elképzelhető mintával), és a program meghatározza
        a megfelelő ragozási osztályt (kapcsolókat) az mozaikszó
        számára.

        Szóval terv már van. (volt eddig is, de szorosabb (a MySpell/Hunspell
        forrásában elhelyezett) komponenssel
        képzeltem el).

        Üdvözlettel:

        Laci





        >
        > Munkám során rengeteg ilyen alakkal találkozom, és teljesen reménytelen
        > egyenként felvenni őket a szótárba. Például orvosi, gyógyszerészeti
        > szövegekben több ezer betűszó fordul elő (egyes anyagok standard
        > rövidítései), illetve a számítástechnikai szövegek is tele vannak
        > ilyenekkel (IP-cím, SMTP-kiszolgáló).
        >
        > Valami általános megoldásra gondoltam, például hogy a program felismeri,
        > ha mozaikszóval találkozik (a csupa nagybetűről, vagy akár a vegyes kis-
        > és nagybetűkről (pl. bHCG-koncentráció), és ha az utótag helyes, akkor
        > elfogadja, a toldalékolást pedig valamilyen kiejtési heurisztika alapján
        > megpróbálja ellenőrizni.
        >
        > Ezt az általános mozaikszó-kezelést egy kapcsoló aktiválná, különben nem
        > lehetne észrevenni, ha egy, a szótárban szereplő betűszót rosszul írunk
        > le. Pl. a szövegszerkesztőmben az automatikus javítás mindig kijavítja a
        > HBsAg-t HbsAg-re, és az nem jó. Az ilyeneket észre kell venni továbbra is.
        >
        > Üdv,
        > András
        > --
        > Tímár András - kurátor - FSF.hu Alapítvány - http://www.fsf.hu/
        > GPG-kulcs: http://pgp.mit.edu:11371/pks/lookup?op=get&search=0xCED08083
        >
        >
        >
        > Leiratkozás: magyarispell-unsubscribe@yahoogroups.com-re küldött üres
        > levéllel.
        > Yahoo! Groups Links
        >
        >
        >
        >
        >
        >




        ----------------------------------------------------------------
        This message was sent using IMP, the Internet Messaging Program.
      Your message has been successfully submitted and would be delivered to recipients shortly.