Loading ...
Sorry, an error occurred while loading the content.

Re: [magyarispell] Hunspell, Magyar Ispell 1.0-RC1

Expand Messages
  • Tímár András
    ... Igazad van, az Orvosi Helyesírási Szótár is a bacilus alakot ajánlja, bár tényleg van olyan orvos, aki mindent latinosan akar írni. :-) Ez egy
    Message 1 of 3 , Jun 29, 2004
    • 0 Attachment
      nemeth@... írta:

      > Sziasztok!
      >
      > Legfontosabb változások pár szóban: Tímár András küldött egy
      > besorolt, ellenőrzött orvosi-laborkémiai szakszókincset, mintegy
      > 700 szóval. (A bacillust átjavítottam Bacillusra, nem tudom,
      > hogy köznévként is ragaszkodnak-e az orvosok a második l-hez.)

      Igazad van, az Orvosi Helyesírási Szótár is a "bacilus" alakot ajánlja,
      bár tényleg van olyan orvos, aki mindent latinosan akar írni. :-) Ez egy
      figyelmetlenségi hiba volt.

      Még fogok küldeni javítást, mert észrevettem 1-2 rossz besorolást és más
      hibákat. Hogy célszerűbb? Folt az RC1-hez, vagy az egészet kéred?

      Üdv,
      András
      --
      Tímár András - kurátor - FSF.hu Alapítvány - http://www.fsf.hu/
      GPG-kulcs: http://pgp.mit.edu:11371/pks/lookup?op=get&search=0xCED08083
    • eleonora46@gmx.net
      Kedves Laci, A ma kikuldott, de mar eleg regi tesztjeimet figyelembe vetted ennel, vagy azokat kesobb dolgozod fel? Az igeket latom kijavitottad, de ezek a
      Message 2 of 3 , Jun 29, 2004
      • 0 Attachment
        Kedves Laci,

        A ma kikuldott, de mar eleg regi tesztjeimet figyelembe vetted
        ennel, vagy azokat kesobb dolgozod fel? Az igeket latom
        kijavitottad, de ezek a kisebbik resz.

        Engem kulonosen erdekelne az 1000-nel tobb hianyzo
        fonevi/melleknevi alak a listan.
        Szokeszlet osszehasonlitast ugyanis csak ennek
        feldolgozasa es helyesbitese, de legalabbis tisztazasa
        utan van ertelme vegezni.

        Üdvözöl: Eleonora

        > Sziasztok!
        >
        > Legfontosabb változások pár szóban: Tímár András küldött egy
        > besorolt, ellenõrzött orvosi-laborkémiai szakszókincset, mintegy
        > 700 szóval. (A bacillust átjavítottam Bacillusra, nem tudom,
        > hogy köznévként is ragaszkodnak-e az orvosok a második l-hez.)
        > Goldman Eleonóra 6000 szavas családnévgyûjteményt küldött, ami
        > lényeges javulást eredményezett a tulajdonnevek felismerésében.
        > Eleonóra hívta fel a figyelmet több hibára is, amelyek közül
        > az egyikrõl kiderült, hogy súlyosabb is, mint aminek látszik
        > (nemcsak az improduktív ragozású fõnevek egy részéhez,
        > hanem minden mássalhangzóra végzõdõ mély hangrendû toldalékkal
        > fõnevekhez -vel és -hez toldalék járulhatott). A verziószámról:
        > a Godo2 modul ragozatlan.2 állományában szereplõ, mintegy 1500
        > szó feldolgozásával az utolsó nagyobb hiányosságot sikerült
        > megszüntetni a szótárban. A javulás itt is számottevõ. (A 4 millió
        > szavas tesztszótárból újabb 30000 szó kerül helyesen felismerésre,
        > részben a családnevek, részben ennek a szókincsnek köszönhetõen.)
        >
        > A morfológiai kódolás le lett ellenõrizve, és javítva sok szempont
        > alapján (több helyen hibás kódok szerepeltek, illetve volt, ahol
        > egy kétértelmûséget kellett megszüntetni). Pontosítva lett
        > a tárgyas és tárgyatlan igeragozás elemzése is, mivel itt a
        > lehetséges kétféle elemzés közül csak az egyiket tüntette fel
        > több helyen az elemzõ.
        >
        > A Hunspell új változata a morfológiai elemzést az írásjelekre,
        > rövidítésekre, számokra, kötõjeles összetett szavakra és a -e
        > határozószót tartalmazó szavakra is kiterjeszti, illetve javít
        > egy összettszó-kezelésben jelentkezõ hibát. A -m kapcsolóval
        > (ha a Hunspell programot a HUNMORPH opcióval fordítjuk) a
        > Hunspell programban is elérhetõ a morfológiai elemzés. (Kedves
        > Egmont! Így akár mehetne is az UHU-Linuxba!)
        >
        > A Hunspell csomag most a morfológiai kódokat is tartalmazó szótárral
        > tölthetõ le. Így jobban szem elõtt van ez az új és nagyszerû lehetõség,
        > mármint a morfológiai elemzés.
        >
        > Címek:
        >
        > http://magyarispell.sourceforge.net/hunspell-1.0-RC1.tar.gz
        > http://magyarispell.sourceforge.net/magyarispell-1.0-RC1.tar.gz
        >
        > Változások részletes listája:
        >
        > 2004-06-29 Németh László <nemethl@...>:
        > - alanyi és tárgyas igeragozás morfológiai elemzésének javítása
        > (produktív E/1. múlt idõ, ikes ragozás, improduktív: játszottam stb.)
        > - hibás morfológiai kódok javítása
        > - birtokjelhez kapcsolódó birtoktöbbesítõ jel morfológiai elemzésének
        > egyértelmûsítése a sorrend megváltoztatásával: bokoréi != bokroké
        > - Magyar Értelmezõ kéziszótár szerint helyes szavak felvétele
        > (enélkül, ezidáig, satöbbi, emögött, muszlim, kollega)
        > - -nkénti folytatási osztályokkal (házankéntiakat)
        > - -ot tárgyrag mellékneveknél (csúfot)
        > - több tucat új rövidítés és szó (köztük írásjelek) felvétele
        >
        > * szotar/Godo2: 1500 hibás, vagy hiányos besorolás javítása, morf.
        > kóddal ellátása a helyesírási szótár alapján.
        >
        > * hibajelzések javítása:
        > - fonev_morfo* mély hangrendû többesszámú tövekhez, illetve minden
        > mássalhangzóra végzõdõ mély hangrendû tõhöz járuló -hez és -vel
        > törlése. A hibát Goldman Eleonóra (eleonora46@...) jelezte.
        > - -hetnék képzõ hibás toldalékolásának javítása (*üzengethetnékûnk,
        > stb.) A hibát Goldman Eleonóra (eleonora46@...) jelezte.
        >
        > 2004-06-18 Goldman Eleonóra <eleonora46@...>:
        > * _magyar_szemelynevek:
        > - 6000 magyar személynév
        >
        > 2004-06-09 Tímár András <timar@...>:
        > * _orvosi:
        > - Orvosi (nagyrészt laborkémiai, kis részben egyéb orvosi) szakszókincs
        > besorolva, ellenõrizve, kb. 700 szó
        >
        >
        > 2004-06-29: Németh László <nemethl@...>
        > * affixmgr.cxx:
        > - csak utolsó tagként megengedett szavak (compound3) toldalék
        > nélküli elõfordulásának engedélyezése (pl. macskapár)
        > - többszörösen összetett szavak toldalékolt alakjainak morfológiai
        > elemzése
        > * myspell.cxx:
        > - rövidítések, számok, kötõjeles összetett szavak és a
        > -e határozószót tartalmazó szavak morfológiai elemzése
        > * suggestmgr.cxx: suggest_morph_for_spelling_error() optimalizálása
        > (csak a felhasznált egy javaslatot keresi meg, többet nem).
        > * csutil.cxx: kimenetben szereplõ üres sorok törlése
        >
        > Üdvözlettel:
        >
        > Laci
        >

        --
        +++ Jetzt WLAN-Router für alle DSL-Einsteiger und Wechsler +++
        GMX DSL-Powertarife zudem 3 Monate gratis* http://www.gmx.net/dsl
      Your message has been successfully submitted and would be delivered to recipients shortly.