Loading ...
Sorry, an error occurred while loading the content.
 

Re: [id-ruby] Proyek akhir pekan: IndonesianStemmer

Expand Messages
  • Adinda Praditya
    Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh, lumayan itung2
    Message 1 of 7 , Apr 7 8:37 PM
      Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
      langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
      lumayan itung2 nambah kredit. hehe..

      Dida
      @didaid



      2013/4/4 Adinda Praditya <apraditya@...>

      > Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
      > kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
      > terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
      > r.
      >
      > Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
      > cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
      > ini?
      >
      > Makasih,
      > Dida
      >
      > @didaid
      > On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:
      >
      >> Great!
      >>
      >> beberapa kali butuh yang kayak gini...
      >> tapi sepertinya bikin stemmer bahasa indonesia memang susah
      >>
      >> 1.9.3p0 :007 > "pemasukan".stem
      >> => "*asu*"
      >> # ooh yeah
      >>
      >> 1.9.3p0 :017 > "menangis".stem
      >> => "angis"
      >>
      >> gimana caranya bedain antara:
      >>
      >> pemasukan => masuk
      >> pemanah => panah
      >>
      >> hmm...
      >>
      >>
      >>
      >> 2013/3/31 Adinda Praditya <apraditya@...>
      >>
      >> > **
      >> >
      >> >
      >> > Hi all,
      >> >
      >> > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
      >> > kontribusinya. Langsung ke TKP
      >> > https://github.com/apraditya/indonesian_stemmer
      >> >
      >> > Makasih,
      >> > Dida
      >> >
      >> > [Non-text portions of this message have been removed]
      >> >
      >> >
      >> >
      >>
      >>
      >> [Non-text portions of this message have been removed]
      >>
      >>
      >>
      >> ------------------------------------
      >>
      >> ID-Ruby
      >> Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
      >> varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
      >> dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
      >>
      >> http://rubyurl.com/Q8DD
      >> http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
      >>
      >>
      >>
      >>
      >>


      [Non-text portions of this message have been removed]
    • Steven Haryanto
      ... nyobain bentar. kayaknya masih gagal di kasus2x seperti: - beruang (tapi memang ambigu) - berenang - enang - peremajaan - emaja - mengebom, mengelap,
      Message 2 of 7 , Apr 9 8:24 AM
        On 04/08/2013 10:37 AM, Adinda Praditya wrote:
        >
        >
        > Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
        > langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
        > lumayan itung2 nambah kredit. hehe..

        nyobain bentar.

        kayaknya masih gagal di kasus2x seperti:
        - beruang (tapi memang ambigu)
        - berenang -> enang
        - peremajaan -> emaja
        - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
        - perahu, berita, meteorologi, dll (butuh dictionary)
        - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)

        --
        Reseller lisensi Spanel? http://spanel.info/?p=36
      • Steven Haryanto
        ... btw, lupa ngomong: cool :) kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa? salam, -- Reseller lisensi Spanel? http://spanel.info/?p=36
        Message 3 of 7 , Apr 9 8:28 AM
          On 03/31/2013 09:57 AM, Adinda Praditya wrote:
          > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
          > kontribusinya. Langsung ke TKP
          > https://github.com/apraditya/indonesian_stemmer

          btw, lupa ngomong: cool :)

          kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa?

          salam,
          --
          Reseller lisensi Spanel? http://spanel.info/?p=36
        • Adinda Praditya
          2013/4/9 Steven Haryanto ... Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal ditambahkan ke file txt nya. Huruf2
          Message 4 of 7 , Apr 9 9:08 AM
            2013/4/9 Steven Haryanto <steven@...>

            > **
            >
            > nyobain bentar.
            >
            > kayaknya masih gagal di kasus2x seperti:
            > - beruang (tapi memang ambigu)
            > - berenang -> enang
            > - peremajaan -> emaja
            > - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
            > - perahu, berita, meteorologi, dll (butuh dictionary)
            > - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)
            >

            Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal
            ditambahkan ke file txt nya. Huruf2 lain yang ambigu juga ada kemungkinan
            belum lengkap. Terpaksa jadi agak hard-coded, abis bingung menerapkan
            algoritma yang pas, soalnya memang begitulah bahasa kita (CMIIW). Yang 1
            suku kata dan gabungan 2 kata memang tidak dibahas (bukan cakupan) di paper
            asalnya.

            Belum ada proyek apa-apa, baru kepikiran untuk aplikasi yang
            mengkategorisasi tulisan secara otomatis, trus karena alatnya yang
            diperlukan (yaitu stemmer indonesia) belum ada yang bagus (CMIIW) dan lihat
            ada implementasinya di Lucene, iseng2 aja konversi dari Java ke Ruby, trus
            nanti disempurnakan lagi.

            Makasih udah nyobain & kasih komentar. Monggo yang lainnya.

            Dida


            [Non-text portions of this message have been removed]
          Your message has been successfully submitted and would be delivered to recipients shortly.