Loading ...
Sorry, an error occurred while loading the content.

Re: [id-ruby] Proyek akhir pekan: IndonesianStemmer

Expand Messages
  • Adinda Praditya
    Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang terkait. Masih ada
    Message 1 of 7 , Apr 3, 2013
    • 0 Attachment
      Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
      kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
      terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
      r.

      Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
      cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
      ini?

      Makasih,
      Dida

      @didaid
      On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:

      > Great!
      >
      > beberapa kali butuh yang kayak gini...
      > tapi sepertinya bikin stemmer bahasa indonesia memang susah
      >
      > 1.9.3p0 :007 > "pemasukan".stem
      > => "*asu*"
      > # ooh yeah
      >
      > 1.9.3p0 :017 > "menangis".stem
      > => "angis"
      >
      > gimana caranya bedain antara:
      >
      > pemasukan => masuk
      > pemanah => panah
      >
      > hmm...
      >
      >
      >
      > 2013/3/31 Adinda Praditya <apraditya@...>
      >
      > > **
      > >
      > >
      > > Hi all,
      > >
      > > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
      > > kontribusinya. Langsung ke TKP
      > > https://github.com/apraditya/indonesian_stemmer
      > >
      > > Makasih,
      > > Dida
      > >
      > > [Non-text portions of this message have been removed]
      > >
      > >
      > >
      >
      >
      > [Non-text portions of this message have been removed]
      >
      >
      >
      > ------------------------------------
      >
      > ID-Ruby
      > Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
      > varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
      > dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
      >
      > http://rubyurl.com/Q8DD
      > http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
      >
      >
      >
      >
      >


      [Non-text portions of this message have been removed]
    • Adinda Praditya
      Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh, lumayan itung2
      Message 2 of 7 , Apr 7, 2013
      • 0 Attachment
        Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
        langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
        lumayan itung2 nambah kredit. hehe..

        Dida
        @didaid



        2013/4/4 Adinda Praditya <apraditya@...>

        > Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
        > kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
        > terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
        > r.
        >
        > Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
        > cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
        > ini?
        >
        > Makasih,
        > Dida
        >
        > @didaid
        > On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:
        >
        >> Great!
        >>
        >> beberapa kali butuh yang kayak gini...
        >> tapi sepertinya bikin stemmer bahasa indonesia memang susah
        >>
        >> 1.9.3p0 :007 > "pemasukan".stem
        >> => "*asu*"
        >> # ooh yeah
        >>
        >> 1.9.3p0 :017 > "menangis".stem
        >> => "angis"
        >>
        >> gimana caranya bedain antara:
        >>
        >> pemasukan => masuk
        >> pemanah => panah
        >>
        >> hmm...
        >>
        >>
        >>
        >> 2013/3/31 Adinda Praditya <apraditya@...>
        >>
        >> > **
        >> >
        >> >
        >> > Hi all,
        >> >
        >> > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
        >> > kontribusinya. Langsung ke TKP
        >> > https://github.com/apraditya/indonesian_stemmer
        >> >
        >> > Makasih,
        >> > Dida
        >> >
        >> > [Non-text portions of this message have been removed]
        >> >
        >> >
        >> >
        >>
        >>
        >> [Non-text portions of this message have been removed]
        >>
        >>
        >>
        >> ------------------------------------
        >>
        >> ID-Ruby
        >> Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
        >> varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
        >> dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
        >>
        >> http://rubyurl.com/Q8DD
        >> http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
        >>
        >>
        >>
        >>
        >>


        [Non-text portions of this message have been removed]
      • Steven Haryanto
        ... nyobain bentar. kayaknya masih gagal di kasus2x seperti: - beruang (tapi memang ambigu) - berenang - enang - peremajaan - emaja - mengebom, mengelap,
        Message 3 of 7 , Apr 9, 2013
        • 0 Attachment
          On 04/08/2013 10:37 AM, Adinda Praditya wrote:
          >
          >
          > Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
          > langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
          > lumayan itung2 nambah kredit. hehe..

          nyobain bentar.

          kayaknya masih gagal di kasus2x seperti:
          - beruang (tapi memang ambigu)
          - berenang -> enang
          - peremajaan -> emaja
          - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
          - perahu, berita, meteorologi, dll (butuh dictionary)
          - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)

          --
          Reseller lisensi Spanel? http://spanel.info/?p=36
        • Steven Haryanto
          ... btw, lupa ngomong: cool :) kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa? salam, -- Reseller lisensi Spanel? http://spanel.info/?p=36
          Message 4 of 7 , Apr 9, 2013
          • 0 Attachment
            On 03/31/2013 09:57 AM, Adinda Praditya wrote:
            > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
            > kontribusinya. Langsung ke TKP
            > https://github.com/apraditya/indonesian_stemmer

            btw, lupa ngomong: cool :)

            kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa?

            salam,
            --
            Reseller lisensi Spanel? http://spanel.info/?p=36
          • Adinda Praditya
            2013/4/9 Steven Haryanto ... Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal ditambahkan ke file txt nya. Huruf2
            Message 5 of 7 , Apr 9, 2013
            • 0 Attachment
              2013/4/9 Steven Haryanto <steven@...>

              > **
              >
              > nyobain bentar.
              >
              > kayaknya masih gagal di kasus2x seperti:
              > - beruang (tapi memang ambigu)
              > - berenang -> enang
              > - peremajaan -> emaja
              > - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
              > - perahu, berita, meteorologi, dll (butuh dictionary)
              > - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)
              >

              Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal
              ditambahkan ke file txt nya. Huruf2 lain yang ambigu juga ada kemungkinan
              belum lengkap. Terpaksa jadi agak hard-coded, abis bingung menerapkan
              algoritma yang pas, soalnya memang begitulah bahasa kita (CMIIW). Yang 1
              suku kata dan gabungan 2 kata memang tidak dibahas (bukan cakupan) di paper
              asalnya.

              Belum ada proyek apa-apa, baru kepikiran untuk aplikasi yang
              mengkategorisasi tulisan secara otomatis, trus karena alatnya yang
              diperlukan (yaitu stemmer indonesia) belum ada yang bagus (CMIIW) dan lihat
              ada implementasinya di Lucene, iseng2 aja konversi dari Java ke Ruby, trus
              nanti disempurnakan lagi.

              Makasih udah nyobain & kasih komentar. Monggo yang lainnya.

              Dida


              [Non-text portions of this message have been removed]
            Your message has been successfully submitted and would be delivered to recipients shortly.