Loading ...
Sorry, an error occurred while loading the content.

Re: [id-ruby] Proyek akhir pekan: IndonesianStemmer

Expand Messages
  • Nugroho Herucahyono
    Great! beberapa kali butuh yang kayak gini... tapi sepertinya bikin stemmer bahasa indonesia memang susah 1.9.3p0 :007 pemasukan .stem = *asu* # ooh yeah
    Message 1 of 7 , Apr 1, 2013
    • 0 Attachment
      Great!

      beberapa kali butuh yang kayak gini...
      tapi sepertinya bikin stemmer bahasa indonesia memang susah

      1.9.3p0 :007 > "pemasukan".stem
      => "*asu*"
      # ooh yeah

      1.9.3p0 :017 > "menangis".stem
      => "angis"

      gimana caranya bedain antara:

      pemasukan => masuk
      pemanah => panah

      hmm...



      2013/3/31 Adinda Praditya <apraditya@...>

      > **
      >
      >
      > Hi all,
      >
      > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
      > kontribusinya. Langsung ke TKP
      > https://github.com/apraditya/indonesian_stemmer
      >
      > Makasih,
      > Dida
      >
      > [Non-text portions of this message have been removed]
      >
      >
      >


      [Non-text portions of this message have been removed]
    • Adinda Praditya
      Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang terkait. Masih ada
      Message 2 of 7 , Apr 3, 2013
      • 0 Attachment
        Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
        kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
        terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
        r.

        Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
        cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
        ini?

        Makasih,
        Dida

        @didaid
        On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:

        > Great!
        >
        > beberapa kali butuh yang kayak gini...
        > tapi sepertinya bikin stemmer bahasa indonesia memang susah
        >
        > 1.9.3p0 :007 > "pemasukan".stem
        > => "*asu*"
        > # ooh yeah
        >
        > 1.9.3p0 :017 > "menangis".stem
        > => "angis"
        >
        > gimana caranya bedain antara:
        >
        > pemasukan => masuk
        > pemanah => panah
        >
        > hmm...
        >
        >
        >
        > 2013/3/31 Adinda Praditya <apraditya@...>
        >
        > > **
        > >
        > >
        > > Hi all,
        > >
        > > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
        > > kontribusinya. Langsung ke TKP
        > > https://github.com/apraditya/indonesian_stemmer
        > >
        > > Makasih,
        > > Dida
        > >
        > > [Non-text portions of this message have been removed]
        > >
        > >
        > >
        >
        >
        > [Non-text portions of this message have been removed]
        >
        >
        >
        > ------------------------------------
        >
        > ID-Ruby
        > Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
        > varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
        > dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
        >
        > http://rubyurl.com/Q8DD
        > http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
        >
        >
        >
        >
        >


        [Non-text portions of this message have been removed]
      • Adinda Praditya
        Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh, lumayan itung2
        Message 3 of 7 , Apr 7, 2013
        • 0 Attachment
          Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
          langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
          lumayan itung2 nambah kredit. hehe..

          Dida
          @didaid



          2013/4/4 Adinda Praditya <apraditya@...>

          > Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
          > kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
          > terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
          > r.
          >
          > Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
          > cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
          > ini?
          >
          > Makasih,
          > Dida
          >
          > @didaid
          > On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:
          >
          >> Great!
          >>
          >> beberapa kali butuh yang kayak gini...
          >> tapi sepertinya bikin stemmer bahasa indonesia memang susah
          >>
          >> 1.9.3p0 :007 > "pemasukan".stem
          >> => "*asu*"
          >> # ooh yeah
          >>
          >> 1.9.3p0 :017 > "menangis".stem
          >> => "angis"
          >>
          >> gimana caranya bedain antara:
          >>
          >> pemasukan => masuk
          >> pemanah => panah
          >>
          >> hmm...
          >>
          >>
          >>
          >> 2013/3/31 Adinda Praditya <apraditya@...>
          >>
          >> > **
          >> >
          >> >
          >> > Hi all,
          >> >
          >> > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
          >> > kontribusinya. Langsung ke TKP
          >> > https://github.com/apraditya/indonesian_stemmer
          >> >
          >> > Makasih,
          >> > Dida
          >> >
          >> > [Non-text portions of this message have been removed]
          >> >
          >> >
          >> >
          >>
          >>
          >> [Non-text portions of this message have been removed]
          >>
          >>
          >>
          >> ------------------------------------
          >>
          >> ID-Ruby
          >> Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
          >> varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
          >> dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
          >>
          >> http://rubyurl.com/Q8DD
          >> http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
          >>
          >>
          >>
          >>
          >>


          [Non-text portions of this message have been removed]
        • Steven Haryanto
          ... nyobain bentar. kayaknya masih gagal di kasus2x seperti: - beruang (tapi memang ambigu) - berenang - enang - peremajaan - emaja - mengebom, mengelap,
          Message 4 of 7 , Apr 9, 2013
          • 0 Attachment
            On 04/08/2013 10:37 AM, Adinda Praditya wrote:
            >
            >
            > Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
            > langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
            > lumayan itung2 nambah kredit. hehe..

            nyobain bentar.

            kayaknya masih gagal di kasus2x seperti:
            - beruang (tapi memang ambigu)
            - berenang -> enang
            - peremajaan -> emaja
            - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
            - perahu, berita, meteorologi, dll (butuh dictionary)
            - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)

            --
            Reseller lisensi Spanel? http://spanel.info/?p=36
          • Steven Haryanto
            ... btw, lupa ngomong: cool :) kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa? salam, -- Reseller lisensi Spanel? http://spanel.info/?p=36
            Message 5 of 7 , Apr 9, 2013
            • 0 Attachment
              On 03/31/2013 09:57 AM, Adinda Praditya wrote:
              > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
              > kontribusinya. Langsung ke TKP
              > https://github.com/apraditya/indonesian_stemmer

              btw, lupa ngomong: cool :)

              kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa?

              salam,
              --
              Reseller lisensi Spanel? http://spanel.info/?p=36
            • Adinda Praditya
              2013/4/9 Steven Haryanto ... Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal ditambahkan ke file txt nya. Huruf2
              Message 6 of 7 , Apr 9, 2013
              • 0 Attachment
                2013/4/9 Steven Haryanto <steven@...>

                > **
                >
                > nyobain bentar.
                >
                > kayaknya masih gagal di kasus2x seperti:
                > - beruang (tapi memang ambigu)
                > - berenang -> enang
                > - peremajaan -> emaja
                > - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
                > - perahu, berita, meteorologi, dll (butuh dictionary)
                > - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)
                >

                Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal
                ditambahkan ke file txt nya. Huruf2 lain yang ambigu juga ada kemungkinan
                belum lengkap. Terpaksa jadi agak hard-coded, abis bingung menerapkan
                algoritma yang pas, soalnya memang begitulah bahasa kita (CMIIW). Yang 1
                suku kata dan gabungan 2 kata memang tidak dibahas (bukan cakupan) di paper
                asalnya.

                Belum ada proyek apa-apa, baru kepikiran untuk aplikasi yang
                mengkategorisasi tulisan secara otomatis, trus karena alatnya yang
                diperlukan (yaitu stemmer indonesia) belum ada yang bagus (CMIIW) dan lihat
                ada implementasinya di Lucene, iseng2 aja konversi dari Java ke Ruby, trus
                nanti disempurnakan lagi.

                Makasih udah nyobain & kasih komentar. Monggo yang lainnya.

                Dida


                [Non-text portions of this message have been removed]
              Your message has been successfully submitted and would be delivered to recipients shortly.