Loading ...
Sorry, an error occurred while loading the content.

Proyek akhir pekan: IndonesianStemmer

Expand Messages
  • Adinda Praditya
    Hi all, Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2 kontribusinya. Langsung ke TKP https://github.com/apraditya/indonesian_stemmer
    Message 1 of 7 , Mar 30, 2013
    • 0 Attachment
      Hi all,

      Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
      kontribusinya. Langsung ke TKP
      https://github.com/apraditya/indonesian_stemmer

      Makasih,
      Dida


      [Non-text portions of this message have been removed]
    • Nugroho Herucahyono
      Great! beberapa kali butuh yang kayak gini... tapi sepertinya bikin stemmer bahasa indonesia memang susah 1.9.3p0 :007 pemasukan .stem = *asu* # ooh yeah
      Message 2 of 7 , Apr 1, 2013
      • 0 Attachment
        Great!

        beberapa kali butuh yang kayak gini...
        tapi sepertinya bikin stemmer bahasa indonesia memang susah

        1.9.3p0 :007 > "pemasukan".stem
        => "*asu*"
        # ooh yeah

        1.9.3p0 :017 > "menangis".stem
        => "angis"

        gimana caranya bedain antara:

        pemasukan => masuk
        pemanah => panah

        hmm...



        2013/3/31 Adinda Praditya <apraditya@...>

        > **
        >
        >
        > Hi all,
        >
        > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
        > kontribusinya. Langsung ke TKP
        > https://github.com/apraditya/indonesian_stemmer
        >
        > Makasih,
        > Dida
        >
        > [Non-text portions of this message have been removed]
        >
        >
        >


        [Non-text portions of this message have been removed]
      • Adinda Praditya
        Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang terkait. Masih ada
        Message 3 of 7 , Apr 3, 2013
        • 0 Attachment
          Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
          kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
          terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
          r.

          Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
          cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
          ini?

          Makasih,
          Dida

          @didaid
          On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:

          > Great!
          >
          > beberapa kali butuh yang kayak gini...
          > tapi sepertinya bikin stemmer bahasa indonesia memang susah
          >
          > 1.9.3p0 :007 > "pemasukan".stem
          > => "*asu*"
          > # ooh yeah
          >
          > 1.9.3p0 :017 > "menangis".stem
          > => "angis"
          >
          > gimana caranya bedain antara:
          >
          > pemasukan => masuk
          > pemanah => panah
          >
          > hmm...
          >
          >
          >
          > 2013/3/31 Adinda Praditya <apraditya@...>
          >
          > > **
          > >
          > >
          > > Hi all,
          > >
          > > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
          > > kontribusinya. Langsung ke TKP
          > > https://github.com/apraditya/indonesian_stemmer
          > >
          > > Makasih,
          > > Dida
          > >
          > > [Non-text portions of this message have been removed]
          > >
          > >
          > >
          >
          >
          > [Non-text portions of this message have been removed]
          >
          >
          >
          > ------------------------------------
          >
          > ID-Ruby
          > Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
          > varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
          > dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
          >
          > http://rubyurl.com/Q8DD
          > http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
          >
          >
          >
          >
          >


          [Non-text portions of this message have been removed]
        • Adinda Praditya
          Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh, lumayan itung2
          Message 4 of 7 , Apr 7, 2013
          • 0 Attachment
            Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
            langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
            lumayan itung2 nambah kredit. hehe..

            Dida
            @didaid



            2013/4/4 Adinda Praditya <apraditya@...>

            > Makasih masukannya. Sudah disempurnakan, walaupun masih ga rapih. Untuk
            > kata kata yang ambigu tinggal tambahkan aja ke array di konstan yang
            > terkait. Masih ada beberapa kata yang belum ditambah untuk yang berawalan
            > r.
            >
            > Semua konstan nanti akan saya pindahkan ke file tersendiri. Tapi apakah
            > cukup? Ada tips bagaimana cara menyimpan potongan potongan kata dalam array
            > ini?
            >
            > Makasih,
            > Dida
            >
            > @didaid
            > On Apr 1, 2013 3:58 PM, "Nugroho Herucahyono" <me@...> wrote:
            >
            >> Great!
            >>
            >> beberapa kali butuh yang kayak gini...
            >> tapi sepertinya bikin stemmer bahasa indonesia memang susah
            >>
            >> 1.9.3p0 :007 > "pemasukan".stem
            >> => "*asu*"
            >> # ooh yeah
            >>
            >> 1.9.3p0 :017 > "menangis".stem
            >> => "angis"
            >>
            >> gimana caranya bedain antara:
            >>
            >> pemasukan => masuk
            >> pemanah => panah
            >>
            >> hmm...
            >>
            >>
            >>
            >> 2013/3/31 Adinda Praditya <apraditya@...>
            >>
            >> > **
            >> >
            >> >
            >> > Hi all,
            >> >
            >> > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
            >> > kontribusinya. Langsung ke TKP
            >> > https://github.com/apraditya/indonesian_stemmer
            >> >
            >> > Makasih,
            >> > Dida
            >> >
            >> > [Non-text portions of this message have been removed]
            >> >
            >> >
            >> >
            >>
            >>
            >> [Non-text portions of this message have been removed]
            >>
            >>
            >>
            >> ------------------------------------
            >>
            >> ID-Ruby
            >> Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala
            >> varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat
            >> dengan Ruby (Ruby on Rails, JRuby on Rails, Merb)
            >>
            >> http://rubyurl.com/Q8DD
            >> http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia
            >>
            >>
            >>
            >>
            >>


            [Non-text portions of this message have been removed]
          • Steven Haryanto
            ... nyobain bentar. kayaknya masih gagal di kasus2x seperti: - beruang (tapi memang ambigu) - berenang - enang - peremajaan - emaja - mengebom, mengelap,
            Message 5 of 7 , Apr 9, 2013
            • 0 Attachment
              On 04/08/2013 10:37 AM, Adinda Praditya wrote:
              >
              >
              > Demonya ada di sini: http://indonesian-stemmer.herokuapp.com/ Silahkan
              > langsung dicoba. Sama kalau ada yang mau memoles desainnya juga boleh,
              > lumayan itung2 nambah kredit. hehe..

              nyobain bentar.

              kayaknya masih gagal di kasus2x seperti:
              - beruang (tapi memang ambigu)
              - berenang -> enang
              - peremajaan -> emaja
              - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
              - perahu, berita, meteorologi, dll (butuh dictionary)
              - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)

              --
              Reseller lisensi Spanel? http://spanel.info/?p=36
            • Steven Haryanto
              ... btw, lupa ngomong: cool :) kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa? salam, -- Reseller lisensi Spanel? http://spanel.info/?p=36
              Message 6 of 7 , Apr 9, 2013
              • 0 Attachment
                On 03/31/2013 09:57 AM, Adinda Praditya wrote:
                > Baru merilis gem IndonesianStemmer. Mohon saran, komentar dan syukur2
                > kontribusinya. Langsung ke TKP
                > https://github.com/apraditya/indonesian_stemmer

                btw, lupa ngomong: cool :)

                kalo boleh tau bung adinda, pustaka ini dipake utk proyek apa?

                salam,
                --
                Reseller lisensi Spanel? http://spanel.info/?p=36
              • Adinda Praditya
                2013/4/9 Steven Haryanto ... Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal ditambahkan ke file txt nya. Huruf2
                Message 7 of 7 , Apr 9, 2013
                • 0 Attachment
                  2013/4/9 Steven Haryanto <steven@...>

                  > **
                  >
                  > nyobain bentar.
                  >
                  > kayaknya masih gagal di kasus2x seperti:
                  > - beruang (tapi memang ambigu)
                  > - berenang -> enang
                  > - peremajaan -> emaja
                  > - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
                  > - perahu, berita, meteorologi, dll (butuh dictionary)
                  > - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)
                  >

                  Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal
                  ditambahkan ke file txt nya. Huruf2 lain yang ambigu juga ada kemungkinan
                  belum lengkap. Terpaksa jadi agak hard-coded, abis bingung menerapkan
                  algoritma yang pas, soalnya memang begitulah bahasa kita (CMIIW). Yang 1
                  suku kata dan gabungan 2 kata memang tidak dibahas (bukan cakupan) di paper
                  asalnya.

                  Belum ada proyek apa-apa, baru kepikiran untuk aplikasi yang
                  mengkategorisasi tulisan secara otomatis, trus karena alatnya yang
                  diperlukan (yaitu stemmer indonesia) belum ada yang bagus (CMIIW) dan lihat
                  ada implementasinya di Lucene, iseng2 aja konversi dari Java ke Ruby, trus
                  nanti disempurnakan lagi.

                  Makasih udah nyobain & kasih komentar. Monggo yang lainnya.

                  Dida


                  [Non-text portions of this message have been removed]
                Your message has been successfully submitted and would be delivered to recipients shortly.