Loading ...
Sorry, an error occurred while loading the content.
 

Re: [id-ruby] Proyek akhir pekan: IndonesianStemmer

Expand Messages
  • Adinda Praditya
    2013/4/9 Steven Haryanto ... Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal ditambahkan ke file txt nya. Huruf2
    Message 1 of 7 , Apr 9 9:08 AM
      2013/4/9 Steven Haryanto <steven@...>

      > **
      >
      > nyobain bentar.
      >
      > kayaknya masih gagal di kasus2x seperti:
      > - beruang (tapi memang ambigu)
      > - berenang -> enang
      > - peremajaan -> emaja
      > - mengebom, mengelap, mengeleskan, dst (rule: 1 suku kata)
      > - perahu, berita, meteorologi, dll (butuh dictionary)
      > - perikemanusiaan, pertanggungjawaban, dll (rule: 2 kata)
      >

      Untuk kata dasar yang berawalan R memang masih belum lengkap, tinggal
      ditambahkan ke file txt nya. Huruf2 lain yang ambigu juga ada kemungkinan
      belum lengkap. Terpaksa jadi agak hard-coded, abis bingung menerapkan
      algoritma yang pas, soalnya memang begitulah bahasa kita (CMIIW). Yang 1
      suku kata dan gabungan 2 kata memang tidak dibahas (bukan cakupan) di paper
      asalnya.

      Belum ada proyek apa-apa, baru kepikiran untuk aplikasi yang
      mengkategorisasi tulisan secara otomatis, trus karena alatnya yang
      diperlukan (yaitu stemmer indonesia) belum ada yang bagus (CMIIW) dan lihat
      ada implementasinya di Lucene, iseng2 aja konversi dari Java ke Ruby, trus
      nanti disempurnakan lagi.

      Makasih udah nyobain & kasih komentar. Monggo yang lainnya.

      Dida


      [Non-text portions of this message have been removed]
    Your message has been successfully submitted and would be delivered to recipients shortly.