stemmerru/README.md
Alexander Kiryukhin 0911847693
Update README.md
Added codecov badge
2018-05-10 03:23:17 +03:00

35 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Стеммер Портера для русского языка
[![Build Status](https://travis-ci.org/NeonXP/StemmerRu.svg?branch=master)](https://travis-ci.org/NeonXP/StemmerRu)
[![codecov](https://codecov.io/gh/NeonXP/StemmerRu/branch/master/graph/badge.svg)](https://codecov.io/gh/NeonXP/StemmerRu)
Стемминг - процесс получения основы слова из любой его формы. Иными словами, отсекает лишние суффиксы и окончания.
Самое очевидное применение - в полнотекстовом поиске, где нужно, чтобы слово находилось, даже если у него другое окончание.
Этот пакет - реализация [стеммера Портера](https://ru.wikipedia.org/wiki/Стемминг#Стеммерортера) для русского языка на Go.
## Использование
`основа := StemmerRu.StemWord("слово")`
Преобразует слово на входе в его основу на выходе
## Пример
```
package main
import (
"fmt"
"github.com/neonxp/StemmerRu"
)
func main() {
fmt.Println(StemmerRu.StemWord("безмолвны") // выведет: безмолвн
fmt.Println(StemmerRu.StemWord("безмолвные") // выведет: безмолвн
fmt.Println(StemmerRu.StemWord("безмолвный") // выведет: безмолвн
fmt.Println(StemmerRu.StemWord("безмолвным") // выведет: безмолвн
fmt.Println(StemmerRu.StemWord("безмолвных") // выведет: безмолвн
}
```