85 lines
3.5 KiB
PHP
85 lines
3.5 KiB
PHP
|
<?php
|
||
|
/**
|
||
|
* This file is part of the RussianStemmer package
|
||
|
*
|
||
|
* (c) Alexander Kiryukhin
|
||
|
*
|
||
|
* For the full copyright and license information, please view the LICENSE
|
||
|
* file that was distributed with this source code
|
||
|
*/
|
||
|
|
||
|
namespace NXP;
|
||
|
|
||
|
class StemmerTest extends \PHPUnit_Framework_TestCase
|
||
|
{
|
||
|
public function testStemming()
|
||
|
{
|
||
|
$stemmer = new Stemmer();
|
||
|
$testWords = [
|
||
|
'результаты' => 'результат',
|
||
|
'в' => 'в',
|
||
|
'вавиловка' => 'вавиловк',
|
||
|
'вагнера' => 'вагнер',
|
||
|
'вагон' => 'вагон',
|
||
|
'вагона' => 'вагон',
|
||
|
'вагоне' => 'вагон',
|
||
|
'вагонов' => 'вагон',
|
||
|
'вагоном' => 'вагон',
|
||
|
'вагоны' => 'вагон',
|
||
|
'важная' => 'важн',
|
||
|
'важнее' => 'важн',
|
||
|
'важнейшие' => 'важн',
|
||
|
'важнейшими' => 'важн',
|
||
|
'важничал' => 'важнича',
|
||
|
'важно' => 'важн',
|
||
|
'важного' => 'важн',
|
||
|
'важное' => 'важн',
|
||
|
'важной' => 'важн',
|
||
|
'важном' => 'важн',
|
||
|
'важному' => 'важн',
|
||
|
'важности' => 'важност',
|
||
|
'важностию' => 'важност',
|
||
|
'важность' => 'важност',
|
||
|
'важностью' => 'важност',
|
||
|
'важную' => 'важн',
|
||
|
'важны' => 'важн',
|
||
|
'важные' => 'важн',
|
||
|
'важный' => 'важн',
|
||
|
'важным' => 'важн',
|
||
|
'важных' => 'важн',
|
||
|
'вазах' => 'ваз',
|
||
|
'вазы' => 'ваз',
|
||
|
'вакса' => 'вакс',
|
||
|
'вакханка' => 'вакханк',
|
||
|
'вал' => 'вал',
|
||
|
'валандался' => 'валанда',
|
||
|
'валентина' => 'валентин',
|
||
|
'валериановых' => 'валерианов',
|
||
|
'валерию' => 'валер',
|
||
|
'валетами' => 'валет',
|
||
|
'вали' => 'вал',
|
||
|
'валил' => 'вал',
|
||
|
'валился' => 'вал',
|
||
|
'валится' => 'вал',
|
||
|
'валов' => 'вал',
|
||
|
'вальдшнепа' => 'вальдшнеп',
|
||
|
'вальс' => 'вальс',
|
||
|
'вальса' => 'вальс',
|
||
|
'вальсе' => 'вальс',
|
||
|
'вальсишку' => 'вальсишк',
|
||
|
'вальтера' => 'вальтер',
|
||
|
'валяется' => 'валя',
|
||
|
'валялась' => 'валя',
|
||
|
'валялись' => 'валя',
|
||
|
'валялось' => 'валя',
|
||
|
'валялся' => 'валя',
|
||
|
'валять' => 'валя',
|
||
|
'валяются' => 'валя',
|
||
|
'вам' => 'вам',
|
||
|
'вами' => 'вам',
|
||
|
];
|
||
|
foreach ($testWords as $word => $base) {
|
||
|
$this->assertEquals($base, $stemmer->getWordBase($word));
|
||
|
}
|
||
|
}
|
||
|
}
|