Nové vyhledávání pro portál openSUSE wiki

To, na co většina návštěvníků wiki pro OS openSUSE dlouho čekala, je tu! Tento portál dostal konečně nové vyhledávání, pomocí kterého budete hledat rychleji a ještě k tomu s lepšími výsledky. Nový vyhledávací engine se jmenuje Lucene a byl nasazen na portál en.opensuse.org včetně všech jeho jazykových mutací a na dewiki.opensuse.org. Odkazy na wiki stránkách běží stále na starém vyhledávacím mechanizmu, ale jakmile budou předělány do nového systému wiki, začnou plně pracovat pod novým Lucene.
Co vám nové vyhledávání umožní a ulehčí, tak to se dozvíte uvnitř tohoto článku.

Relevance a rychlost

Nové vyhledávání používá složitější algoritmy, takže výsledky jsou daleko přesnější a vyhledávací doba se zkrátila.

Návrhy

Nové vyhledávání vám může navrhovat, co chcete napsat podle obsahu wiki stránek. Toto je známé například z googlu, seznamu atd., takže vy napíše třeba jen jedno slovo a vyhledávání vám navrhuje další ucelené fráze a spojení, která jsou ve wiki použita.

Nejisté vyhledávání

Nejste si jisti správným hláskováním termínu, který chcete vyhledat? Nevadí, dejte za tento termín tento znak "~". V praxi to vypadá asi takto: budete hledat termín "Linus~" a vyhledávání vám nalezne všechny zmínky o Linus, Linux a ostatních podobných tvarech.

Související články

Pokud kliknete na "Related" odkaz (související, příbuzné...) v konkrétním výsledku vyhledávání, můžete tím zobrazit všechny související články k danému výsledku. Za související článek se bere, když dva články odkazují na stejný třetí článek. Tato funkce bude fungovat lépe podle toho, jak rychle se rozrůstá obsah wiki, takže ze začátku budou třeba jen dva související články a časem se to může rozrůst na padesát souvisejících článků.

Zástupné znaky a jména umístění (namespace)

Toto není ani tak novinka ve vyhledávání, ale o této možnosti zatím moc lidí neví, takže to stojí za připomenutí. Zároveň se omlouvám za ten patvar jména umístění, ale nějak jsem nenašel lepší ekvivalent pro označení namespace. A co vlastně jde? Pokud chcete vyhledávat určitý výraz na určitém místě, můžete použít právě jména umístění. V praxi to vypadá tak, že když budeme chtít vyhledávat výraz nVidia v databázi podpory, tak použijeme tento vyhledávací výraz "sdb: nvidia". Pokud chcete hledat ve všech prostorech, napište "all: nvidia".

Zástupné znaky fungují stejně jako doteď, takže "*" můžete použít pouze na začátku nebo konci výrazu, ne uprostřed. Zástupný znak "?", který slouží k nahrazení jednoho znaku, není k ve vyhledávání k dispozici, stejně jako tomu bylo v předchozím vyhledávacím enginu. Jako náhrada je tu právě výše zmíněná funkce Nejisté vyhledávání.

Vyhledávání podle kořenu slova a synonym

První případ je dostupný pro několik jazyků včetně angličtiny, němčiny, španělštiny a dalších. Bohužel jsem nikde nezjistil, zda mezi tyto jazyky patří i čeština, ale ono je to stejně nepodstatné, protože těžko budeme vyhledávat nějaký český výraz. Funkce tohoto vyhledávání spočívá v tom, že pokud vyhledáváte například termín "stopped", nevrátí nám to jen výsledek na stopped, ale do výsledků jsou zahrnuty například i termíny stop nebo třeba stops.

Vyhledávání synonym funguje hlavně tak, že když budete vyhledávat například číslo 11, bude vyhledáván i termín eleven.

Tato funkce bude dostupná jen pro angličtinu, ale prozatím není aktivovaná.

Indexování

Prozatím bude probíhat indexování jednou denně. To znamená, že nový obsah bude vyhledatelný po 24 hodinách. Po odzkoušení výkonnosti a zjištění, jak to bude server stíhat, zřejmě dojde ke snížení této doby.

Závěr

Toto vše by nebylo možné udělat bez pomoci Roberta Stojniće, který nejen že tento vyhledávací engine vytvořil, ale také pomáhal při testování a odstraňování chyb.

Jako obvykle, pokud naleznete nějakou chybu, nahlaste ji na webmaster@opensuse.org nebo ve wiki mailing list.

Autor: VojTEKK