Uživatelské nástroje

Nástroje pro tento web


ica:knowhow

Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
ica:knowhow [29.05.2014 17:55]
David Benes [Nezobrazujici se statistiky dotazu v administraci]
ica:knowhow [14.10.2019 17:02] (aktuální)
Řádek 24: Řádek 24:
   * asi jedine obejiti pokud je potreba nechat vyhledavat primo v tomhle poli je vytvorit duplicitni, ve kterem pujde hledat, ale pro zobrazovani s puvodnimi odradkovanimi nechavat to puvodni pole   * asi jedine obejiti pokud je potreba nechat vyhledavat primo v tomhle poli je vytvorit duplicitni, ve kterem pujde hledat, ale pro zobrazovani s puvodnimi odradkovanimi nechavat to puvodni pole
  
 +==== Výpočet relevance ve výsledcích vyhledávání ====
 +  * Využívá se algoritmus [[http://en.wikipedia.org/wiki/Tf%E2%80%93idf|TF-IDF]]
 +  * Popis algoritmu od labu z 27.5.2014:
 +
 +> The factor affecting relevancy score by number of documents is Tf-Idf (term frequency-inverted document frequency). It is calculated to measure importance of every words in a query.
 +> For example, a query is composed by word A and word B. If word A appears in most of documents in a collection but B appears just in small number of documents. Then, documents which contain word B many times are relevant for the query instead of A.
 +> e.g. Doc 1 is A  A B A, Doc 2 is B A B B, then Doc 2 is higher than Doc 1.
 +
 +> If the customer needs to disable it, he can set "Influence of the static score to the total document score (0-100):" to 100 on admin UI of the search collection.
 +> However, if it is disabled, only static score e.g. document date and number of link (web only) affects search relevancy.
ica/knowhow.txt · Poslední úprava: 14.10.2019 17:02 (upraveno mimo DokuWiki)