Uživatelské nástroje

Nástroje pro tento web


Action disabled: revisions
ica:knowhow

IBM Content Analytics (ICA) know-how

Známé problémy

Nezobrazujici se statistiky dotazu v administraci

  • Chrome a FF24 upravili javascript a Dojo, ktere ICA pouziva prestalo byt kompatibilni.
  • Je zapotrebi provest rucni opravu Dojo, dokud se to neudela v nejakem FP.
  • Dojo fix, ktery je potreba provest je zde, v Dojo 1.6.2 uz je to opraveno.
  • To je potreba upravit v Dojo souborech pro admin aplikaci:
    • <ICA_install>/webapps/adminapp/ESAdmin/dojo/dojo/dojo.js
    • <ICA_install>/webapps/adminapp/ESAdmin/dojo/dojo/dojo.uncompressed.js
    • Aby bylo mozne soubory upravovat, je potreba zastavit administraci (esadmin admin stop) a upravovat jako administrator.
  • potom staci restartovat administraci nasledujicim prikazem a uz to funguje
    • esadmin admin restart

Po kopii kolekce není zachováno mapováni políček z DB na metadata

  • Mapovani v indexaci je zachovano, ale je zachovano se starym identifikatorem crawleru (crawler ve zduplikovane kolekci ma jine ID), takze se nepouzije.
  • Je potreba v souboru jdbccrawler.xml najit nove ID crawleru v tagu Target
  • Tim prepsat IDcko v souboru collection.xml v collection > mappings > … > condition[@name=”$crwsp”]

Užitečné

Multiline index field

  • Pokud je pole oznaceno jako ze v nem lze vyhledavat, tak se z pole odstranuji odradkovani
  • Tzn. pokud je potreba zachovat radkovani, lze ho vyuzit jen pro fulltextove hledani
  • asi jedine obejiti pokud je potreba nechat vyhledavat primo v tomhle poli je vytvorit duplicitni, ve kterem pujde hledat, ale pro zobrazovani s puvodnimi odradkovanimi nechavat to puvodni pole

Výpočet relevance ve výsledcích vyhledávání

  • Využívá se algoritmus TF-IDF
  • Popis algoritmu od labu z 27.5.2014:
The factor affecting relevancy score by number of documents is Tf-Idf (term frequency-inverted document frequency). It is calculated to measure importance of every words in a query.
For example, a query is composed by word A and word B. If word A appears in most of documents in a collection but B appears just in small number of documents. Then, documents which contain word B many times are relevant for the query instead of A.
e.g. Doc 1 is A A B A, Doc 2 is B A B B, then Doc 2 is higher than Doc 1.

If the customer needs to disable it, he can set „Influence of the static score to the total document score (0-100):“ to 100 on admin UI of the search collection.
However, if it is disabled, only static score e.g. document date and number of link (web only) affects search relevancy.
ica/knowhow.txt · Poslední úprava: 14.10.2019 17:02 (upraveno mimo DokuWiki)

Nástroje pro stránku