en V4R40 WebServer for OS/400 propose son propre système d'indexation (NetQuestion reste un produit à part, destiné aux très gros sites) - indexation de tous les mots (Netquestion ignore: le, la, des, etc...) - recherche simple ou avancée (et/ou , pas/sauf si, ...) - la page de recherche peut-être réhabillée (c'est du Netdata) - support de la notion de CCSID Il exite deux manières de configurer votre index 1/ par l'administration graphique (serveur web sur le port 2001) 2/ par une commande apparue sur la cumulative 9-313 dans tous les cas de figure, il faut installer la PTF SF56269 |
Pour configurer par l'administration Web : 1/ choisissez "search administration" /creation puis indiquez un nom d'index et un répertoire de stockage. IBM propose /QIBM/UserData/HTTPSVR/Index (modifiable) la structure crée sera la suivante : /Index ! !--des documents votre-nom.DOCUMENT_LIST ! " .KEY ! " .LEY ! " .POS ! " .QOS ! " .STAT !--wrkgtr1 !--wrkgtr2 trois répertoires de travail. !--wrkgtr3 |
puis vous indiquerez : ° le(les) répertoire(s) à analyser le système va d'abord créer un fichier contenant la liste des pages à indexer, avant de lancer l'indexation. ° s'il faut analyser les sous-répertoires (traverse sub-directory) ° le (les) type(s) de fichier à analyser en indiquant une extension (document filter) par défaut "*.htm*", ==> .htm .html |
viennent ensuite les options d'indexation : ° les document sont-ils des pages HTML ? (si oui, les balises HTML [<BODY>, <HTMl>, <B>, etc ...] ne seront pas indexées) ° faut-il faire la différence entre minuscule et MAJUSCULE dans l'index (ceci dit, il y a une option pour ignorer lors de la recherche) ° prévoit-on une recherche tenant compte aussi des chiffres ? ° création de l'index immédiate (pour AF400, entre 20 mn et 1 Heure) ou en tâche de fond (soumission) ° faut-il arreter l'indexation en cas d'erreur sur un fichier (lock?) |
et enfin, règles de mappage (transformation) si dans votre config HTTP vous avez une règle map /home/* /usr/bin/home/* qui indique que chaque URL commencant par "/home/..." doit être traitée par le système de fichier en faisant référence à "/usr/bin/home/..." il FAUT l'indiquer ici, afin que les liens donnés par l'index fassent référence à "/home/..." et non au répertoire réel. (traitement des directives map et pass , mais à l'envers. il faut donc indiquer un fichier de config ) |
Voilà ! depuis la cumulative 9-313 (ou en V4R50), vous pouvez configurer un index en mode commande : 2a/ CFGHTTPSCH afin de créer le fichier contenant la liste des pages à indexer. CFGHTTPSCH OPTION(*CRTDOCL) DOCLIST('votre_document_list') STRDIR('/af4dir') SUBTREE(*ALL) PATTERN('*.HTM*') vous pouvez réaliser aussi cette action en mode graphique |
fournisseurs : cette option peut-être lancée sur votre machine, le fichier peut être re-distribué. 2b/ CFGHTTPSCH afin de créer l'index à partir du fichier créé en 2a/ fournisseurs : cette option doit être lancée sur la machine du client (il y a des objets dépendants, créés sur la machine et aujourd'hui non documentés par IBM) CFGHTTPSCH OPTION(*CRTIDX) IDX(af400) IDXDIR('/af4dir') TEXT(commentaire) DOCLIST(''votre_document_list') CONTENT(*HTML) ALWERR(*YES) ENDCASE(*YES) ALWCHAR(*ALPHANUM) IDXHTML(*NONE) |
il vous reste à utiliser l'index : 1/ a partir du serveur Web d'administration search administration /search index... 2/ en créant votre propre page d'appel au moteur de recherche il s'agit d'une macro Net.Data, fournie en tant que modèle que vous devez dupliquer, traduire (elle est en américain) et personnaliser. le modèle se trouve dans /QIBM/ProdData/HTTP/Public/HTTPSVR/Sample_search.nmd il faut lancer la macro "simple" le répertoire /QIBM/ProdData/HTTP/Public/HTTPSVR/html contient des pages html de recettes de cuisine (en américain) afin de vous entrainer. |