API de construction de requêtesEn plus du parsage automatique d'une requête en chaîne de caractères, il est également possible de construire cette requête à l'aide de l'API de requête. Les requêtes utilisateur peuvent être combinées avec les requêtes créées à travers l'API de requêtes. Utilisez simplement le parseur de requêtes pour construire une requête à partir d'une chaîne :
Les Exceptions du parseur de requêtesLe parseur de requêtes peut générer deux types d'exceptions :
La même technique devrait être utilisée pour la méthode find() d'un objet Zend_Search_Lucene. Depuis la version 1.5, les exceptions de parsage de requête sont supprimées par défaut. Si la requête ne respecte pas le langage de requêtes, elle est "tokenizée" à l'aide de l'analyseur par défaut et tous les termes "tokenizés" sont utilisés dans la recherche. Pour activer les exceptions, utilisez Zend_Search_Lucene_Search_QueryParser::dontSuppressQueryParsingExceptions(). Les méthodes Zend_Search_Lucene_Search_QueryParser::suppressQueryParsingExceptions() et Zend_Search_Lucene_Search_QueryParser::queryParsingExceptionsSuppressed() sont également destinées à gérer le comportement de gestion des exceptions. Requête sur un termeLes requêtes de termes peuvent être utilisées pour une recherche sur un seul terme. Requête par chaîne de caractères:
ou Construction de la requête via l'API:
L'argument field est optionnel. Zend_Search_Lucene cherche dans tous les champs indexés si aucun champ n'a été spécifié :
Requête multi-termesLes requêtes multi-termes peuvent être utilisées pour chercher sur une collection de termes. Chaque terme dans une collection peut être défini comme requis, interdit, ou aucun des deux.
Si des termes optionnels sont ajoutés à une requête possédant des termes requis, les deux requêtes auront les mêmes résultats, mais les termes optionnels pourraient influer sur le score des documents retournés. Les deux méthodes de recherche peuvent être utilisées pour les requêtes multi-termes. Requête par chaîne de caractères:
or Construction de la requête via l'API:
Il est également possible de spécifier des listes de termes dans le contructeur de la requête multi-termes : Le tableau $signs contient des informations sur le type de chaque terme :
Requête booléeneLes requêtes booléenes permettent de construire une requête qui utilise d'autres requêtes et des opérateurs booléens. Chaque sous-requête dans une collection peut être définie comme requis, interdit, ou optionnel.
Si des sous-requêtes optionnelles sont ajoutées à une requête possédant des sous-requêtes requises, les deux requêtes auront les mêmes résultats, mais les sous-requêtes optionnelles pourraient influer sur le score des documents retournés. Les deux méthodes de recherche peuvent être utilisées pour les requêtes booléenes. Requête par chaîne de caractères:
or Construction de la requête via l'API:
Il est également possible de spécifier des listes de sous-requêtes dans le constructeur d'une requêtes booléene : Le tableau $signs contient des informations sur le type de chaque sous-requête :
Chaque requête qui utilise des opérateurs booléens peut être réécrite en utilisant les notations de signes et construites à l'aide de l'API. Par exemple :
Requête Joker (wildcard)Les requêtes Joker peuvent être utilisées pour chercher des documents contenant des chaînes de caractères qui correspondent aux modèles (pattern) spécifiés. Le symbole '?' est utilisé comme un joker d'un seul caractère. Le symbole '*' est utilisé comme un joker pour plusieurs caractères. Requête par chaîne de caractères:
ou Construction de la requête via l'API:
L'argument field est optionnel. Zend_Search_Lucene cherche dans tous les champs indexés si aucun champ n'a été spécifié :
Requête floue (fuzzy query)Les requêtes floues peuvent être utilisées pour chercher des documents contenant des chaînes de caractères qui correspondent à des termes similaires au terme cherché. Requête par chaîne de caractères:
ou Construction de la requête via l'API:
Un indice de similarité (optional similarity) peut être spécifié après le signe "~". Requête par chaîne de caractères:
ou Construction de la requête via l'API:
L'argument field est optionnel. Zend_Search_Lucene cherche dans tous les champs indexés si aucun champ n'a été spécifié :
Requête de phraseLes requêtes de phrase peuvent être utilisées pour chercher une phrase dans des documents. Les requêtes de phrase sont très flexible et permettent à l'utilisateur ou au développeur de chercher des phrases exactes aussi bien que des phrases 'imprécises'. Les phrases peuvent aussi contenir des trous ou des termes aux mêmes places; elles peuvent être générées par l'analyseur dans différents buts. Par exemple, un terme peut être dupliqué pour augmenter son poids, ou plusieurs synonymes peuvent être placés sur une seule et unique position.
Une requête de phrase peut être construite en une seule étape à l'aide du constructeur ou étape par étape avec des appels à la méthode Zend_Search_Lucene_Search_Query_Phrase::addTerm(). Le constructeur de la classe Zend_Search_Lucene_Search_Query_Phrase prends trois arguments optionnels : Le paramètre $terms est un tableau de chaînes de caractères qui contient une collection de termes pour une phrase. S'il est omis ou égal à NULL, une requête vide sera construite. Le paramètre $offsets est un tableau d'entiers qui contient les positions des termes dans la phrase. S'il est omis ou égale à NULL, les positions des termes seront implicitement séquentielles sans trou. Le paramètre $field est un chaîne de caractères qui indique le champ dans lequel chercher. S'il est omis ou égal à NULL, la recherche se fera dans le champ par défaut. Ainsi :
va chercher la phrase 'zend framework' dans tous les champs. va chercher la phrase 'zend ????? download' et correspondra à 'zend platform download', 'zend studio download', 'zend core download', 'zend framework download', etc.
va chercher la phrase 'zend framework' dans le champ 'title'. La méthode Zend_Search_Lucene_Search_Query_Phrase::addTerm() prends deux arguments, un Zend_Search_Lucene_Index_Term requis et une position optionnelle :
Le paramètre $term décrit le prochain terme dans la phrase. Il doit indiquer le même champ que les termes précédents, sinon une exception sera levée. Le paramètre $position indique la position du terme dans la phrase. Ainsi :
va chercher la phrase 'zend framework'.
va chercher la phrase 'zend ????? download' et correspondra à 'zend platform download', 'zend studio download', 'zend core download', 'zend framework download', etc.
va chercher la phrase 'zend framework' dans le champ 'title'. Le 'slop factor' établit le nombre d'autres mots autorisés entre les mots spécifiés dans la requête de phrase. S'il est défini à zéro, la requête correspondante sera une recherche d'une phrase exacte. Pour des valeurs supérieures à zéro, cela fonctionne comme les opérateurs WITHIN ou NEAR. Le 'slop factor' est en fait une distance d'édition, où les éditions consistent à déplacer les termes dans la phrase recherchée. Par exemple, inverser l'ordre de deux mots requiert deux déplacements (le premier déplacement positionne les mots l'un sur l'autre), donc pour permettre le réarrangement de phrase, le 'slop factor' doit être d'au moins deux. Les correspondances les plus exactes possèdent un meilleur score que celles ayant eu recours au 'slop factor'; ainsi les résultats de recherche sont classés par exactitude. Le 'slop factor' est à zéro par défaut, requérant des correspondances exactes. Le 'slop factor' peut être assigné après la création de la requête :
Requête d'intervalleLes requêtes d'intervalle sont dédiées à la recherche de termes dans un intervalle spécifié. Requête par chaîne de caractères:
ou Construction de la requête via l'API:
L'argument field est optionnel. Zend_Search_Lucene cherche dans tous les champs indexés si aucun champ n'a été spécifié :
L'une ou l'autre (mais pas les deux) des bornes peut être définie à NULL. Dans ce cas, Zend_Search_Lucene cherche depuis le début ou jusqu'à la fin du dictionnaire pour le(s) champs spécifié(s) :
|