Si l'indexation avancée de sites Web est activée dans votre data store, vous pouvez utiliser les types de données structurées suivants pour enrichir votre indexation :
Cette page présente ces deux types de données structurées pour vos pages Web et explique comment ajouter des attributs structurés personnalisés au schéma de votre data store.
À propos des dates de pages prédéfinies et déduites par Google
Lors de l'exploration des pages Web de votre data store de site Web, Google déduit les données des pages à l'aide des propriétés qui s'appliquent à votre contenu. Vertex AI Search ajoute ces propriétés de données de page inférées à votre schéma. Ces données inférées incluent les propriétés de date prédéfinies suivantes, également appelées dates de signature :
datePublished
: date et heure de la première publication de la pagedateModified
: date et heure de la dernière modification de la page.
Ces propriétés sont indexées automatiquement. Vous pouvez utiliser directement ces propriétés de date pour enrichir votre recherche sans les ajouter à votre schéma. Pour ajouter des dates de publication à votre site Web, consultez Influencer vos dates de publication dans la recherche Google.
Pour savoir comment inclure ces propriétés de date prédéfinies dans vos demandes de recherche, par exemple dans les expressions de filtre et les spécifications de boost, consultez Exemple de cas d'utilisation avec une date de page déduite par Google.
À propos des champs de date et heure personnalisés sur une page Web
Vous pouvez ajouter des champs de date et heure personnalisés à vos pages Web. Ces balises peuvent être utilisées avec l'indexation avancée lorsque vous ajoutez des attributs de données structurées personnalisés au schéma du data store.
Voici un exemple qui montre où ajouter une balise Meta datetime personnalisée nommée lastModified
sur votre page Web.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Vertex AI Search can use this date. -->
<meta name="lastModified" content="2022-07-01">
</head>
<body>
</body>
</html>
Pour savoir comment inclure ces tags de date et heure personnalisés dans vos requêtes de recherche, par exemple dans les expressions de filtre et les spécifications de boost, consultez Exemple de cas d'utilisation avec un attribut de date et heure personnalisé.
À propos des attributs de données structurées personnalisés
Vous pouvez ajouter des attributs de données structurées sous forme de balises meta
et de PageMaps à vos pages Web, et les utiliser pour enrichir votre indexation. Pour utiliser des attributs structurés personnalisés pour l'indexation, vous devez mettre à jour votre schéma.
Exemple de cas d'utilisation des balises meta
Supposons que vous disposiez d'un grand nombre de pages Web pertinentes pour différents services de votre organisation. Vous pouvez utiliser des balises meta
pour identifier les pages qui concernent chaque service. Vous pouvez ensuite utiliser les tags indexés comme filtres dans vos requêtes. Cela vous permet de limiter les résultats de recherche aux pages Web contenant un libellé correspondant à l'un des services spécifiés.
Cette procédure peut être résumée comme suit :
- Ajoutez les balises
meta
suivantes à un sous-ensemble de vos pages Web :- Pour les services d'ingénierie et informatiques :
<meta name="department" content="eng, infotech">
- Pour les services financiers et RH :
<meta name="department" content="finance, human resources">
- Pour les services d'ingénierie et informatiques :
- Demandez à Google de réexplorer les pages modifiées.
- Ajoutez
department
au schéma de votre data store en tant que tableau indexable, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au schéma du data store.
Après avoir mis à jour votre schéma, votre data store est automatiquement réindexé.
Une fois la réindexation terminée, vous pouvez utiliser le filtre department
dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs du service financier émettent des requêtes, les résultats de recherche peuvent être rendus plus pertinents pour eux grâce au filtre department
défini sur finance
.
Exemple de balises meta
sur une page Web
Voici un exemple de balises meta
que vous pouvez ajouter à votre page Web. Ces balises peuvent être utilisées avec l'indexation avancée lorsque vous ajoutez des attributs de données structurées personnalisés au data store datastore.
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Your web page title</title>
<!-- Robots instructions for crawlers and for Vertex AI Search. -->
<meta name="robots" content="index,follow">
<!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
<meta name="lastModified" content="2024-09-06">
<!-- Vertex AI Search can filter by category or tags. -->
<meta name="category" content="archived">
<meta name="tags" content="legacy,interesting,faq">
<!-- Vertex AI Search can index these common HTML tags. -->
<meta name="description" content="A description of your web page's content.">
<meta name="author" content="Your name or organization">
<meta name="keywords" content="relevant,keywords,separated,by,commas">
<link rel="canonical" href="https://www.yourwebsite.com/this-page">
<meta property="og:title" content="Your Webpage Title">
<meta property="og:description" content="A description of your webpage's content.">
<meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
<meta property="og:url" content="https://www.yourwebsite.com/this-page">
<meta property="og:type" content="website">
<meta name="twitter:card" content="summary_large_image">
<meta name="twitter:title" content="Your customized Webpage Title">
<meta name="twitter:description" content="A description of your webpage's content.">
<meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>
Exemple de cas d'utilisation pour les PageMaps
Supposons que vous ayez plusieurs pages Web contenant des recettes de cuisine. Vous pouvez ajouter des données PageMap au contenu HTML de chaque page. Vous pouvez ensuite utiliser les noms d'attributs PageMap indexés comme filtres dans vos requêtes. Par exemple, si vous souhaitez mettre en avant ou enterrer des pages Web en fonction des notes des recettes, vous pouvez suivre cette procédure :
Ajoutez des données PageMap semblables à celles ci-dessous à vos pages Web :
<html> <head> ... <!-- <PageMap> <DataObject type="document"> <Attribute name="title">Baked potatoes</Attribute> <Attribute name="author">Dana A.</Attribute> <Attribute name="description">Homestyle baked potatoes in oven. This recipe uses Russet potatoes.</Attribute> <Attribute name="rating">4.9</Attribute> <Attribute name="lastUpdate">2015-01-01</Attribute> </DataObject> </PageMap> --> </head> ... </html>
Demandez à Google de réexplorer les pages modifiées.
Ajoutez
rating
au schéma de votre data store en tant que tableau indexable, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au schéma du data store.
Après avoir mis à jour votre schéma, votre data store est automatiquement réindexé.
Une fois la réindexation terminée, vous pouvez utiliser l'attribut rating
dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs recherchent des recettes, mettez en avant les résultats de recherche les mieux notés en utilisant rating
comme attribut numérique personnalisé.
Exemple de cas d'utilisation pour les données schema.org
Supposons que vous ayez un site Web d'avis et que ses pages Web soient annotées avec des données schema.org au format JSON-LD dans la balise HTML script
. Vous pouvez ensuite utiliser les annotations indexées comme filtres dans vos requêtes. Par exemple, si vous souhaitez mettre en avant ou enterrer des pages Web en fonction des notes globales, vous pouvez suivre cette procédure :
Ajoutez les annotations schema.org pour le contenu d'avis, comme celles ci-dessous, à vos pages Web. Pour afficher d'autres types de modèles schema.org disponibles, consultez Schémas :
<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "Review", "aggregateRating": { "@type": "Average Rating", "ratingValue": 3.5, "reviewCount": 11 }, "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.", "name": "A Christmas Carol", "image": "christmas-carol-first-ed.jpg", "review": [ { "@type": "Review", "author": "Alex T.", "datePublished": "2000-01-01", "reviewBody": "Read this in middle school and have loved this ever since.", "name": "Worth all the adaptations", "reviewRating": { "@type": "Rating", "bestRating": 5, "ratingValue": 5, "worstRating": 1 } } ] } </script>
Demandez à Google de réexplorer les pages modifiées.
Ajoutez le chemin d'accès à
ratingValue
au schéma de votre data store. Utilisez un identifiant comme nom de champ dans le schéma du data store, tel querating_value
, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au data store du datastore.
Après avoir mis à jour votre schéma, votre data store est automatiquement réindexé.
Une fois la réindexation terminée, vous pouvez utiliser l'attribut rating_value
dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs recherchent des livres, mettez en avant les résultats de recherche les mieux notés en utilisant rating_value
comme attribut numérique personnalisé.
Avant de commencer
Avant de mettre à jour le schéma du data store, procédez comme suit :
- Activez l'indexation avancée de sites Web pour le data store. Pour en savoir plus, consultez Activer l'indexation avancée de sites Web.
- Comprendre le fonctionnement des données structurées
- Découvrez comment utiliser les PageMaps. Consultez la liste des DataObjects reconnus qui peuvent être ajoutés aux données PageMap.
- Découvrez comment utiliser les balises
meta
. Assurez-vous de ne pas utiliser de balises Meta exclues ni de balises Meta non compatibles. - Assurez-vous que l'attribut à indexer ne comporte aucune des valeurs suivantes :
datePublished
dateModified
siteSearch
- Sachez qu'après avoir ajouté des données structurées à vos pages Web, vous devez les recrawler. Cette opération peut prendre plusieurs heures.
- Sachez qu'une fois que vous avez ajouté des attributs de données structurées au schéma du data store, les pages Web de votre data store sont automatiquement réindexées. La réindexation est une opération de longue durée qui peut prendre plusieurs heures.
Ajouter des attributs de données structurées personnalisés au schéma du data store
Pour ajouter des attributs de données structurées personnalisés au schéma du data store :
Ajoutez des balises
meta
, des données PageMap et des données schema.org à toutes les pages de votre site Web que vous souhaitez enrichir avec l'indexation des données structurées :Pour les tags
meta
:- Pour chaque balise
meta
, l'attributname
doit être défini sur le champ que vous souhaitez indexer, et l'attributcontent
doit être défini sur une chaîne d'une ou plusieurs valeurs séparées par une virgule. Vertex AI Search est compatible avec les tags
meta
dont le nom correspond au format[a-zA-Z0-9][a-zA-Z0-9-_]*
. Assurez-vous de ne pas utiliser de métabalises exclues ni de métabalises non compatibles.Si le nom de votre balise
meta
contient un caractère spécial, tel qu'un signe deux-points (:
), vous devez choisir un autre identifiant dans le schéma pour le représenter, puis spécifier le nom exact de la balisemeta
dans le champsiteSearchMetatagName
du schéma.
- Pour chaque balise
Pour les données PageMaps :
- Les données PageMap doivent se composer d'objets DataObject reconnus contenant les noms d'attributs que vous souhaitez indexer. Les noms d'attributs dans les DataObjects doivent être définis sur le champ que vous souhaitez indexer.
Pour les données schema.org :
- Les annotations doivent être au format JSON-LD, Microdonnées ou RDFa valide. Pour en savoir plus, consultez Formats acceptés.
Réexplorez les pages Web mises à jour.
Affichez la définition du schéma de votre data store via l'API REST.
Mettez à jour le schéma du data store à l'aide de la console Google Cloud ou de l'API. Si vous choisissez de le faire via l'API, découvrez comment fournir votre propre schéma en tant qu'objet JSON.
- Ajoutez des objets pour chaque attribut personnalisé que vous souhaitez rendre consultable, récupérable ou indexable.
- Ajoutez l'attribut personnalisé et définissez sa valeur
type
surarray
. - Ajoutez le type de données de la valeur de l'attribut personnalisé.
- Spécifiez la source de l'attribut personnalisé dans le champ
siteSearchStructuredDataSources
. - Pour les données schema.org : spécifiez le chemin de l'attribut dans l'annotation schema.org en commençant par la chaîne
_root
dans le champsiteSearchSchemaOrgPaths
.
Voici un exemple de mise à jour du schéma pour un site Web :
{ "type": "object", "properties": { "CUSTOM_ATTRIBUTE": { "type": "array", "items": { "type": "DATA_TYPE", "searchable": true, "retrievable": true, "indexable": true, "siteSearchMetatagName": "METATAG_NAME", "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"] } } }, { "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": { "type": "array", "items": { "type": "DATA_TYPE_SCHEMA_ORG_FIELD", "searchable": true, "retrievable": true, "indexable": true, "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"] } } }, "$schema": "https://json-schema.org/draft/2020-12/schema" }
Remplacez les éléments suivants :
CUSTOM_ATTRIBUTE
: valeur de l'attributname
. Exemple :- Pour une balise
meta
définie comme<meta name="department" content="eng, infotech">
, utilisezdepartment
. - Pour un attribut PageMap défini sur
<Attribute name="rating">4.9</Attribute>
, utilisezrating
.
Il arrive que le nom de balise
meta
que vous souhaitez ajouter au schéma ne suive pas le modèle[a-zA-Z0-9][a-zA-Z0-9-_]*
et contienne des caractères spéciaux, comme un deux-points:
. Dans ce cas, spécifiez un attribut personnalisé représentatif du nom de balisemeta
, puis indiquez le nom de balisemeta
exact dans le champsiteSearchMetatagName
. Par exemple, si le nom de votre balisemeta
estog:updated_time
, utilisezog_updated_time
comme identifiant dans le champCUSTOM_ATTRIBUTE
etog:updated_time
dans le champMETATAG_NAME
.- Pour une balise
DATA_TYPE
: type de données de l'attributname
. La valeur doit être une chaîne, un nombre ou une date et heure. Exemple :- Pour une balise
meta
définie comme<meta name="department" content="eng, infotech">
, utilisezstring
. - Pour un attribut PageMap défini sur
<Attribute name="rating">4.9</Attribute>
, utiliseznumber
. - Pour un attribut PageMap défini sur
<Attribute name="lastPublished">2015-01-01</Attribute>
, utilisezdatetime
.
Pour en savoir plus, consultez la page
FieldType
.- Pour une balise
METATAG_NAME
: nom exact de la balisemeta
telle qu'elle figure sur la page Web. Ce champ est utile lorsque le nom de balisemeta
que vous souhaitez ajouter au schéma ne suit pas le modèle[a-zA-Z0-9][a-zA-Z0-9-_]*
et contient des caractères spéciaux, tels qu'un deux-points:
. Dans ce cas, spécifiez un attribut personnalisé représentatif du nom de balisemeta
dansCUSTOM_ATTRIBUTE
, puis spécifiez le nom de balisemeta
exact dans le champsiteSearchMetatagName
. Par exemple, si le nom de votre balisemeta
estog:updated_time
, utilisezog_updated_time
comme identifiant dans le champCUSTOM_ATTRIBUTE
etog:updated_time
dans le champMETATAG_NAME
. Lorsque vous ajoutez ce champ pour mettre à jour le schéma, vous devez utiliser le point de terminaison v1alpha au lieu du point de terminaison v1 pour appeler la méthodeschema
.STRUCTURED_DATA_SOURCE_N
: tableau composé d'une ou des deux sources de données structurées suivantes, où l'attributCUSTOM_ATTRIBUTE
peut être trouvé :- Si l'attribut personnalisé se trouve sous la forme d'une balise
meta
, spécifiezMETATAGS
. - Si l'attribut personnalisé est disponible en tant qu'attribut PageMap, spécifiez
PAGEMAP
. - Si l'attribut personnalisé est disponible en tant que donnée schema.org, spécifiez
SCHEMA_ORG
. - Si le champ
siteSearchStructuredDataSources
est absent ou vide, les valeurs des trois sources de données sont fusionnées dans un tableau.
- Si l'attribut personnalisé se trouve sous la forme d'une balise
IDENTIFIER_FOR_SCHEMA_ORG_FIELD
: identifiant personnalisé permettant de désigner le champ schema.org. Il n'est pas nécessaire qu'il soit exactement identique au nom du champ dans l'annotation schema.org de votre page Web. Par exemple, si le chemin du champ est_root.nutrition.calories
, l'identifiant peut êtrecalorific_value
ounutrition_value
.DATA_TYPE_SCHEMA_ORG_FIELD
: type de données du champ schema.org. Doit être une chaîne, un nombre ou une date et heure. Exemple :- Pour un champ schema.org défini comme "calories" :"240 calories",
utilisez
string
- Pour un champ schema.org défini comme "calories" : 240,
utilisez
number
- Pour un champ schema.org défini comme "foundingDate" : "1991-05-01",
utilisez
datetime
Pour en savoir plus, consultez la page
FieldType
.- Pour un champ schema.org défini comme "calories" :"240 calories",
utilisez
PATH_TO_THE_SCHEMA_ORG_FIELD
: chemin d'accès à un champ unique dans le champ schema.org auquel vous devez accéder. Il est spécifié à l'aide de séparateurs de points après chaque niveau imbriqué. Vous devez spécifier le chemin complet nécessaire pour accéder au champ requis. Par exemple, si un champratingValue
est imbriqué dans le champaggregateRating
, vous pouvez spécifier le chemin d'accès sous la forme_root.aggregateRating.ratingValue
.
Une fois le schéma du site Web mis à jour, le site est automatiquement réindexé. Il s'agit d'une opération de longue durée qui peut prendre plusieurs heures.
Étapes suivantes
Utilisez les métadonnées indexées pour les éléments suivants :
- Commandes de diffusion, telles que "Mettre en avant", "Rétrograder" et "Filtrer"
- Affichage sous forme de facettes dans les résultats de recherche
- Filtrer les résultats de recherche
- Booster les résultats de recherche