Utilizzare i dati strutturati per l'indicizzazione avanzata dei siti web

Se l'indicizzazione avanzata dei siti web è attivata nel datastore, puoi utilizzare i seguenti tipi di dati strutturati per arricchire l'indicizzazione:

Questa pagina introduce entrambi i tipi di dati strutturati per le tue pagine web e descrive come aggiungere attributi strutturati personalizzati allo schema del tuo datastore.

Informazioni sulle date delle pagine predefinite dedotte da Google

Durante la scansione delle pagine web nel datastore del tuo sito web, Google deduce i dati della pagina utilizzando le proprietà che si applicano ai tuoi contenuti. Vertex AI Search aggiunge queste proprietà dei dati della pagina dedotte allo schema. Questi dati dedotti includono le seguenti proprietà di data predefinite, chiamate anche date di pubblicazione:

  • datePublished: la data e l'ora in cui la pagina è stata pubblicata per la prima volta
  • dateModified: la data e l'ora dell'ultima modifica della pagina

Queste proprietà vengono indicizzate automaticamente. Puoi utilizzare direttamente queste proprietà della data per arricchire la ricerca senza aggiungerle allo schema. Per aggiungere le date di pubblicazione al tuo sito web, consulta l'articolo Influenzare le date di pubblicazione nella Ricerca Google.

Per capire come includere queste proprietà di data predefinite nelle richieste di ricerca, ad esempio nelle espressioni di filtro e nelle specifiche di boost, consulta Esempio di caso d'uso con una data della pagina dedotta da Google.

Informazioni sui campi data e ora personalizzati in una pagina web

Puoi aggiungere campi data e ora personalizzati alle tue pagine web. Questi tag possono essere utilizzati con l'indicizzazione avanzata quando aggiungi attributi dei dati strutturati personalizzati alldatastoreio dati.
Ecco un esempio che mostra dove aggiungere un meta tag datetime personalizzato denominato lastModified nella tua pagina web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Vertex AI Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Per capire come includere questi tag personalizzati di data e ora nelle richieste di ricerca, ad esempio nelle espressioni di filtro e nelle specifiche di boost, consulta Esempio di caso d'uso con un attributo personalizzato di data e ora.

Informazioni sugli attributi dei dati strutturati personalizzati

Puoi aggiungere gli attributi dei dati strutturati come tag meta e PageMaps alle tue pagine web e utilizzarli per arricchire l'indicizzazione. Per utilizzare gli attributi strutturati personalizzati per l'indicizzazione, devi aggiornare lo schema.

Esempio di caso d'uso per i tag meta

Supponiamo di avere un numero elevato di pagine web pertinenti a vari reparti della tua organizzazione. Puoi utilizzare i tag meta per etichettare le pagine pertinenti per ogni reparto. Puoi quindi utilizzare i tag indicizzati come filtri nelle query. In questo modo, puoi limitare i risultati di ricerca alle pagine web contenenti un'etichetta che corrisponde a uno dei reparti specificati.

Questa procedura può essere riassunta come segue:

  1. Aggiungi i seguenti tag meta a un sottoinsieme delle tue pagine web:
    • Pertinente per i reparti di ingegneria e IT: <meta name="department" content="eng, infotech">
    • Pertinente per i reparti di finanza e RU: <meta name="department" content="finance, human resources">
  2. Esegui nuovamente la scansione delle pagine aggiornate.
  3. Aggiungi department allo schema del datastore come array indicizzabile, come descritto nella sezione Aggiungere attributi di dati strutturati personalizzati allo schema del datastore.

Dopo l'aggiornamento dello schema, l'datastore viene indicizzato nuovamente in modo automatico. Al termine della reindicizzazione, puoi utilizzare il filtro department in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti del reparto finanza eseguono query, i risultati di ricerca possono essere resi più pertinenti per loro con il department filtro impostato su finance.

Tag meta di esempio in una pagina web

Ecco un esempio dei tag meta che puoi aggiungere alla tua pagina web. Questi tag possono essere utilizzati con l'indicizzazione avanzata quando aggiungi attributi di dati strutturati personalizzati alldatastoreio dati.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Vertex AI Search. -->
    <meta name="robots" content="index,follow">

    <!-- Vertex AI Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Vertex AI Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Vertex AI Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Esempio di caso d'uso per PageMap

Supponiamo di avere diverse pagine web contenenti ricette di cucina. Puoi aggiungere i dati PageMap ai contenuti HTML di ogni pagina. Puoi quindi utilizzare i nomi degli attributi PageMap indicizzati come filtri nelle query. Ad esempio, se intendi promuovere o nascondere le pagine web in base alle valutazioni delle ricette, puoi seguire questa procedura:

  1. Aggiungi alle tue pagine web dati PageMap simili ai seguenti:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Esegui nuovamente la scansione delle pagine aggiornate.

  3. Aggiungi rating allo schema del datastore come array indicizzabile, come descritto nella sezione Aggiungere attributi di dati strutturati personalizzati allo schema del datastore.

Dopo l'aggiornamento dello schema, l'datastore viene indicizzato nuovamente in modo automatico. Al termine della reindicizzazione, puoi utilizzare l'attributo rating in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti cercano ricette, metti in evidenza i risultati di ricerca con le valutazioni più alte utilizzando rating come attributo numerico personalizzato.

Esempio di caso d'uso per i dati di schema.org

Supponiamo che tu abbia un sito web di recensioni e che le sue pagine web siano annotate con dati di schema.org in formato JSON-LD all'interno del tag HTML script. Puoi quindi utilizzare le annotazioni indicizzate come filtri nelle query. Ad esempio, se intendi promuovere o nascondere le pagine web in base alle valutazioni aggregate, puoi seguire questa procedura:

  1. Aggiungi alle tue pagine web le annotazioni schema.org per i contenuti delle recensioni simili a quelle riportate di seguito. Per visualizzare altri tipi di modelli schema.org disponibili, consulta la sezione Schemi:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Esegui nuovamente la scansione delle pagine aggiornate.

  3. Aggiungi il percorso a ratingValue allo schema del datastore. Utilizza un identificatore come nome del campo nello schema del datastore, ad esempio rating_value come descritto nella sezione Aggiungere attributi dei dati strutturati personalizzati allo schema del datastore.

Dopo l'aggiornamento dello schema, l'datastore viene indicizzato nuovamente in modo automatico. Al termine della reindicizzazione, puoi utilizzare l'attributo rating_value in un'espressione di filtro per riordinare o filtrare i risultati di ricerca. Ad esempio, quando gli utenti cercano libri, metti in evidenza i risultati di ricerca con le valutazioni più alte utilizzando rating_value come attributo numerico personalizzato.

Prima di iniziare

Prima di aggiornare lo schema del datastore, procedi nel seguente modo:

  • Attiva l'indicizzazione avanzata dei siti web per il datastore. Per saperne di più, consulta Attivare l'indicizzazione avanzata dei siti web.
  • Scopri come funzionano i dati strutturati.
  • Scopri come utilizzare PageMap. Esamina l'elenco degli DataObjects riconosciuti che possono essere aggiunti ai dati PageMap.
  • Scopri come utilizzare i tag meta. Assicurati di non utilizzare meta tag esclusi o non supportati.
  • Assicurati che l'attributo da indicizzare non abbia uno dei seguenti valori:
    • datePublished
    • dateModified
    • siteSearch
  • Tieni presente che dopo aver aggiunto i dati strutturati alle tue pagine web, devi eseguire nuovamente la scansione delle pagine. L'operazione potrebbe richiedere diverse ore.
  • Tieni presente che dopo aver aggiunto gli attributi dei dati strutturati allo schema del datastore, le pagine web nel datastore vengono reindicizzate automaticamente. La reindicizzazione è un'operazione a lunga esecuzione che potrebbe richiedere diverse ore.

Aggiungere attributi dei dati strutturati personalizzati allo schema datastore#39;archivio

Per aggiungere attributi dei dati strutturati personalizzati allo schema del datastore:

  1. Aggiungi tag meta, dati PageMap e dati schema.org a tutte le pagine del tuo sito web che vuoi arricchire con l'indicizzazione dei dati strutturati:

    • Per i tag meta:

      • Ogni tag meta deve avere l'attributo name impostato sul campo che vuoi indicizzare e l'attributo content su una stringa di uno o più valori separati da virgole.
      • Vertex AI Search supporta i tag meta con nomi che corrispondono al pattern [a-zA-Z0-9][a-zA-Z0-9-_]*. Assicurati di non utilizzare meta tag esclusi o non supportati.

        Se il nome del tag meta contiene un carattere speciale, ad esempio i due punti (:), devi scegliere un identificatore diverso nello schema per rappresentarlo e poi specificare il nome esatto del tag meta nel campo siteSearchMetatagName dello schema.

    • Per i dati PageMaps:

      • I dati PageMap devono essere costituiti da DataObjects riconosciuti che contengono nomi di attributi che vuoi indicizzare. I nomi degli attributi all'interno di DataObjects devono essere impostati sul campo da indicizzare.
    • Per i dati schema.org:

      • Le annotazioni devono essere in formato JSON-LD, Microdati o RDFa valido. Per maggiori informazioni, vedi Formati supportati.
  2. Esegui nuovamente la scansione delle pagine web aggiornate.

  3. Visualizza la definizione dello schema per il tuo datastore tramite l'API REST.

  4. Aggiorna lo schema del datastore utilizzando la console Google Cloud o l'API. Se scegli di farlo tramite l'API, scopri come fornire il tuo schema come oggetto JSON.

    1. Aggiungi oggetti per ogni attributo personalizzato che vuoi rendere ricercabile, recuperabile o indicizzabile.
    2. Aggiungi l'attributo personalizzato e imposta il relativo type su array.
    3. Aggiungi il tipo di dati del valore dell'attributo personalizzato.
    4. Specifica l'origine dell'attributo personalizzato in cui è possibile trovarlo nel campo siteSearchStructuredDataSources.
    5. Per i dati di schema.org: specifica il percorso dell'attributo nell'annotazione schema.org a partire dalla stringa _root nel campo siteSearchSchemaOrgPaths.

    Di seguito è riportato un esempio di aggiornamento dello schema per un sito web:

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        }
      },
      {
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Sostituisci quanto segue:

    • CUSTOM_ATTRIBUTE: il valore dell'attributo name. Ad esempio:

      • Per un tag meta definito come <meta name="department" content="eng, infotech">, utilizza department
      • Per un attributo PageMap definito come <Attribute name="rating">4.9</Attribute>, utilizza rating

      A volte il nome del tag meta che vuoi aggiungere allo schema non segue il pattern [a-zA-Z0-9][a-zA-Z0-9-_]* e contiene caratteri speciali, ad esempio i due punti :. In questi casi, specifica un attributo personalizzato rappresentativo del nome del tag meta e poi specifica il nome esatto del tag meta nel campo siteSearchMetatagName. Ad esempio, se il nome del tag meta è og:updated_time, utilizza og_updated_time come identificatore nel campo CUSTOM_ATTRIBUTE e utilizza og:updated_time nel campo METATAG_NAME.

    • DATA_TYPE: il tipo di dati dell'attributo name. Deve essere una stringa, un numero o una data e ora. Ad esempio:

      • Per un tag meta definito come <meta name="department" content="eng, infotech">, utilizza string
      • Per un attributo PageMap definito come <Attribute name="rating">4.9</Attribute>, utilizza number
      • Per un attributo PageMap definito come <Attribute name="lastPublished">2015-01-01</Attribute>, utilizza datetime

      Per ulteriori informazioni, vedi FieldType.

    • METATAG_NAME: il nome esatto del tag meta come si trova nella pagina web. Questo campo è utile quando il nome del tag meta che vuoi aggiungere allo schema non segue il pattern [a-zA-Z0-9][a-zA-Z0-9-_]* e contiene caratteri speciali, ad esempio i due punti :. In questi casi, specifica un attributo personalizzato rappresentativo del nome del tag meta nel campo CUSTOM_ATTRIBUTE e poi specifica il nome esatto del tag meta nel campo siteSearchMetatagName. Ad esempio, se il nome del tag meta è og:updated_time, utilizza og_updated_time come identificatore nel campo CUSTOM_ATTRIBUTE e utilizza og:updated_time nel campo METATAG_NAME. Quando aggiungi questo campo per aggiornare lo schema, devi utilizzare l'endpoint v1alpha anziché l'endpoint v1 per chiamare il metodo schema.

    • STRUCTURED_DATA_SOURCE_N: un array composto da una o entrambe le seguenti origini di dati strutturati in cui è possibile trovare l'attributo CUSTOM_ATTRIBUTE:

      • Se l'attributo personalizzato può essere trovato come tag meta, specifica METATAGS
      • Se l'attributo personalizzato può essere trovato come attributo PageMap, specifica PAGEMAP
      • Se l'attributo personalizzato può essere trovato come dati schema.org, specifica SCHEMA_ORG
      • Se il campo siteSearchStructuredDataSources è assente o lasciato vuoto, i valori di tutte e tre le origini dati vengono uniti in un array.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: un identificatore personalizzato per indicare il campo schema.org. Non deve corrispondere esattamente al nome del campo nell'annotazione schema.org sulla tua pagina web. Ad esempio, se il percorso del campo è _root.nutrition.calories, l'identificatore può essere calorific_value o nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: il tipo di dati del campo schema.org. Deve essere una stringa, un numero o una data/ora. Ad esempio:

      • Per un campo schema.org definito come "calorie":"240 calorie", utilizza string
      • Per un campo schema.org definito come "calorie": 240, utilizza number
      • Per un campo schema.org definito come "foundingDate": "1991-05-01", utilizza datetime

      Per ulteriori informazioni, vedi FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: il percorso di un singolo campo nel campo schema.org a cui è necessario accedere. Viene specificato utilizzando separatori con punti dopo ogni livello nidificato. Devi specificare il percorso completo necessario per accedere al campo obbligatorio. Ad esempio, se un campo ratingValue è nidificato nel campo aggregateRating, puoi specificare il percorso come _root.aggregateRating.ratingValue.

Dopo aver aggiornato lo schema del sito web, il sito viene reindicizzato automaticamente. Si tratta di un'operazione a lunga esecuzione che può richiedere diverse ore.

Passaggi successivi

Utilizza i metadati indicizzati per quanto segue: