宽泛搜索简介

本页介绍了适用于通用应用的 Vertex AI Search 的功能并进行了列出。本页面还提供了指向可用功能、教程和核对清单的链接,以便您开始使用 Vertex AI Search 构建通用应用。

什么是适用于通用应用的 Vertex AI Search?

适用于通用应用的 Vertex AI Search 是一款功能强大的 Google 品质搜索和内容发现引擎,可集成到包含网站数据和其他结构化或非结构化数据的应用中。该搜索功能不仅仅局限于基本关键字匹配,还会使用 AI 技术提供高度相关的结果、提供个性化的浏览和搜索体验,并根据您的数据生成 AI 回答。

您可以使用通用搜索应用来搜索公共网站上的数据,或者搜索结构化或非结构化格式的数据,而不受行业限制。此外,Vertex AI Search 还提供其他特定于行业的搜索和推荐应用。

主要功能

Vertex AI Search 的主要功能如下:

  • 高质量搜索:利用 Google 的搜索专业知识来理解用户意图,即使是复杂的查询和自然语言查询也是如此。它结合了关键字搜索和语义搜索,以提供最优质的搜索结果。
  • 个性化浏览:无需用户输入特定搜索查询,即可提供个性化结果,并根据用户的情境和导航模式提供个性化信息流。非常适合用于查看个性化类别页面和首页动态的发现体验。
  • 数据源:适用于以下各种数据源:
    • 网站:为您的公开网站编制索引,并使用高级功能,例如使用网站中的结构化数据丰富索引。
    • 结构化数据:搜索以指定格式整理的数据,例如数据库、Cloud Storage 中的 JSON 文件或 BigQuery 表(例如酒店目录、房地产信息和餐厅目录)。
    • 非结构化数据:搜索存储在 Cloud Storage 或 BigQuery 中的 PDF、HTML 文件和 TXT 文件等文档,或 JPEG 和 PNG 文件等图片文件。
    • 混合搜索:在多个数据存储区中搜索,这些数据存储区会混合上述数据源中的数据。例如,您可以创建一个搜索应用,并将其连接到网站数据存储区和文档数据存储区。这样,用户就可以一次搜索您的所有内容。
  • 以数据为依据的 AI 回答生成:生成以您的数据为依据的 AI 回答,并附上来源文档的引用。您还可以提出后续问题和相关查询。
  • 个性化:通过从用户事件(例如点击和转化)中捕获的用户互动中学习,不断改进效果和排名。
  • 自定义:提供多种方式来调整和配置搜索和浏览体验,以满足您的业务需求。

概览

下图显示了通用搜索的关键组件及其协同工作方式:

通用自定义搜索的关键组成部分
图 1:宽泛搜索的不同组成部分

Vertex AI Search 的宽泛搜索组件可以如下所述:

  • 数据存储区:来自不同数据源的内容存储在 Vertex AI Search 数据存储区中。来源数据可以是公开网站数据,也可以是结构化数据和非结构化数据。
  • 数据处理和索引编制:Vertex AI Search 会理解并编制您的数据索引,从而创建可搜索和检索的表示法。这包括以下内容:
    • 关键字提取:识别和生成检索正确信息所需的重要字词。
    • 使用嵌入进行语义理解:创建向量嵌入以捕获内容的含义。
    • 元数据处理:使用文档的结构化数据或元数据处理文档。例如,酒店目录中的地址、网页元数据中的修改日期或创建日期。
    • 高级文档解析:使用 OCR 或布局解析来理解文档结构,并为表格、图片和图表等高级信息添加注释。
  • 搜索应用:宽泛搜索的核心是搜索应用,它会连接到一个或多个数据存储区,这些数据存储区会从不同的来源提取数据。对于混合搜索,数据是通过连接器提取的。您可以在应用级别配置搜索和浏览行为。
  • 用户查询:用户为从您的应用检索信息而输入的信息,可分为两类:
    • 搜索查询:用户使用文本或图片输入定位搜索查询。文本搜索功能由自动补全功能提供支持。
    • 导航查询或浏览:无需输入特定查询,即可进行探索性搜索,以获取个性化相关内容。该功能依托用户的过往活动记录和其他信号(例如当前类别页面和位置)提供支持。
  • 检索和排名:检索和排名结果包含多个子组件:
    • 搜索查询理解:Vertex AI Search 会使用以下信息分析搜索查询:
      • 自然语言处理:用于理解意图。
      • 具有自然语言理解功能的过滤条件:将自然语言查询中的地理位置转换为地理坐标,并将自然语言查询中的条件转换为过滤条件。
      • 知识图谱:用于消除字词歧义并扩展搜索范围。
      • 可选功能:包括拼写检查、同义词和重述查询。
    • 检索:Vertex AI Search 会根据以下方法查找相关性最高的文档或数据块:
      • 搜索的关键字匹配:基于字词的传统搜索。
      • 语义搜索:使用嵌入来查找概念上相似的内容。
      • 过滤:应用您配置的任何过滤条件,例如日期、类别或相关性得分。
    • 排名:Vertex AI Search 会根据以下因素对结果进行排名:
      • 相关性:搜索期间结合使用关键字匹配和语义匹配。
      • 网站搜索的网络信号:网页质量和热门程度等因素。
      • 提升和掩埋:用于提升或降级特定结果的自定义规则。
      • 个性化:从用户互动中学习。此为可选操作,但强烈建议执行。
      • 排序:应用排序说明,例如按日期排序。
  • 结果和答案生成
    • 搜索结果:系统会返回一个按相关性排序的相关文档或文本块列表,其中包含摘要、提取式回答和提取式片段等可选功能。您可以借助投放控件配置要投放的结果。您还可以优化搜索结果。
    • 回答生成:系统会根据前沿且相关的结果生成简洁的综合回答,并附上引用。这会使用高级 LLM 功能。
    • 个性化浏览:系统会返回一组预计最有可能吸引用户互动或促成转化的个性化文档。此预测功能使用可从用户互动中学习的高级模型。
  • 用户事件:用于跟踪用户互动(例如点击和浏览)的跟踪器,可帮助 Vertex AI Search 学习和改进搜索和个性化功能。用户事件有助于优化业务 KPI,包括互动度、转化次数和收入。

主要功能和配置

通用搜索应用可以使用以下功能和配置。在每个阶段,您都可以自定义这些设置,以便为用户提供最佳结果。

通用自定义搜索的关键组成部分
图 2:宽泛搜索中的关键功能和配置

下面详细介绍了可用的配置:

后续步骤