本页介绍了适用于通用应用的 Vertex AI Search 的功能并进行了列出。本页面还提供了指向可用功能、教程和核对清单的链接,以便您开始使用 Vertex AI Search 构建通用应用。
什么是适用于通用应用的 Vertex AI Search?
适用于通用应用的 Vertex AI Search 是一款功能强大的 Google 品质搜索和内容发现引擎,可集成到包含网站数据和其他结构化或非结构化数据的应用中。该搜索功能不仅仅局限于基本关键字匹配,还会使用 AI 技术提供高度相关的结果、提供个性化的浏览和搜索体验,并根据您的数据生成 AI 回答。
您可以使用通用搜索应用来搜索公共网站上的数据,或者搜索结构化或非结构化格式的数据,而不受行业限制。此外,Vertex AI Search 还提供其他特定于行业的搜索和推荐应用。
- 如需了解媒体数据,请参阅媒体搜索和推荐简介。
- 如需了解商务和零售数据,请参阅 Vertex AI Search 商务解决方案。
- 如需了解医疗保健数据,请参阅医疗保健搜索核对清单。
主要功能
Vertex AI Search 的主要功能如下:
- 高质量搜索:利用 Google 的搜索专业知识来理解用户意图,即使是复杂的查询和自然语言查询也是如此。它结合了关键字搜索和语义搜索,以提供最优质的搜索结果。
- 个性化浏览:无需用户输入特定搜索查询,即可提供个性化结果,并根据用户的情境和导航模式提供个性化信息流。非常适合用于查看个性化类别页面和首页动态的发现体验。
- 数据源:适用于以下各种数据源:
- 网站:为您的公开网站编制索引,并使用高级功能,例如使用网站中的结构化数据丰富索引。
- 结构化数据:搜索以指定格式整理的数据,例如数据库、Cloud Storage 中的 JSON 文件或 BigQuery 表(例如酒店目录、房地产信息和餐厅目录)。
- 非结构化数据:搜索存储在 Cloud Storage 或 BigQuery 中的 PDF、HTML 文件和 TXT 文件等文档,或 JPEG 和 PNG 文件等图片文件。
- 混合搜索:在多个数据存储区中搜索,这些数据存储区会混合上述数据源中的数据。例如,您可以创建一个搜索应用,并将其连接到网站数据存储区和文档数据存储区。这样,用户就可以一次搜索您的所有内容。
- 以数据为依据的 AI 回答生成:生成以您的数据为依据的 AI 回答,并附上来源文档的引用。您还可以提出后续问题和相关查询。
- 个性化:通过从用户事件(例如点击和转化)中捕获的用户互动中学习,不断改进效果和排名。
- 自定义:提供多种方式来调整和配置搜索和浏览体验,以满足您的业务需求。
概览
下图显示了通用搜索的关键组件及其协同工作方式:
Vertex AI Search 的宽泛搜索组件可以如下所述:
- 数据存储区:来自不同数据源的内容存储在 Vertex AI Search 数据存储区中。来源数据可以是公开网站数据,也可以是结构化数据和非结构化数据。
- 数据处理和索引编制:Vertex AI Search 会理解并编制您的数据索引,从而创建可搜索和检索的表示法。这包括以下内容:
- 关键字提取:识别和生成检索正确信息所需的重要字词。
- 使用嵌入进行语义理解:创建向量嵌入以捕获内容的含义。
- 元数据处理:使用文档的结构化数据或元数据处理文档。例如,酒店目录中的地址、网页元数据中的修改日期或创建日期。
- 高级文档解析:使用 OCR 或布局解析来理解文档结构,并为表格、图片和图表等高级信息添加注释。
- 搜索应用:宽泛搜索的核心是搜索应用,它会连接到一个或多个数据存储区,这些数据存储区会从不同的来源提取数据。对于混合搜索,数据是通过连接器提取的。您可以在应用级别配置搜索和浏览行为。
- 用户查询:用户为从您的应用检索信息而输入的信息,可分为两类:
- 搜索查询:用户使用文本或图片输入定位搜索查询。文本搜索功能由自动补全功能提供支持。
- 导航查询或浏览:无需输入特定查询,即可进行探索性搜索,以获取个性化相关内容。该功能依托用户的过往活动记录和其他信号(例如当前类别页面和位置)提供支持。
- 检索和排名:检索和排名结果包含多个子组件:
- 搜索查询理解:Vertex AI Search 会使用以下信息分析搜索查询:
- 自然语言处理:用于理解意图。
- 具有自然语言理解功能的过滤条件:将自然语言查询中的地理位置转换为地理坐标,并将自然语言查询中的条件转换为过滤条件。
- 知识图谱:用于消除字词歧义并扩展搜索范围。
- 可选功能:包括拼写检查、同义词和重述查询。
- 检索:Vertex AI Search 会根据以下方法查找相关性最高的文档或数据块:
- 搜索的关键字匹配:基于字词的传统搜索。
- 语义搜索:使用嵌入来查找概念上相似的内容。
- 过滤:应用您配置的任何过滤条件,例如日期、类别或相关性得分。
- 排名:Vertex AI Search 会根据以下因素对结果进行排名:
- 相关性:搜索期间结合使用关键字匹配和语义匹配。
- 网站搜索的网络信号:网页质量和热门程度等因素。
- 提升和掩埋:用于提升或降级特定结果的自定义规则。
- 个性化:从用户互动中学习。此为可选操作,但强烈建议执行。
- 排序:应用排序说明,例如按日期排序。
- 搜索查询理解:Vertex AI Search 会使用以下信息分析搜索查询:
- 结果和答案生成:
- 搜索结果:系统会返回一个按相关性排序的相关文档或文本块列表,其中包含摘要、提取式回答和提取式片段等可选功能。您可以借助投放控件配置要投放的结果。您还可以优化搜索结果。
- 回答生成:系统会根据前沿且相关的结果生成简洁的综合回答,并附上引用。这会使用高级 LLM 功能。
- 个性化浏览:系统会返回一组预计最有可能吸引用户互动或促成转化的个性化文档。此预测功能使用可从用户互动中学习的高级模型。
- 用户事件:用于跟踪用户互动(例如点击和浏览)的跟踪器,可帮助 Vertex AI Search 学习和改进搜索和个性化功能。用户事件有助于优化业务 KPI,包括互动度、转化次数和收入。
主要功能和配置
通用搜索应用可以使用以下功能和配置。在每个阶段,您都可以自定义这些设置,以便为用户提供最佳结果。
下面详细介绍了可用的配置:
- 数据准备:
- 结构化数据的架构:使用字段名称和类型定义数据的结构。您可以提供自己的架构,也可以让 Vertex AI Search 自动检测架构。如需了解详情,请参阅提供或自动检测架构。
- 元数据:向结构化或非结构化文档和网页添加元数据,以改进搜索功能并启用过滤功能。如需了解详情,请参阅以下内容:
- 分块:将文档拆分成更小的部分,以提高相关性并便于 LLM 处理。如需了解详情,请参阅解析和分块文档。
- 解析:使用以下任一选项提取文本、图片和其他注释:
- 数字解析器,用于提取机器可读文本。
- 适用于 PDF 文件的 OCR 解析器,用于从扫描的 PDF 文件或图片中提取文本。
- 布局解析器:用于检测文档结构并为图片和图表添加注释,以便更好地分块和理解文档,这对复杂文档和 RAG 应用来说是必不可少的。
- 自定义嵌入:上传您自己准备的向量嵌入。 如需了解详情,请参阅使用自定义嵌入。
- 搜索和浏览配置:
- 字段设置:控制字段的搜索和回答生成配置方式,例如可搜索、可检索或可编入索引。如需了解详情,请参阅配置字段设置。
- 自动补全:在用户输入内容时提供查询建议。如需了解详情,请参阅配置自动补全。
- 投放控件:创建规则来修改搜索行为。如需了解详情,请参阅为搜索广告配置投放控制。
- 提升/掩埋:根据过滤条件提升或降级特定结果。
- 过滤条件:根据过滤条件移除结果。
- 同义词:将某些字词视为等同。
- 重定向:针对特定查询将用户定向到特定网址。
- 宣传控件:宣传 Vertex AI Search 数据存储区内外的结果。
- 搜索调整(预览版):根据查询和文本摘要对进一步训练模型。如需了解详情,请参阅利用搜索调参,提高搜索结果的准确性。
- 网站专用配置:
- 高级索引编制:如需了解详情,请参阅启用高级网站索引编制。
- 刷新网页:您可以使用自动或手动刷新定期刷新网站中的文档,也可以选择基于站点地图的刷新。
- 检索:配置以下检索方法:
- 排名:提升或掩埋检索到的结果、对网页搜索结果进行排序,或对结构化数据存储区中的结果进行排序。
- 搜索结果:使用 Vertex AI Search 执行以下操作:
- 获取答案和后续跟进。
- 获取搜索摘要。
- 获取摘要和提取式内容。
- 生成需要用户事件的个性化浏览体验
- 用户事件:记录用户互动(例如点击和查看),以改进搜索和个性化功能。如需了解详情,请参阅用户事件简介。