Document AI utilizza Enterprise Knowledge Graph per normalizzare e arricchire i risultati dell'estrazione delle entità (per i campi supportati). Ad esempio, gli indirizzi 123 Main St Apt 1 e 123 Main street # 1 potrebbero essere normalizzati nello stesso indirizzo standardizzato.
Per ogni campo supportato, Document AI restituisce anche un normalizedValue oltre al campo estratto non elaborato, normalizzando il testo letterale. Contiene i dati in un formato standardizzato per ridurre la post-elaborazione.
La maggior parte dei dati appartiene a una delle seguenti categorie:
- Denaro
- Data
- Timestamp
- Indirizzo
- Booleano
- Numero intero
- Numero in virgola mobile
Esempio di risposta
I valori arricchiti si trovano nel campo entities.normalizedValue come mostrato nel seguente esempio troncato:
{ "entities": [ { "textAnchor": { "textSegments": [ ... ], "content": "Google Singapore" }, "type": "employer_name", "mentionText": "Google Singapore", "confidence": 0.69933707, "pageAnchor": { "pageRefs": [ { "boundingPoly": { "normalizedVertices": [ ... ] } } ] }, "id": "9", "normalizedValue": { "text": "Google Asia Pacific, Singapore" } } ] } Nell'esempio, il employer_name originale "Google Singapore" è stato normalizzato in "Google Asia Pacific, Singapore".
Nella console Google Cloud , i campi arricchiti e normalizzati sono annotati con G. Ad esempio:
Processori supportati
Di seguito sono riportati i processori e i campi che supportano l'arricchimento delle entità.
| Processori | Campi arricchiti | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Analizzatore estratto conto bancario
|
| ||||||||||||
Analizzatore W2
|
| ||||||||||||
Analizzatore busta paga
|
| ||||||||||||
Analizzatore sintattico delle spese
|
| ||||||||||||
Analizzatore sintattico delle fatture
|
|