ดูโครงสร้างข้อมูล CrUX ใน BigQuery
บทนำ
ข้อมูลดิบที่อยู่เบื้องหลังรายงานประสบการณ์ของผู้ใช้ Chrome (CrUX) พร้อมใช้งานใน BigQuery ซึ่งเป็นฐานข้อมูลที่โฮสต์ใน Google Cloud
CrUX ใน BigQuery ช่วยให้ผู้ใช้ค้นหาชุดข้อมูลทั้งหมดได้โดยตรงตั้งแต่ปี 2017 เช่น เพื่อวิเคราะห์แนวโน้ม เปรียบเทียบเทคโนโลยีเว็บ และเปรียบเทียบโดเมน
ข้อมูลจะจัดโครงสร้างตามการเผยแพร่รายเดือน รวมถึงตารางสรุปจำนวนหนึ่งเพื่อให้เข้าถึงข้อมูลได้เร็วขึ้นสำหรับการค้นหาข้อมูล
ข้อมูล BigQuery เป็นพื้นฐานของแดชบอร์ด CrUX ซึ่งช่วยให้คุณเห็นภาพข้อมูลนี้ได้โดยไม่ต้องเขียนการค้นหา SQL
เข้าถึงชุดข้อมูล
การใช้ BigQuery ต้องมีบัญชี Google Cloud และความรู้พื้นฐานเกี่ยวกับ SQL ชุดข้อมูล CrUX ใน BigQuery สามารถเข้าถึงและสำรวจได้ฟรีตามขีดจำกัดของแพ็กเกจรุ่นฟรี ซึ่ง BigQuery จะต่ออายุให้ทุกเดือน นอกจากนี้ ผู้ใช้ Google Cloud รายใหม่ยังอาจมีสิทธิ์ได้รับเครดิตลงชื่อสมัครใช้เพื่อครอบคลุมค่าใช้จ่ายที่เกินระดับฟรี โปรดทราบว่าต้องระบุบัตรเครดิตสำหรับโปรเจ็กต์ Google Cloud โปรดดูทำไมฉันจึงต้องระบุบัตรเครดิต
หากใช้ BigQuery เป็นครั้งแรก ให้ทำตามขั้นตอนต่อไปนี้เพื่อตั้งค่าโปรเจ็กต์
- ไปที่สร้างโปรเจ็กต์ใน Google Cloud Console
- ตั้งชื่อโปรเจ็กต์ใหม่ เช่น "รายงาน UX ของ Chrome ของฉัน" แล้วคลิกสร้าง
- ระบุข้อมูลสำหรับการเรียกเก็บเงินหากได้รับข้อความแจ้ง
- ไปที่ชุดข้อมูล CrUX ใน BigQuery
ตอนนี้คุณก็พร้อมที่จะเริ่มค้นหาชุดข้อมูลแล้ว
การจัดระเบียบโปรเจ็กต์
ข้อมูล CrUX ใน BigQuery จะเผยแพร่ในวันอังคารที่ 2 ของเดือนถัดไป แต่ละเดือนจะเผยแพร่เป็นตารางใหม่ในส่วนchrome-ux-report.all นอกจากนี้ ยังมีตารางที่สร้างขึ้นจำนวนหนึ่งซึ่งแสดงสถิติสรุปสำหรับแต่ละเดือน
- `chrome-ux-report
สคีมาของตารางโดยละเอียด
ตารางดิบสำหรับแต่ละประเทศและallชุดข้อมูลจะแสดงตามปีและเดือน
ตารางข้อมูลดิบ
ตารางดิบมีสคีมาต่อไปนี้
origineffective_connection_typeform_factorfirst_paintfirst_contentful_paintlargest_contentful_paintdom_content_loadedonloadlayout_instabilitycumulative_layout_shift
interaction_to_next_paintround_trip_timenavigation_typesnavigatenavigate_cachereloadrestoreback_forwardback_forward_cacheprerender
experimentalpermissionnotifications
time_to_first_bytepopularity
สคีมาของตารางที่เป็นรูปธรรม
เรามีตารางที่สร้างขึ้นเพื่อช่วยให้เข้าถึงข้อมูลสรุปตามมิติข้อมูลสําคัญจํานวนหนึ่งได้ง่ายขึ้น ไม่มีการระบุฮิสโทแกรม แต่จะรวบรวมข้อมูลประสิทธิภาพเป็นเศษส่วนตามการประเมินประสิทธิภาพและค่าเปอร์เซ็นไทล์ที่ 75 ตัวอย่างนี้แสดงชุดแถวตัวอย่างจากตาราง metrics_summary
| ปปปปดด | origin | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
|---|---|---|---|---|---|
| 202204 | https://example.com | 0.9056 | 0.0635 | 0.0301 | 1600 |
| 202203 | https://example.com | 0.9209 | 0.052 | 0.0274 | 1400 |
| 202202 | https://example.com | 0.9169 | 0.0545 | 0.0284 | 1,500 |
| 202201 | https://example.com | 0.9072 | 0.0626 | 0.0298 | 1,500 |
ซึ่งแสดงให้เห็นว่าในชุดข้อมูล 202204 ประสบการณ์ของผู้ใช้จริง 90.56% ใน https://example.com เป็นไปตามเกณฑ์สำหรับ LCP ที่ดี และค่า LCP เปอร์เซ็นไทล์ที่ 75 แบบคร่าวๆ คือ 1,600 มิลลิวินาที ซึ่งช้ากว่าเดือนก่อนๆ เล็กน้อย
ระบบจะจัดเตรียมตารางที่สร้างขึ้น 4 ตารางดังนี้
metrics_summary- เมตริกสําคัญตามเดือนและแหล่งที่มา
device_summary- เมตริกหลักตามเดือน ต้นทาง และประเภทอุปกรณ์
country_summary- เมตริกสําคัญตามเดือน แหล่งที่มา ประเภทอุปกรณ์ และประเทศ
origin_summary- รายการต้นทางทั้งหมดที่รวมอยู่ในชุดข้อมูล
metrics_summary
ตาราง metrics_summary มีสถิติสรุปสำหรับแต่ละต้นทางและชุดข้อมูลรายเดือนแต่ละชุด
yyyymm- เดือนของระยะเวลาการเก็บรวบรวมข้อมูล
origin- URL ของต้นทางของเว็บไซต์
rank- การจัดอันดับความนิยมแบบคร่าวๆ (ข้อมูล ณ มีนาคม 2021)
[small|medium|large]_cls- เศษส่วนของการเข้าชมตามเกณฑ์ CLS
[fast|avg|slow]_<metric>- เศษส่วนของการเข้าชมตามเกณฑ์ประสิทธิภาพ
[low|medium|high]_rtt- เศษส่วนของการเข้าชมตามเกณฑ์ RTT
p75_<metric>- ค่าเปอร์เซ็นไทล์ที่ 75 ของเมตริกประสิทธิภาพ (มิลลิวินาที)
notification_permission_[accept|deny|ignore|dismiss]- เศษส่วนของลักษณะการทำงานของสิทธิ์การแจ้งเตือน
[desktop|phone|tablet]Density- สัดส่วนของการเข้าชมตามรูปแบบของอุปกรณ์
[_4G|_3G|_2G|slow2G|offline]Density- สัดส่วนของการเข้าชมตามประเภทการเชื่อมต่อที่มีประสิทธิภาพ (คำนวณจาก
rttฮิสโทแกรมตั้งแต่เดือนกุมภาพันธ์ 2025 โดยไม่มีการเข้าชมแบบออฟไลน์) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]- เศษส่วนของประเภทการนำทาง
device_summary
ตาราง device_summary มีสถิติรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกจากคอลัมน์ metrics_summary แล้ว ยังมีข้อมูลต่อไปนี้
device- รูปแบบ ของอุปกรณ์
country_summary
ตาราง country_summary มีสถิติรวมตามเดือน ต้นทาง ประเทศ และอุปกรณ์ นอกจากคอลัมน์ metrics_summary แล้ว ยังมีข้อมูลต่อไปนี้
country_code- รหัสประเทศ 2 ตัวอักษร
device- รูปแบบ ของอุปกรณ์
origin_summary
ตาราง origin_summary มีรายการต้นทางทั้งหมดในชุดข้อมูล CrUX โดยจะอัปเดตทุกเดือนด้วยรายการต้นทางล่าสุดในชุดข้อมูล และมีคอลัมน์เดียวคือ origin
ชุดข้อมูลเวอร์ชันทดลอง
ตารางในชุดข้อมูลทดลองเป็นสำเนาที่ตรงกันของตาราง YYYYMM เริ่มต้น แต่ใช้ฟีเจอร์ BigQuery ที่ใหม่กว่าและขั้นสูงกว่า เช่น การแบ่งพาร์ติชันและการจัดกลุ่ม ซึ่งช่วยให้คุณเขียนคำค้นหาได้เร็วขึ้น ง่ายขึ้น และถูกลง
country
experimental.country ชุดข้อมูลประกอบด้วยข้อมูลที่รวบรวมจากชุดข้อมูล country_CC โดยมีคอลัมน์ yyyymm เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมาจะเหมือนกับตารางดิบทุกประการ โดยมีคอลัมน์วันที่และ country_code เพิ่มเข้ามา ซึ่งจะช่วยให้เรียกใช้การเปรียบเทียบระดับประเทศในช่วงระยะเวลาหนึ่งได้โดยไม่ต้องรวมตารางรายเดือน
global
experimental.global ชุดข้อมูลประกอบด้วยข้อมูลรวมจากชุดข้อมูล all โดยมีคอลัมน์ yyyymm เพิ่มเติมสำหรับวันที่ของชุดข้อมูล สคีมาจะเหมือนกับตารางดิบทุกประการ โดยจะเพิ่มวันที่เพื่อให้เรียกใช้การเปรียบเทียบเมื่อเวลาผ่านไปได้โดยไม่ต้องรวมตารางรายเดือน