Tìm hiểu cách dữ liệu CrUX được cấu trúc trên BigQuery.
Giới thiệu
Dữ liệu thô đằng sau Báo cáo trải nghiệm người dùng trên Chrome (CrUX) có trên BigQuery, một cơ sở dữ liệu được lưu trữ trên Google Cloud.
CrUX trên BigQuery cho phép người dùng trực tiếp truy vấn toàn bộ tập dữ liệu từ năm 2017, chẳng hạn như để phân tích xu hướng, so sánh các công nghệ web và đo điểm chuẩn các miền.
Dữ liệu được cấu trúc theo bản phát hành hằng tháng, cũng như một số bảng tóm tắt để cung cấp quyền truy cập nhanh hơn cho việc truy vấn dữ liệu.
Dữ liệu BigQuery là cơ sở của Trang tổng quan CrUX, giúp bạn hình dung dữ liệu này mà không cần viết truy vấn SQL.
Truy cập vào tập dữ liệu
Để sử dụng BigQuery, bạn cần có tài khoản Google Cloud và kiến thức cơ bản về SQL. Bạn có thể truy cập và khám phá tập dữ liệu CrUX trên BigQuery miễn phí trong phạm vi cấp miễn phí. Cấp này được BigQuery cung cấp và gia hạn hằng tháng. Ngoài ra, người dùng mới của Google Cloud có thể đủ điều kiện nhận khoản tín dụng đăng ký để chi trả các khoản phí ngoài cấp miễn phí. Xin lưu ý rằng bạn phải cung cấp thẻ tín dụng cho dự án Google Cloud. Hãy xem phần Tại sao tôi cần cung cấp thẻ tín dụng?.
Nếu đây là lần đầu tiên bạn sử dụng BigQuery, hãy làm theo các bước sau để thiết lập một dự án:
- Chuyển đến phần Tạo dự án trên Google Cloud Console.
- Đặt tên cho dự án mới của bạn, chẳng hạn như "Báo cáo trải nghiệm người dùng Chrome của tôi", rồi nhấp vào Tạo.
- Cung cấp thông tin thanh toán của bạn nếu được nhắc.
- Chuyển đến tập dữ liệu CrUX trên BigQuery
Giờ đây, bạn đã sẵn sàng bắt đầu truy vấn tập dữ liệu.
Sắp xếp dự án
Dữ liệu CrUX trên BigQuery được phát hành vào thứ Ba thứ hai của tháng tiếp theo. Mỗi tháng sẽ được phát hành dưới dạng một bảng mới trong chrome-ux-report.all
. Ngoài ra, còn có một số bảng cụ thể hoá cung cấp số liệu thống kê tóm tắt cho từng tháng.
- `chrome-ux-report
Giản đồ bảng chi tiết
Các bảng thô cho từng quốc gia và tập dữ liệu all
được cung cấp theo năm và tháng.
Bảng thô
Các bảng thô có giản đồ sau:
origin
effective_connection_type
form_factor
first_paint
first_contentful_paint
largest_contentful_paint
dom_content_loaded
onload
layout_instability
cumulative_layout_shift
interaction_to_next_paint
round_trip_time
navigation_types
navigate
navigate_cache
reload
restore
back_forward
back_forward_cache
prerender
experimental
permission
notifications
time_to_first_byte
popularity
Giản đồ bảng cụ thể hoá
Các bảng cụ thể được cung cấp để giúp bạn dễ dàng truy cập vào dữ liệu tóm tắt theo một số phương diện chính. Không có biểu đồ tần suất nào được cung cấp, thay vào đó, dữ liệu hiệu suất được tổng hợp thành các phân số theo đánh giá hiệu suất và giá trị ở phân vị thứ 75. Một tập hợp các hàng ví dụ trong bảng metrics_summary
được minh hoạ trong ví dụ này:
yyyymm | nguồn gốc | fast_lcp | avg_lcp | slow_lcp | p75_lcp |
---|---|---|---|---|---|
202204 | https://example.com | 0,9056 | 0,0635 | 0,0301 | 1600 |
202203 | https://example.com | 0,9209 | 0,052 | 0,0274 | 1400 |
202202 | https://example.com | 0,9169 | 0,0545 | 0,0284 | 1500 |
202201 | https://example.com | 0,9072 | 0,0626 | 0,0298 | 1500 |
Điều này cho thấy trong tập dữ liệu 202204, 90,56% trải nghiệm của người dùng thực trên https://example.com
đáp ứng tiêu chí về LCP tốt và giá trị LCP ở phân vị thứ 75 là 1.600 mili giây. Tốc độ này chậm hơn một chút so với những tháng trước.
Có 4 bảng cụ thể hoá:
metrics_summary
- các chỉ số chính theo tháng và nguồn gốc
device_summary
- các chỉ số chính theo tháng, nguồn gốc và loại thiết bị
country_summary
- các chỉ số chính theo tháng, nguồn gốc, loại thiết bị và quốc gia
origin_summary
- danh sách tất cả các nguồn có trong tập dữ liệu
metrics_summary
Bảng metrics_summary
chứa số liệu thống kê tóm tắt cho từng nguồn và từng tập dữ liệu hằng tháng:
yyyymm
- Tháng của khoảng thời gian thu thập dữ liệu
origin
- URL của nguồn gốc trang web
rank
- Bảng xếp hạng mức độ phổ biến tương đối (tính đến tháng 3 năm 2021)
[small|medium|large]_cls
- phân số lưu lượng truy cập theo ngưỡng CLS
[fast|avg|slow]_<metric>
- phân số lưu lượng truy cập theo ngưỡng hiệu suất
[low|medium|high]_rtt
- phân số lưu lượng truy cập theo ngưỡng RTT
p75_<metric>
- Giá trị phân vị thứ 75 của các chỉ số hiệu suất (mili giây)
notification_permission_[accept|deny|ignore|dismiss]
- phân số hành vi liên quan đến quyền gửi thông báo
[desktop|phone|tablet]Density
- phân số lưu lượng truy cập theo kiểu dáng thiết bị
[_4G|_3G|_2G|slow2G|offline]Density
- phân số lưu lượng truy cập theo loại kết nối hiệu quả (tính từ biểu đồ
rtt
từ tháng 2 năm 2025, không có dữ liệu ngoại tuyến) navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
- phân số của các loại điều hướng
device_summary
Bảng device_summary
chứa số liệu thống kê tổng hợp theo tháng, nguồn, quốc gia và thiết bị. Ngoài các cột metrics_summary
, còn có:
device
- Hệ số hình dạng của thiết bị
country_summary
Bảng country_summary
chứa số liệu thống kê tổng hợp theo tháng, nguồn, quốc gia và thiết bị. Ngoài các cột metrics_summary
, còn có:
country_code
- Mã quốc gia gồm 2 chữ cái
device
- Hệ số hình dạng của thiết bị
origin_summary
Bảng origin_summary
chứa danh sách tất cả các nguồn trong tập dữ liệu CrUX; bảng này được cập nhật hằng tháng bằng danh sách nguồn mới nhất trong tập dữ liệu và có một cột duy nhất: origin
.
Tập dữ liệu thử nghiệm
Các bảng trong tập dữ liệu thử nghiệm là bản sao chính xác của các bảng YYYYMM
mặc định, nhưng chúng sử dụng các tính năng mới hơn và nâng cao hơn của BigQuery như phân vùng và phân cụm. Nhờ đó, bạn có thể viết các truy vấn nhanh hơn, đơn giản hơn và rẻ hơn.
country
Tập dữ liệu experimental.country
chứa dữ liệu tổng hợp từ các tập dữ liệu country_CC
, có thêm cột yyyymm
cho ngày của tập dữ liệu. Lược đồ này giống với bảng thô, có thêm cột ngày và country_code
, cho phép thực hiện các truy vấn so sánh theo thời gian ở cấp quốc gia mà không cần kết hợp các bảng hằng tháng.
global
Tập dữ liệu experimental.global
chứa dữ liệu tổng hợp từ tập dữ liệu all
, có thêm cột yyyymm
cho ngày của tập dữ liệu. Lược đồ này giống với bảng thô, có thêm ngày, cho phép thực hiện các truy vấn so sánh theo thời gian mà không cần kết hợp các bảng hằng tháng.