CrUX trên BigQuery

Tìm hiểu cách dữ liệu CrUX được cấu trúc trên BigQuery.

Giới thiệu

Dữ liệu thô đằng sau Báo cáo trải nghiệm người dùng trên Chrome (CrUX) có trên BigQuery, một cơ sở dữ liệu được lưu trữ trên Google Cloud.

CrUX trên BigQuery cho phép người dùng trực tiếp truy vấn toàn bộ tập dữ liệu từ năm 2017, chẳng hạn như để phân tích xu hướng, so sánh các công nghệ web và đo điểm chuẩn các miền.

Dữ liệu được cấu trúc theo bản phát hành hằng tháng, cũng như một số bảng tóm tắt để cung cấp quyền truy cập nhanh hơn cho việc truy vấn dữ liệu.

Dữ liệu BigQuery là cơ sở của Trang tổng quan CrUX, giúp bạn hình dung dữ liệu này mà không cần viết truy vấn SQL.

Truy cập vào tập dữ liệu

Để sử dụng BigQuery, bạn cần có tài khoản Google Cloud và kiến thức cơ bản về SQL. Bạn có thể truy cập và khám phá tập dữ liệu CrUX trên BigQuery miễn phí trong phạm vi cấp miễn phí. Cấp này được BigQuery cung cấp và gia hạn hằng tháng. Ngoài ra, người dùng mới của Google Cloud có thể đủ điều kiện nhận khoản tín dụng đăng ký để chi trả các khoản phí ngoài cấp miễn phí. Xin lưu ý rằng bạn phải cung cấp thẻ tín dụng cho dự án Google Cloud. Hãy xem phần Tại sao tôi cần cung cấp thẻ tín dụng?.

Nếu đây là lần đầu tiên bạn sử dụng BigQuery, hãy làm theo các bước sau để thiết lập một dự án:

  1. Chuyển đến phần Tạo dự án trên Google Cloud Console.
  2. Đặt tên cho dự án mới của bạn, chẳng hạn như "Báo cáo trải nghiệm người dùng Chrome của tôi", rồi nhấp vào Tạo.
  3. Cung cấp thông tin thanh toán của bạn nếu được nhắc.
  4. Chuyển đến tập dữ liệu CrUX trên BigQuery

Giờ đây, bạn đã sẵn sàng bắt đầu truy vấn tập dữ liệu.

Sắp xếp dự án

Dữ liệu CrUX trên BigQuery được phát hành vào thứ Ba thứ hai của tháng tiếp theo. Mỗi tháng sẽ được phát hành dưới dạng một bảng mới trong chrome-ux-report.all. Ngoài ra, còn có một số bảng cụ thể hoá cung cấp số liệu thống kê tóm tắt cho từng tháng.

Giản đồ bảng chi tiết

Các bảng thô cho từng quốc gia và tập dữ liệu all được cung cấp theo năm và tháng.

Bảng thô

Các bảng thô có giản đồ sau:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

Giản đồ bảng cụ thể hoá

Các bảng cụ thể được cung cấp để giúp bạn dễ dàng truy cập vào dữ liệu tóm tắt theo một số phương diện chính. Không có biểu đồ tần suất nào được cung cấp, thay vào đó, dữ liệu hiệu suất được tổng hợp thành các phân số theo đánh giá hiệu suất và giá trị ở phân vị thứ 75. Một tập hợp các hàng ví dụ trong bảng metrics_summary được minh hoạ trong ví dụ này:

yyyymm nguồn gốc fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0,9056 0,0635 0,0301 1600
202203 https://example.com 0,9209 0,052 0,0274 1400
202202 https://example.com 0,9169 0,0545 0,0284 1500
202201 https://example.com 0,9072 0,0626 0,0298 1500

Điều này cho thấy trong tập dữ liệu 202204, 90,56% trải nghiệm của người dùng thực trên https://example.com đáp ứng tiêu chí về LCP tốt và giá trị LCP ở phân vị thứ 75 là 1.600 mili giây. Tốc độ này chậm hơn một chút so với những tháng trước.

Có 4 bảng cụ thể hoá:

metrics_summary
các chỉ số chính theo tháng và nguồn gốc
device_summary
các chỉ số chính theo tháng, nguồn gốc và loại thiết bị
country_summary
các chỉ số chính theo tháng, nguồn gốc, loại thiết bị và quốc gia
origin_summary
danh sách tất cả các nguồn có trong tập dữ liệu

metrics_summary

Bảng metrics_summary chứa số liệu thống kê tóm tắt cho từng nguồn và từng tập dữ liệu hằng tháng:

yyyymm
Tháng của khoảng thời gian thu thập dữ liệu
origin
URL của nguồn gốc trang web
rank
Bảng xếp hạng mức độ phổ biến tương đối (tính đến tháng 3 năm 2021)
[small|medium|large]_cls
phân số lưu lượng truy cập theo ngưỡng CLS
[fast|avg|slow]_<metric>
phân số lưu lượng truy cập theo ngưỡng hiệu suất
[low|medium|high]_rtt
phân số lưu lượng truy cập theo ngưỡng RTT
p75_<metric>
Giá trị phân vị thứ 75 của các chỉ số hiệu suất (mili giây)
notification_permission_[accept|deny|ignore|dismiss]
phân số hành vi liên quan đến quyền gửi thông báo
[desktop|phone|tablet]Density
phân số lưu lượng truy cập theo kiểu dáng thiết bị
[_4G|_3G|_2G|slow2G|offline]Density
phân số lưu lượng truy cập theo loại kết nối hiệu quả (tính từ biểu đồ rtt từ tháng 2 năm 2025, không có dữ liệu ngoại tuyến)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
phân số của các loại điều hướng

device_summary

Bảng device_summary chứa số liệu thống kê tổng hợp theo tháng, nguồn, quốc gia và thiết bị. Ngoài các cột metrics_summary, còn có:

device
Hệ số hình dạng
của thiết bị

country_summary

Bảng country_summary chứa số liệu thống kê tổng hợp theo tháng, nguồn, quốc gia và thiết bị. Ngoài các cột metrics_summary, còn có:

country_code
Mã quốc gia gồm 2 chữ cái
device
Hệ số hình dạng
của thiết bị

origin_summary

Bảng origin_summary chứa danh sách tất cả các nguồn trong tập dữ liệu CrUX; bảng này được cập nhật hằng tháng bằng danh sách nguồn mới nhất trong tập dữ liệu và có một cột duy nhất: origin.

Tập dữ liệu thử nghiệm

Các bảng trong tập dữ liệu thử nghiệm là bản sao chính xác của các bảng YYYYMM mặc định, nhưng chúng sử dụng các tính năng mới hơn và nâng cao hơn của BigQuery như phân vùngphân cụm. Nhờ đó, bạn có thể viết các truy vấn nhanh hơn, đơn giản hơn và rẻ hơn.

country

Tập dữ liệu experimental.country chứa dữ liệu tổng hợp từ các tập dữ liệu country_CC, có thêm cột yyyymm cho ngày của tập dữ liệu. Lược đồ này giống với bảng thô, có thêm cột ngày và country_code, cho phép thực hiện các truy vấn so sánh theo thời gian ở cấp quốc gia mà không cần kết hợp các bảng hằng tháng.

global

Tập dữ liệu experimental.global chứa dữ liệu tổng hợp từ tập dữ liệu all, có thêm cột yyyymm cho ngày của tập dữ liệu. Lược đồ này giống với bảng thô, có thêm ngày, cho phép thực hiện các truy vấn so sánh theo thời gian mà không cần kết hợp các bảng hằng tháng.