CrUX على BigQuery

تعرَّف على كيفية تنظيم بيانات CrUX على BigQuery.

مقدمة

تتوفّر البيانات الأولية التي يستند إليها "تقرير تجربة المستخدم على Chrome" (CrUX) على BigQuery، وهي قاعدة بيانات مستضافة على Google Cloud.

تتيح أداة CrUX على BigQuery للمستخدمين إمكانية البحث مباشرةً في مجموعة البيانات الكاملة منذ عام 2017، وذلك مثلاً لتحليل المؤشرات ومقارنة تكنولوجيات الويب وقياس أداء النطاقات.

يتم تنظيم البيانات حسب الإصدار الشهري، بالإضافة إلى عدد من جداول الملخّصات لتوفير وصول أسرع للاستعلام عن البيانات.

تشكّل بيانات BigQuery أساس لوحة بيانات CrUX التي تتيح لك عرض هذه البيانات بدون كتابة طلبات بحث بلغة SQL.

الوصول إلى مجموعة البيانات

يتطلّب استخدام BigQuery حسابًا على Google Cloud ومعرفة أساسية بلغة الاستعلامات البنيوية (SQL). يمكنك الوصول إلى مجموعة بيانات CrUX على BigQuery واستكشافها مجانًا في حدود الطبقة المجانية التي يتم تجديدها شهريًا وتوفّرها BigQuery. بالإضافة إلى ذلك، قد يكون مستخدمو Google Cloud الجدد مؤهّلين للحصول على رصيد اشتراك لتغطية النفقات التي تتجاوز الحدّ المجاني. يُرجى العِلم أنّه يجب تقديم بطاقة ائتمان لمشروع Google Cloud، يمكنك الاطّلاع على لماذا يجب تقديم بطاقة ائتمان؟

إذا كانت هذه هي المرة الأولى التي تستخدم فيها BigQuery، اتّبِع الخطوات التالية لإعداد مشروع:

  1. انتقِل إلى إنشاء مشروع في وحدة تحكّم Google Cloud.
  2. أدخِل اسمًا لمشروعك الجديد، مثل "تقرير تجربة المستخدم في Chrome"، ثم انقر على "إنشاء".
  3. أدخِل معلومات الفوترة إذا طُلب منك ذلك.
  4. انتقِل إلى مجموعة بيانات CrUX على BigQuery

أنت الآن جاهز لبدء الاستعلام عن مجموعة البيانات.

تنظيم المشاريع

يتم إصدار بيانات CrUX على BigQuery في ثاني ثلاثاء من الشهر التالي. يتم إصدار كل شهر كجدول جديد ضمن chrome-ux-report.all. هناك أيضًا عدد من الجداول المادية التي تقدّم إحصاءات موجزة لكل شهر.

مخطط الجدول التفصيلي

يتم توفير الجداول الأولية لكل بلد ومجموعة بيانات all حسب السنة والشهر.

الجداول الأولية

تتضمّن الجداول الأولية المخطط التالي:

  • origin
  • effective_connection_type
  • form_factor
  • first_paint
  • first_contentful_paint
  • largest_contentful_paint
  • dom_content_loaded
  • onload
  • layout_instability
    • cumulative_layout_shift
  • interaction_to_next_paint
  • round_trip_time
  • navigation_types
    • navigate
    • navigate_cache
    • reload
    • restore
    • back_forward
    • back_forward_cache
    • prerender
  • experimental
    • permission
      • notifications
    • time_to_first_byte
    • popularity

مخطط الجدول المادي

يتم توفير الجداول المادية لتسهيل الوصول إلى بيانات الملخّص من خلال عدد من السمات الرئيسية. لا يتم توفير المدرّجات التكرارية، بل يتم تجميع بيانات الأداء في كسور حسب تقييم الأداء وقيمة الشريحة المئوية الـ 75. يتم عرض مجموعة من صفوف الأمثلة من الجدول metrics_summary في هذا المثال:

yyyymm الأصل fast_lcp avg_lcp slow_lcp p75_lcp
202204 https://example.com 0.9056 0.0635 0.0301 1600
202203 https://example.com 0.9209 0.052 0.0274 1400
202202 https://example.com 0.9169 0.0545 0.0284 1500
202201 https://example.com 0.9072 0.0626 0.0298 1500

يوضّح ذلك أنّه في مجموعة البيانات 202204، استوفت% 90.56 من تجارب المستخدمين الحقيقيين على https://example.com معايير سرعة عرض أكبر محتوى مرئي (LCP) جيدة، وأنّ قيمة LCP التقريبية للشريحة المئوية الـ 75 كانت 1,600 ملي ثانية. وهذا أبطأ قليلاً من الأشهر السابقة.

يتم توفير أربعة جداول مادية:

metrics_summary
المقاييس الرئيسية حسب الشهر والمصدر
device_summary
المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز
country_summary
المقاييس الرئيسية حسب الشهر والمصدر ونوع الجهاز والبلد
origin_summary
قائمة بجميع المصادر المضمَّنة في مجموعة البيانات

metrics_summary

يحتوي الجدول metrics_summary على إحصاءات موجزة لكل مصدر ولكل مجموعة بيانات شهرية:

yyyymm
شهر فترة جمع البيانات
origin
عنوان URL الخاص بمصدر الموقع الإلكتروني
rank
الترتيب التقريبي حسب مدى الرواج (اعتبارًا من آذار (مارس) 2021)
[small|medium|large]_cls
نسبة الزيارات حسب حدود متغيّرات التصميم التراكمية
[fast|avg|slow]_<metric>
نسبة الزيارات حسب حدود الأداء
[low|medium|high]_rtt
نسبة الزيارات حسب حدود RTT
p75_<metric>
قيمة الشريحة المئوية الخامسة والسبعون لمقاييس الأداء (بالملّي ثانية)
notification_permission_[accept|deny|ignore|dismiss]
نسبة سلوكيات أذونات الإشعارات
[desktop|phone|tablet]Density
نسبة الزيارات حسب شكل الجهاز
[_4G|_3G|_2G|slow2G|offline]Density
نسبة عدد الزيارات حسب نوع الاتصال الفعّال (يتم احتسابها من rtt الرسوم البيانية المدرَّجة اعتبارًا من فبراير 2025، بدون بيانات بلا إنترنت)
navigation_type_[navigate|navigate_cache|reload|restore|back_forward|back_forward_cache|prerender]
نسبة أنواع التنقّل

device_summary

يحتوي الجدول device_summary على إحصاءات مجمَّعة حسب الشهر والمصدر والبلد والجهاز. بالإضافة إلى الأعمدة metrics_summary، هناك:

device
شكل الجهاز

country_summary

يحتوي الجدول country_summary على إحصاءات مجمَّعة حسب الشهر والمصدر والبلد والجهاز. بالإضافة إلى الأعمدة metrics_summary، هناك:

country_code
رمز البلد المكوّن من حرفين
device
شكل الجهاز

origin_summary

يحتوي جدول origin_summary على قائمة بجميع المصادر في مجموعة بيانات CrUX، ويتم تعديله شهريًا بأحدث قائمة بالمصادر في مجموعة البيانات، ويتضمّن عمودًا واحدًا: origin.

مجموعة البيانات التجريبية

الجداول في مجموعة البيانات التجريبية هي نُسخ طبق الأصل من جداول YYYYMM التلقائية، ولكنّها تستخدم ميزات أحدث وأكثر تقدّمًا في BigQuery، مثل التقسيم والتجميع، ما يتيح لك كتابة طلبات بحث أسرع وأبسط وأقل تكلفة.

country

تحتوي مجموعة البيانات experimental.country على بيانات مجمَّعة من مجموعات البيانات country_CC مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. المخطّط مطابق للجداول الأولية مع إضافة عمودَي التاريخ وcountry_code، ما يتيح تنفيذ طلبات البحث الخاصة بالمقارنة على مستوى البلد بمرور الوقت بدون ربط الجداول الشهرية.

global

تحتوي مجموعة البيانات experimental.global على بيانات مجمَّعة من مجموعة البيانات all مع عمود yyyymm إضافي لتاريخ مجموعة البيانات. يكون المخطط مطابقًا للجداول الأولية مع إضافة التاريخ، ما يتيح تنفيذ طلبات البحث الخاصة بالمقارنة بمرور الوقت بدون ربط الجداول الشهرية.