تعریف آستانه معیارهای Core Web Vitals

تحقیق و روش شناسی پشت آستانه های Core Web Vitals

برایان مک کواد
Bryan McQuade

Core Web Vitals مجموعه‌ای از معیارهای میدانی هستند که جنبه‌های مهم تجربه کاربر در دنیای واقعی را در وب اندازه‌گیری می‌کنند. Core Web Vitals شامل معیارها و همچنین آستانه های هدف برای هر معیار است که به توسعه دهندگان کمک می کند تا درک کنند که آیا تجربه سایت آنها "خوب"، "نیاز به بهبود" است یا "ضعیف" است. این پست به طور کلی رویکرد مورد استفاده برای انتخاب آستانه برای معیارهای Core Web Vitals و همچنین نحوه انتخاب آستانه برای هر معیار Core Web Vitals خاص را توضیح خواهد داد.

Refresher: معیارها و آستانه های Core Web Vitals

در سال 2020، Core Web Vitals سه معیار است: بزرگترین رنگ محتوایی (LCP)، تاخیر ورودی اول (FID) و تغییر چیدمان تجمعی (CLS). هر معیار جنبه متفاوتی از تجربه کاربر را اندازه‌گیری می‌کند: LCP سرعت بارگذاری درک شده را اندازه‌گیری می‌کند و نقطه‌ای را در جدول زمانی بارگذاری صفحه مشخص می‌کند که محتوای اصلی صفحه احتمالاً بارگیری شده است. FID پاسخگویی را اندازه گیری می کند و تجربه ای را که کاربران هنگام تلاش برای اولین بار با صفحه احساس می کنند، اندازه می گیرد. و CLS ث��ا�� ب��ری ��ا اندازه گیری می کند و مقدار تغییر طرح غیرمنتظره محتوای صفحه قابل مشاهده را تعیین می کند.

هر معیار Core Web Vitals آستانه‌های مرتبطی دارد که عملکرد را به عنوان «خوب»، «نیاز به بهبود» یا «ضعیف» طبقه‌بندی می‌کند:

بزرگترین توصیه های آستانه رنگ محتواییاولین توصیه های آستانه تاخیر ورودیتوصیه‌های آستانه تغییر طرح‌بندی تجمعی
خوب فقیر صدک
بزرگترین رنگ محتوایی ≤2500 میلی‌ثانیه > 4000 میلی‌ثانیه 75
اولین تاخیر ورودی ≤100 میلی‌ثانیه > 300 میلی‌ثانیه 75
تغییر چیدمان تجمعی ≤0.1 >0.25 75

علاوه بر این، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای صفحه در آن صفحه یا سایت استفاده می کنیم. به عبارت دیگر، اگر حداقل 75 درصد از بازدیدهای صفحه از یک سایت، آستانه "خوب" را برآورده کنند، سایت به عنوان دارای عملکرد "خوب" برای آن معیار طبقه بندی می شود. برعکس، اگر حداقل 25 درصد از بازدیدهای صفحه آستانه "ضعیف" را داشته باشند، سایت به عنوان دار��ی عملکرد "ضعیف" طبقه بندی می شود. بنابراین، برای مثال، یک LCP صدک 75 2 ثانیه به عنوان "خوب" طبقه بندی می شود، در حالی که یک LCP صدک 75 5 ثانیه به عنوان "ضعیف" طبقه بندی می شود.

معیارهای آستانه متریک Core Web Vitals

هنگام تعیین آستانه برای معیارهای Core Web Vitals، ابتدا معیارهایی را شناسایی کردیم که هر آستانه باید مطابقت داشته باشد. در زیر، معیارهایی را که در Google برای ارزیابی آستانه‌های معیاری Core Web Vitals 2020 استفاده کردیم، توضیح می‌دهم. بخش‌های بعدی به جزئیات بیشتری در مورد نحوه اعمال این معیارها برای انتخاب آستانه‌های هر معیار در سال 2020 می‌پردازد. در سال‌های آینده، ما پیش‌بینی می‌کنیم که بهبودها و اضافه‌هایی به معیارها و آستانه‌ها انجام دهیم تا توانایی خود را برای اندازه‌گیری تجربیات عالی کاربر در وب

تجربه کاربری با کیفیت بالا

هدف اصلی ما بهینه سازی برای کاربر و کیفیت تجربه آنهاست. با توجه به این موضوع، هدف ما تضمین این است که صفحاتی که آستانه‌های «خوب» Core Web Vitals را برآورده می‌کنند، تجربه کاربری با کیفیت بالایی را ارائه می‌کنند.

برای شناسایی یک آستانه مرتبط با تجربه کاربری با کیفیت بالا، ما به ادراک انسانی و تحقیقات HCI نگاه می کنیم. در حالی که این تحقیق گاهی با استفاده از یک آستانه ثابت خلاصه می‌شود، متوجه می‌شویم که تحقیقات اساسی معمولاً به عنوان طیفی از مقادیر بیان می‌شود. به عنوان مثال، تحقیقات در مورد مدت زمانی که کاربران معمولاً قبل از از دست دادن تمرکز منتظر می‌مانند، گاهی اوقات به عنوان 1 ثانیه توصیف می‌شود، در حالی که تحقیقات زیربنایی در واقع به صورت محدوده‌ای از صدها میلی‌ثانیه تا چند ثانیه بیان می‌شود. این واقعیت که آستانه درک بسته به کاربر و زمینه متفاوت است، بیشتر توسط داده‌های متریک کروم جمع‌آوری‌شده و ناشناس پشتیبانی می‌شود، که نشان می‌دهد یک مقدار زمانی وجود ندارد که کاربران قبل از لغو بارگذاری صفحه برای نمایش محتوا منتظر یک صفحه وب باشند. بلکه این داده ها توزیعی هموار و پیوسته را نشان می دهد. برای نگاهی عمیق تر به آستانه های ادراک انسانی و تحقیقات مرتبط HCI، به The Science Behind Web Vitals مراجعه کنید.

در مواردی که تحقیقات مربوط به تجربه کاربر برای یک معیار معین در دسترس است و توافق منطقی در مورد دامنه مقادیر در ادبیات وجود دارد، ما از این محدوده به عنوان ورودی برای هدایت فرآیند انتخاب آستانه استفاده می‌کنیم. در مواردی که تحقیق مربوط به تجربه کاربر در دسترس نیست، مانند معیارهای جدیدی مانند تغییر چیدمان تجمعی، ما در عوض صفحات دنیای واقعی را که آستانه‌های نامزد متفاوتی را برای یک متریک برآورده می‌کنند، ارزیابی می‌کنیم تا آستانه‌ای را که منجر به تجربه کاربری خوب می‌شود، شناسایی کنیم.

با محتوای موجود وب قابل دستیابی است

علاوه بر این، برای اطمینان از اینکه صاحبان سایت می توانند در بهینه سازی سایت های خود برای رسیدن به آستانه های "خوب" موفق شوند، ما نیاز داریم که این آستانه ها برای محتوای موجود در وب قابل دستیابی باشد. برای مثال، در حالی که صفر میلی‌ثانیه یک آستانه ایده‌آل LCP «خوب» است که منجر به تجربه‌های بارگذاری فوری می‌شود، آستانه صفر میلی‌ثانیه به دلیل تأخیرهای پردازش شبکه و دستگاه عملاً در اکثر موارد قابل دستیابی نیست. بنابراین، صفر میلی ثانیه یک آستانه معقول LCP "خوب" برای Core Web Vitals نیست.

هنگام ارزیابی آستانه‌های «خوب» Core Web Vitals نامزد، تأیید می‌کنیم که این آستانه‌ها بر اساس داده‌های گزارش تجربه کاربر Chrome (CrUX) قابل دستیابی هستند. برای تأیید اینکه یک آستانه قابل دستیابی است، ما نیاز داریم که حداقل 10٪ از مبداها در حال حاضر آستانه "خوب" را داشته باشند. به‌علاوه، برای اطمینان از اینکه سایت‌های بهینه‌شده به دلیل تنوع در داده‌های میدانی اشتباه طبقه‌بندی نمی‌شوند، همچنین تأیید می‌کنیم که محتوای بهینه‌شده به‌طور مداوم آستانه «خوب» را برآورده می‌کند.

برعکس، ما آستانه «ضعیف» را با شناسایی سطحی از عملکرد تعیین می‌کنیم که در حال حاضر تنها تعداد کمی از منشاء آن را برآورده نمی‌کنند. به‌طور پیش‌فرض، 10 تا 30 درصد از مبداهایی که بدترین عملکرد را دارند، به‌عنوان «ضعیف» طبقه‌بندی می‌شوند، مگر اینکه تحقیقات مرتبط با تعریف آستانه «ضعیف» وجود داشته باشد.

نظرات نهایی در مورد معیارها

هنگام ارزیابی آستانه نامزدها، متوجه شدیم که معیارها گاهی اوقات با یکدیگر در تضاد بودند. برای مثال، می‌تواند تنشی بین آستانه‌ای وجود داشته باشد که دائماً قابل دستیابی است و تجربه‌های کاربر خوب را تضمین می‌کند. علاوه بر این، با توجه به اینکه تحقیقات ادراک انسانی معمولاً طیف وسیعی از مقادیر را ارائه می‌کند و معیارهای رفتار کاربر تغییرات تدریجی در رفتار را نشان می‌دهند، ما دریافتیم که اغلب هیچ آستانه «درست» واحدی برای یک معیار وجود ندارد. بنابراین، رویکرد ما برای Core Web Vitals 2020 این بوده است که آستانه‌هایی را انتخاب کنیم که به بهترین وجه معیارهای بالا را برآورده می‌کنند، در حالی که تشخیص می‌دهیم که هیچ آستانه کاملی وجود ندارد و ممکن است گاهی لازم باشد از بین چند آستانه نامزد معقول انتخاب کنیم. به جای اینکه بپرسید "آستانه کامل چیست؟" ما در عوض روی این سوال تمرکز کردیم که "کدام آستانه نامزد به بهترین وجه به معیارهای ما می رسد؟"

انتخاب صدک

همانطور که قبلا ذکر شد، برای طبقه بندی عملکرد کلی یک صفحه یا سایت، از ارزش صدک 75 تمام بازدیدهای آن صفحه یا سایت استفاده می کنیم. صدک 75 بر اساس دو معیار انتخاب شد. اول، صدک باید اطمینان حاصل کند که اکثر بازدیدکنندگان از یک صفحه یا سایت، سطح عملکرد هدف را تجربه کرده اند. دوم، مقدار در صدک انتخابی نباید بیش از حد تحت تأثیر عوامل پرت قرار گیرد.

این اهداف تا حدودی با یکدیگر در تضاد هستند. برای ار��ای هدف اول، یک صدک بالاتر معمولاً انتخاب بهتری است. با این حال، با صدک های بالاتر، احتمال اینکه مقدار حاصل تحت تأثیر مقادیر پرت قرار گیرد نیز افزایش می یابد. اگر چند ��ازدید ا�� یک ��ایت ر��ی ا��صالات شبکه ورقه‌ای باشد که منجر به نمونه‌های LCP بسیار بزرگ می‌شود، ما نمی‌خواهیم طبقه‌بندی سایت ما با این نمونه‌های پرت تعیین شود. به عنوان مثال، اگر ما عملکرد یک سایت را با 100 بازدید با استفاده از یک صدک بالا مانند 95 ارزیابی کنیم، فقط 5 نمونه پرت نیاز است تا مقدار صدک 95 تحت تاثیر نقاط پرت قرار گیرد.

با توجه به اینکه این اهداف کمی در تضاد هستند، پس از تجزیه و تحلیل، به این نتیجه رسیدیم که صدک 75 تعادل معقولی ایجاد می کند. با استفاده از صدک 75، می دانیم که اکثر بازدیدکنندگان از سایت (3 از 4) سطح عملکرد هدف یا بهتر را تجربه کرده اند. علاوه بر این، مقدار صدک 75 کمتر تحت تأثیر عوامل پرت است. با بازگشت به مثال ما، برای سایتی با 100 بازدید، 25 مورد از این بازدیدها باید نمونه های پرت بزرگ را گزارش کنند تا مقدار در صدک 75 تحت تأثیر عوامل پرت قرار گیرد. در حالی که 25 نمونه از 100 نمونه ممکن است پرت باشند، احتمال آن بسیار کمتر از مورد صدک 95 است.

بزرگترین رنگ محتوایی

کیفیت تجربه

1 ثانیه اغلب به عنوان مدت زمانی ذکر می شود که کاربر قبل از اینکه تمرکز خود را روی یک کار از دست بدهد منتظر بماند. با بررسی دقیق تر تحقیقات مربوطه، متوجه شدیم که 1 ثانیه تقریبی برای توصیف طیفی از مقادیر، از تقریباً چند صد میلی ثانیه تا چند ثانیه است.

دو منبع متداول برای آستانه 1 ثانیه، Card و همکاران و Miller هستند. Card با استناد به نظریه‌های یکپارچه شناخت نیوول، آستانه ۱ ثانیه‌ای «پاسخ فوری» را تعریف می‌کند. نیوول پاسخ‌های فوری را این‌گونه توضیح می‌دهد: «پاسخ‌هایی که باید به محرک‌هایی در عرض تقریباً یک ثانیه داده شوند (یعنی تقریباً از 0.3 تا 3 ثانیه.» این به دنبال بحث نیوول در مورد "محدودیت های زمان واقعی در شناخت" است، جایی که اشاره می شود که "تعاملات با محیطی که ملاحظات شناختی را برمی انگیزد به ترتیب ثانیه ها انجام می شود" که از حدود 0.5 تا 2-3 ثانیه متغیر است. میلر، منبع دیگری که معمولاً برای آستانه 1 ثانیه ذکر می‌شود، خاطرنشان می‌کند: «کارهایی که انسان‌ها می‌توانند با ارتباطات ماشینی انجام دهند و انجام خواهند داد، در صورتی که تأخیر در پاسخ بیش از دو ثانیه باشد، با احتمال طولانی شدن یک ثانیه یا بیشتر، شخصیت آنها به طور جدی تغییر می‌کند».

تحقیقات میلر و کارت مدت زمانی را که کاربر قبل از از دست دادن تمرکز منتظر می‌ماند به عنوان یک محدوده، از تقریباً 0.3 تا 3 ثانیه توصیف می‌کند، که نشان می‌دهد آستانه "خوب" LCP ما باید در این محدوده باشد. علاوه بر این، با توجه به اینکه آستانه "خوب" First Contentful Paint موجود 1 ثانیه است، و اینکه بزرگترین رنگ محتوایی معمولاً بعد از First Contentful Paint رخ می دهد، ما دامنه آستانه های LCP نامزد خود را بیشتر از 1 ثانیه به 3 ثانیه محدود می کنیم. برای انتخاب آستانه در این محدوده که به بهترین وجه با معیارهای ما مطابقت دارد، به دستیابی به این آستانه های نامزد در زیر نگاه می کنیم.

دست یافتنی

با استفاده از داده‌های CrUX، می‌توانیم درصد مبداهای موجود در وب را تعیین کنیم که آستانه‌های «خوب» LCP نامزد ما را برآورده می‌کنند.

% از مبداهای CrUX طبقه بندی شده به عنوان "خوب" (برای آستانه های LCP نامزد)

1 ثانیه 1.5 ثانیه 2 ثانیه 2.5 ثانیه 3 ثانیه
تلفن 3.5٪ 13% 27% 42% 55%
دسکتاپ 6.9٪ 19% 36% 51% 64%

در حالی که کمتر از 10٪ از مبداها آستانه 1 ثانیه را برآورده می کنند، همه آستانه های دیگر از 1.5 تا 3 ثانیه شرایط ما را برآورده می کنند که حداقل 10٪ از مبداها آستانه "خوب" را برآورده کنند، و بنابراین هنوز کاندیدای معتبر هستند.

علاوه بر این، برای اطمینان از اینکه آستانه انتخاب شده به طور مداوم برای سایت‌های بهینه‌سازی شده قابل دستیابی است، عملکرد LCP را برای سایت‌های با عملکرد برتر در سراسر وب تجزیه و تحلیل می‌کنیم تا تعیین کنیم که کدام آستانه‌ها به طور مداوم برای این سایت‌ها قابل دستیابی هستند. به طور خاص، هدف ما شناسایی آستانه ای است که به طور مداوم در صدک 75 برای سایت های دارای عملکرد برتر قابل دستیابی است. ما متوجه شدیم که آستانه های 1.5 و 2 ثانیه به طور مداوم قابل دستیابی نیستند، در حالی که 2.5 ثانیه به طور مداوم قابل دستیابی است.

برای شناسایی آستانه «ضعیف» برای LCP، از داده‌های CrUX برای شناسایی آستانه‌ای استفاده می‌کنیم که توسط اکثر مبداها برآورده شده است:

٪ از مبداهای CrUX طبقه بندی شده به عنوان "ضعیف" (برای آستانه های LCP نامزد)

3 ثانیه 3.5 ثانیه 4 ثانیه 4.5 ثانیه 5 ثانیه
تلفن 45% 35% 26% 20% 15%
دسکتاپ 36% 26% 19% 14% 10%

برای آستانه 4 ثانیه، تقریباً 26٪ از مبدا تلفن و 21٪ از مبدا دسکتاپ به عنوان ضعیف طبقه بندی می شوند. این در محدوده هدف ما 10-30٪ قرار می گیرد، بنابراین نتیجه می گیریم که 4 ثانیه آستانه "ضعیف" قابل قبولی است.

بنابراین، نتیجه می گیریم که 2.5 ثانیه یک آستانه معقول "خوب" و 4 ثانیه یک آستانه معقول "ضعیف" برای بزرگترین رنگ محتوایی است.

تاخیر ورودی اول

کیفیت تجربه

تحقیقات به طور منطقی در نتیجه گیری اینکه تاخیر در بازخورد بصری تا حدود 100 میلی ثانیه به عنوان یک منبع مرتبط، مانند ورودی کاربر، ایجاد می شود، سازگار است. این نشان می‌دهد که آستانه «خوب» 100 میلی‌ثانیه به‌عنوان یک نوار حداقل مناسب است: اگر تأخیر برای پردازش ورودی از 100 میلی‌ثانیه بیشتر شود، دیگر فرصتی برای تکمیل به موقع مراحل پردازش و رندر وجود ندارد.

یاکوب نیلسن که معمولاً به آن اشاره می‌شود : 3 محدودیت مهم، 0.1 ثانیه را به عنوان محدودیتی برای اینکه کاربر احساس کند سیستم فوراً واکنش نشان می‌دهد، تعریف می‌کند. نیلسن از میلر و کارد استناد می‌کند که میشوت در سال 1962 به «درک علیت» اشاره می‌کند. در تحقیقات Michotte، به شرکت کنندگان آزمایش نشان داده می شود "دو شی روی صفحه نمایش. شی A حرکت می کند و به سمت B حرکت می کند. در لحظه ای که با B تماس پیدا می کند متوقف می شود، در حالی که دومی شروع می شود و از A دور می شود." Michotte فاصله زمانی بین توقف شی A و زمانی که شی B شروع به حرکت می کند تغییر می دهد. میشوت دریافت که برای تأخیرهای تقریباً 100 میلی‌ثانیه، شرکت‌کنندگان این تصور را دارند که شی A باعث حرکت شیء B می‌شود. برای تأخیرهای تقریباً 100 میلی‌ثانیه تا 200 میلی‌ثانیه، درک علیت مختلط است و برای تأخیرهای بیش از 200 میلی‌ثانیه، حرکت شیء B دیگر توسط شیء A ایجاد شده است.

به طور مشابه، میلر یک آستانه پاسخ را برای "پاسخ به فعال سازی کنترل" اینگونه تعریف می کند: "نشان دهنده عملی است که معمولاً با حرکت کلید، سوئیچ یا سایر اعضای کنترلی که سیگنال فعال شدن فیزیکی آن را نشان می دهد ارائه می شود. این پاسخ باید ... درک شود. به عنوان بخشی از عمل مکانیکی القا شده توسط اپراتور تاخیر زمانی: حداکثر 0.1 ثانیه و بعداً "تأخیر بین فشار دادن کلید و بازخورد بصری نباید بیشتر از 0.1 تا 0.2 ثانیه باشد".

اخیراً، Kaaresoja و همکاران در کتاب Towards the Temporally Perfect Virtual Button ، درک همزمانی بین لمس یک دکمه م��ازی روی صفحه لمسی و بازخورد بصری بعدی که نشان می‌دهد دکمه لمس شده است را برای تاخیرهای مختلف بررسی کردند. هنگامی که تاخیر بین فشار دادن دکمه و بازخورد بصری 85 میلی‌ثانیه یا کمتر بود، شرکت‌کنندگان گزارش دادند که بازخورد بصری همزمان با فشار دادن دکمه در 75 درصد مواقع ظاهر می‌شود. علاوه بر این، برای تأخیرهای 100 میلی‌ثانیه یا کمتر، شرکت‌کنندگان کیفیت درک مداوم فشار دکمه را گزارش کردند، کیفیت درک شده برای تأخیرهای 100 میلی‌ثانیه تا 150 میلی‌ثانیه کاهش می‌یابد و برای تأخیرهای 300 میلی‌ثانیه به سطوح بسیار پایین می‌رسد.

با توجه به موارد فوق، نتیجه می گیریم که تحقیقات به محدوده ای از مقادیر در حدود 100 میلی ثانیه به عنوان آستانه تاخیر ورودی اول مناسب برای Web Vitals اشاره می کند. علاوه بر این، با توجه به گزارش کاربران سطوح پایین کیفیت برای تأخیرهای 300 میلی‌ثانیه یا بیشتر، 300 میلی‌ثانیه به‌عنوان آستانه معقول «ضعیف» نشان داده می‌شود.

دست یافتنی

با استفاده از داده‌های CrUX، مشخص می‌کنیم که اکثر مبداهای موجود در وب، آستانه 100 میلی‌ثانیه FID "خوب" در صدک 75 را برآورده می‌کنند:

درصد از مبداهای CrUX به عنوان "خوب" برای آستانه 100 میلی ثانیه FID طبقه بندی شده است

100 میلی‌ثانیه
تلفن 78%
دسکتاپ >99%

علاوه بر این، مشاهده می کنیم که سایت های برتر در سراسر وب می توانند به طور مداوم این آستانه را در صدک 75 (و اغلب در صدک 95) برآورده کنند.

با توجه به موارد فوق، به این نتیجه می رسیم که 100 میلی ثانیه یک آستانه معقول "خوب" برای FID است.

تغییر چیدمان تجمعی

کیفیت تجربه

تغییر چیدمان تجمعی (CLS) معیار جدیدی است که میزان تغییر محتوای قابل مشاهده یک صفحه را اندازه گیری می کند. با توجه به جدید بودن CLS، ما از تحقیقاتی که بتواند به طور مستقیم آستانه های این معیار را تعیین کند، آگاه نیستیم. بنابراین، برای شناسایی آستانه‌ای که با انتظارات کاربر همسو باشد، صفحات دنیای واقعی را با مقادیر مختلف تغییر طرح‌بندی ارزیابی کردیم تا قبل از ایجاد اختلالات قابل‌توجه هنگام مصرف محتوای صفحه، حداکثر مقدار تغییر قابل قبول را تعیین کنیم. در آزمایش داخلی ما، متوجه شدیم که سطوح تغییر از 0.15 و بالاتر به طور مداوم به عنوان مخرب تلقی می شد، در حالی که تغییرات 0.1 و پایین قابل توجه بود اما بیش از حد مخل نبود. بنابراین، در حالی که تغییر طرح صفر ایده آل است، به این نتیجه رسیدیم که مقادیر تا 0.1 آستانه های CLS "خوب" نامزد هستند.

دست یافتنی

بر اساس داده‌های CrUX، می‌توانیم ببینیم که تقریباً 50٪ از مبداها دارای CLS 0.05 یا کمتر هستند.

٪ از مبداهای CrUX طبقه بندی شده به عنوان "خوب" (برای آستانه های CLS نامزد)

0.05 0.1 0.15
تلفن 49% 60% 69%
دسکتاپ 42% 59% 69%

در حالی که داده‌های CrUX نشان می‌دهد که 0.05 ممکن است یک آستانه معقول "خوب" CLS باشد، ما تشخیص می‌دهیم که برخی موارد استفاده وجود دارد که در حال حاضر اجتناب از تغییرات طرح‌بندی مخرب دشوار است. برای مثال، برای محتوای تعبیه‌شده شخص ثالث، مانند جاسازی‌های رسانه‌های اجتماعی، ارتفاع محتوای تعبیه‌شده گاهی اوقات تا زمانی که بارگیری تمام نشده مشخص نمی‌شود، که می‌تواند منجر به تغییر چیدمان بیشتر از 0.05 شود. بنابراین، نتیجه می‌گیریم که در حالی که بسیاری از مبداها آستانه 0.05 را برآورده می‌کنند، آستانه CLS کمی سخت‌تر 0.1 تعادل بهتری بین کیفیت تجربه و دستیابی ایجاد می‌کند. امیدواریم که در آینده، اکوسیستم وب راه‌حل‌هایی را برای رسیدگی به تغییرات طرح‌بندی ناشی از تعبیه‌های شخص ثالث شناسایی کند، که امکان استفاده از آستانه سخت‌گیرانه‌تر CLS "خوب" 0.05 یا 0 را در تکرار بعدی Core Web Vitals فراهم می‌کند. .

علاوه بر این، برای تعیین آستانه ضعیف برای CLS، از داده‌های CrUX برای شناسایی آستانه‌ای استفاده کردیم که توسط اکثر مبداها برآورده شده است:

٪ از مبداهای CrUX طبقه بندی شده به عنوان "ضعیف" (برای آستانه های نامزد CLS)

0.15 0.2 0.25 0.3
تلفن 31% 25% 20% 18%
دسکتاپ 31% 23% 18% 16%

برای آستانه 0.25، تقریباً 20٪ از مبدا تلفن، و 18٪ از مبدا دسکتاپ، به عنوان "ضعیف" طبقه بندی می شوند. این در محدوده هدف ما 10-30 درصد است، بنابراین ما به این نتیجه رسیدیم که 0.25 یک آستانه قابل قبول "ضعیف" است.