Мониторинг распространенности веб-технологий

RU-CENTER

Что, как и зачем

Вкратце

Технология

Обработанные выборки. «Рунет»

Обработанные выборки. «Общемировой веб»

Исследуемые особенности стороны сервера

Исследуемые особенности стороны клиента

Объекты исследования

Принципы анализа HTML-кода

  1. Простейший tokenizer (как это по-русски?..) последовательно проходит HTML-код и разделяет его на составляющие
  2. Интересные вхождения внутрь этих составляющих детектируются при помощи регулярных выражений

StackOverflow:

«Всякий раз, когда ты пытаешься парсить HTML регулярными выражениями, сын нечестивый умывается кровью девственниц, и русские хакеры павнят твое веб-приложение»

Пара слов об общей картине

Откликнувшиеся веб-узлы

100% 0%

.RU, 79%

.COM, 68%

Alexa, 83%

Популярные CMS, .RU

50% 0%

Dru­pal, 7%

Word­Press, 37%

Joom­la!, 39%

MODx, 5%

«1С-Бит­рикс», 9%

UMI.CMS, 2%

NetCat, 1%

Популярные CMS, .COM

100% 0%

Dru­pal, 4%

Word­Press, 78%

Joom­la!, 18%

MODx, 0%

«1С-Бит­рикс», 0%

UMI.CMS, 0%

NetCat, 0%

Популярные CMS, Alexa

100% 0%

Dru­pal, 9%

Word­Press, 74%

Joom­la!, 15%

MODx, 1%

«1С-Бит­рикс», 1%

UMI.CMS, 0%

NetCat, 0%

Обнаружения одной из исследуемых CMS

40% 0%

.RU, 29%

.COM, 10%

Alexa, 25%

Доктайпы и режимы рендеринга

Доктайпы как таковые

100% 0%

.RU, 81%

.COM, 77%

Alexa, 89%

Standards-Mode-доктайпы

100% 0%

.RU, 70%

.COM, 69%

Alexa, 82%

Разновидности доктайпов, .RU

50% 0%

HTML5, 14%

HTML 4.01 (SM), 7%

XHTML 1.0 Strict, 10%

XHTML 1.0 Transi­tional, 38%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 7%

Другой, 4%

Никакой, 19%

Разновидности доктайпов, .COM

50% 0%

HTML5, 9%

HTML 4.01 (SM), 9%

XHTML 1.0 Strict, 8%

XHTML 1.0 Transi­tional, 41%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 5%

Другой, 4%

Никакой, 23%

Разновидности доктайпов, Alexa

50% 0%

HTML5, 17%

HTML 4.01 (SM), 5%

XHTML 1.0 Strict, 12%

XHTML 1.0 Transi­tional, 46%

XHTML 1.1, 1%

HTML 4.0/4.01 (QM), 4%

Другой, 4%

Никакой, 11%

Рост распространенности доктайпа HTML5, .RU

14% 10%

, 10,11%

, 11,15%

, 12,06%

, 12,82%

, 13,77%

Прирост в абсолютных цифрах — более 100 тысяч!

HTML5 завоевывает планету

Новые структурные элементы HTML5

<article>, <aside>, <audio>, <bdi>, <canvas>, <command>, <datalist>, <details>, <figcaption>, <figure>, <footer>, <header>, <hgroup>, <keygen>, <mark>, <math>, <meter>, <nav>, <output>, <progress>, <rp>, <rt>, <ruby>, <section>, <source>, <summary>, <svg>, <time>, <track>, <video>

Новые структурные элементы HTML5. Распространенность

10% 0%

.RU, 7%

.COM, 4%

Alexa, 9%

Рост распространенности новых элементов HTML5, .RU

7% 4%

, 4,43%

, 4,86%

, 5,47%

, 6,13%

, 6,77%

Прирост в абсолютных цифрах — более 60 тысяч

Новые типы полей ввода HTML-форм

Новые типы полей ввода HTML-форм. Распространенность

20% 0%

.RU, 4%

.COM, 16%

Alexa, 10%

«Проблемные» конструкции HTML

1. Опротестованные

Объявлены как deprecated в спецификации HTML 4.01 и в итоге упразднены в HTML5

Опротестованные элементы

<applet>, <basefont>, <center>, <dir>, <font>, <isindex>, <strike>

Опротестованные элементы. Распространенность

50% 0%

.RU, 32%

.COM, 19%

Alexa, 34%

Опротестованные атрибуты

Опротестованные атрибуты. Продолжение

2. Упраздненные

Не объявлены как deprecated, но в итоге все же исключены из HTML5

Упраздненные элементы

Упраздненные атрибуты

3. Реабилитированные

Объявлены как deprecated, но в итоге восстановлены в HTML5 в каком-либо новом качестве

Реабилитированные элементы

Реабилитированные атрибуты

4. Фреймовые

Актуальны только в документах типа Frameset и не используются в HTML5

Фреймовые элементы

<frame>, <frameset>, <noframes>

Фреймовые элементы. Распространенность

15% 0%

.RU, 1%

.COM, 12%

Alexa, 1%

Более 2% сайтов в доменах .COM имеют честные Frameset-доктайпы

Фреймовые атрибуты

5. Нестандартные

Не описаны ни в одной из официальных спецификаций HTML

Нестандартные элементы

<bgsound>, <blink>, <comment>, <marquee>, <multicol>, <nobr>, <noembed>, <noindex>, <plaintext>, <spacer>, <xmp>

Нестандартные элементы. Распространенность

20% 0%

.RU, 17%

.COM, 2%

Alexa, 7%

Нестандартные атрибуты

6. Легитимизированные

Изначально нестандартные, «узаконены» в HTML5

Легитимизированные элементы

Использование CSS

CSS в любом виде

100% 0%

.RU, 93%

.COM, 76%

Alexa, 94%

Внешние таблицы стилей

100% 0%

.RU, 81%

.COM, 47%

Alexa, 86%

Таблицы стилей внутри HTML-кода

100% 0%

.RU, 38%

.COM, 48%

Alexa, 49%

Inline-стили

100% 0%

.RU, 79%

.COM, 60%

Alexa, 84%

Интересные частности

Метатеги viewport

10% 0%

.RU, 4%

.COM, 7%

Alexa, 8%

Теме посвящен доклад «Прокрустовы окна»

Рост распространенности метатегов viewport, .RU

5% 2%

, 2,60%

, 3,12%

, 3,55%

, 3,88%

, 4,37%

Прирост в абсолютных цифрах — почти 50 тысяч

Условные комментарии для IE

50% 0%

.RU, 34%

.COM, 16%

Alexa, 39%

БЭМ-классы

Кодировка UTF-8

100% 0%

.RU, 49%

.COM, 50%

Alexa, 53%

Концепты сайтов

Сайты будущего

Сайты будущего. Распространенность

1% 0%

.RU, 0,54%

.COM, 0,63%

Alexa, 0,41%

Абсолютное количество таких сайтов в доменах .RU — 12 878

Современные сайты

Современные сайты. Распространенность

3% 0%

.RU, 2,3%

.COM, 2,2%

Alexa, 1,5%

Сайты разных эпох, сделанные с оглядкой на стандарты

Сайты разных эпох, сделанные с оглядкой на стандарты. Распространенность

10% 0%

.RU, 8%

.COM, 7%

Alexa, 7%

Сайты темного прошлого

Сайты темного прошлого. Распространенность

25% 0%

.RU, 23%

.COM, 24%

Alexa, 13%

Дальнейшее чтение

«Мониторинг серверных и клиентских веб-решений» — весьма подробный отчет о текущих результатах исследований, включающий почти 40 тысяч знаков текста и более 20 диаграмм

Спасибо за внимание! Вопросы?