Georgia Domain Explorer

Как мы собираем данные и считаем рейтинги

Прозрачность, точность и открытые алгоритмы

Добро пожаловать на страницу методологии Georgia Domain Explorer (GDE.ge). Мы верим в открытость данных. Наша цель — создать самую точную, прозрачную и полезную аналитическую платформу для грузинского интернет-пространства.

Ниже мы подробно рассказываем, откуда берется информация на нашем сайте, как работают наши алгоритмы и по какой формуле рассчитывается рейтинг качества (Quality Score) каждого домена.

1. Откуда мы берем домены?

Сбор базы доменов в зоне .GE — это сложный многоступенчатый процесс, так как официальный реестр зоны является закрытым в целях безопасности и защиты данных. Мы используем два независимых подхода:

  • Короткие домены (2–4 символа): Мы алгоритмически генерируем все возможные словарные комбинации (без смешивания букв и цифр) и регулярно опрашиваем публичные DNS-серверы и WHOIS. Это позволяет нам поддерживать актуальную базу свободных коротких имен, которую наши пользователи могут использовать для поиска красивого домена абсолютно бесплатно.
  • Длинные и работающие домены: Для формирования основного каталога мы агрегируем исторические данные, приобретая выгрузки у независимых международных сервисов аналитики интернет-маршрутизации.

2. Технический краулинг и анализ производительности

Каждый сайт в нашей базе проходит глубокий технический аудит. Мы не используем чужие базы "как есть" — мы сканируем сайты самостоятельно.

  • Рендеринг и технологии (Собственный краулер): Наш серверный краулер на базе Puppeteer физически заходит на сайт, делает скриншот реального экрана, считывает размер HTML-кода, HTTP-заголовки безопасности и собирает список используемых технологий (CMS, фреймворки), номера телефонов, ссылки на социальные сети, измеряем скорость загрузки с нашего сервера, получаем OG теги, заголовки и другие данные - например наличе снимка в WebArchive, ссылок в Wikipedia.
  • Производительность (Google PageSpeed API): Для оценки скорости загрузки, времени ответа сервера (TTFB) и метрик Web Vitals (LCP, FCP, CLS) мы используем официальную интеграцию с API от Google. Это гарантирует, что наши данные о скорости совпадают с тем, как сайты видит главная поисковая система мира.

3. Как мы рассчитываем GDE Quality Score (QS)

Quality Score — это наш внутренний динамический рейтинг качества сайта. Он не является статичным и пересчитывается регулярно. В данный момент рейтинг строится на базе открытости бизнеса, технической безопасности и реакции пользователей. Сайт может набрать более 100 баллов, если он пользуется большой популярностью.

Формула расчета (на текущий момент):

  • Базовая безопасность: Наличие активного HTTPS/SSL сертификата (+20 баллов).
  • Открытость бизнеса: Публикация контактного номера телефона (+15 баллов), наличие ссылок на официальные социальные сети (до +15 баллов).
  • Возраст и авторитет: +1 балл за каждый полный год с момента первой регистрации домена (максимум +20 баллов).
  • Рейтинг и отзывы: Оценка по отзывам умножается на 5, плюс бонус за количество одобренных отзывов (до +25 баллов).
  • Реакции (Эмодзи): Взвешенный алгоритм позитивных и негативных реакций (может как добавить до +50 баллов, так и отнять до -10 баллов в случае спама или мошенничества).
  • Внутренняя популярность: Бонусные баллы за каждые 500 просмотров страницы сайта внутри сервиса GDE.ge (до +10 баллов).
Примечание: В следующих обновлениях формула QS будет расширена. В нее войдут технические показатели производительности, вес страницы и данные Google PageSpeed.

4. Глобальная аналитика и OSINT-исследования

Помимо карточек отдельных сайтов, мы предоставляем макро-аналитику всего грузинского интернета (популярность CMS, статистика регистраторов, возраст сайтов).

  • Глобальная статистика: Обновляется скриптами 4 раза в сутки.
  • Категорийная статистика: Анализ внутри конкретных ниш (например, "Туризм" или "Искусство") пересчитывается 1 раз в сутки.

Трекеры и аналитические следы (OSINT): Наш парсер собирает идентификаторы счетчиков (Google Analytics, Yandex Metrika, Facebook Pixel). Эти данные используются нами исключительно для внутренних исследований и макро-аналитики (например, для понимания доли рынка тех или иных счетчиков или выявления крупных сеток сайтов). Мы не публикуем сырые ID публично в целях безопасности.

5. Искусственный интеллект (AI)

В основе наших метрик, статистики и графиков лежат только строгие математические алгоритмы и скрипты. Искусственный интеллект не принимает решений о рейтинге сайтов.

Однако мы используем передовые LLM-модели (нейросети) для лингвистических задач:

  • Написание коротких, объективных и легко читаемых обзоров (Summary) на базе спарсенного контента сайта.
  • Точный мультиязычный перевод пользовательских отзывов, чтобы стереть языковые барьеры между грузинским, английским и русским языками.

6. Приватность данных (WHOIS и Контакты)

Мы строго уважаем право владельцев сайтов на приватность:

  • Если регистратор домена или владелец скрыл свои данные в WHOIS (Privacy Protection, Redacted), мы выводим статус «Данные скрыты».
  • Мы не собираем скрытые номера телефонов и email-адреса из системных реестров. В блоке контактов на GDE.ge отображаются только те телефоны и ссылки, которые владельцы бизнеса добровольно опубликовали в открытом виде на главной странице своего сайта.

Изучите наши исследования

Перейти к аналитике .GE

Сводные данные, графики регистраций и популярные технологии