Georgia Domain Explorer

როგორ ვაგროვებთ მონაცემებს და ვითვლით რეიტინგებს

გამჭვირვალობა, სიზუსტე და ღია ალგორითმები

მოგესალმებით Georgia Domain Explorer-ის (GDE.ge) მეთოდოლოგიის გვერდზე. ჩვენ გვჯერა მონაცემთა გამჭვირვალობის. ჩვენი მიზანია შევქმნათ საქართველოს ინტერნეტსივრცის ყველაზე ზუსტი, გამჭვირვალე და სასარგებლო ანალიტიკური პლატფორმა.

ქვემოთ დეტალურად აღვწერთ, საიდან მოდის ჩვენს საიტზე წარმოდგენილი ინფორმაცია, როგორ მუშაობს ჩვენი ალგორითმები და რა პრინციპით ითვლება თითოეული დომენის ხარისხის რეიტინგი (Quality Score).

1. საიდან ვიღებთ დომენების მონაცემებს?

.GE ზონის დომენების ბაზის შექმნა საკმაოდ რთული და მრავალსაფეხურიანი პროცესია, რადგან ოფიციალური რეესტრის მონაცემები უსაფრთხოებისა და კონფიდენციალურობის მიზეზების გამო საჯაროდ ხელმისაწვდომი არ არის. ჩვენ ვიყენებთ ორ დამოუკიდებელ მეთოდს:

  • მოკლე დომენები (2–4 სიმბოლო): ჩვენ ალგორითმულად ვაგენერირებთ ყველა შესაძლო სიტყვიერ კომბინაციას (ასოების და ციფრების შერევის გარეშე) და რეგულარულად ვამოწმებთ საჯარო DNS და WHOIS სერვერებს. ეს გვაძლევს შესაძლებლობას შევინარჩუნოთ თავისუფალი მოკლე დომენების აქტუალური ბაზა, რომელიც მომხმარებლებს შეუძლიათ უფასოდ გამოიყენონ სასურველი დომენის მოსაძებნად.
  • გრძელი და აქტიური დომენები: ძირითადი კატალოგის შესაქმნელად ვიყენებთ ისტორიული მონაცემების აგრეგაციას, რომლებიც მიღებულია ინტერნეტ-როუტინგის ანალიტიკური სერვისებისგან.

2. ტექნიკური სკანირება და წარმადობის ანალიზი

ჩვენს ბაზაში არსებული თითოეული საიტი გადის სიღრმისეულ ტექნიკურ აუდიტს. ჩვენ არ ვიყენებთ მესამე მხარის მონაცემთა ბაზებს უცვლელი სახით — ვებსაიტებს თავად ვსკანირებთ და ვაანალიზებთ.

  • რენდერინგი და გამოყენებული ტექნოლოგიები (საკუთარი კროულერი): ჩვენი Puppeteer-ზე დაფუძნებული კროულერი რეალურად სტუმრობს საიტს, იღებს ეკრანის სურათს, ზომავს HTML კოდის მოცულობას, ამოწმებს HTTP უსაფრთხოების სათაურებს, განსაზღვრავს გამოყენებულ ტექნოლოგიებს (CMS, ფრეიმვორქები), აგროვებს ტელეფონის ნომრებსა და სოციალური ქსელების ბმულებს, ზომავს ჩატვირთვის სიჩქარეს, იღებს Open Graph ტეგებს, სათაურებს და სხვა დამატებით სიგნალებს, მაგალითად WebArchive-ის არქივის არსებობას ან Wikipedia-ზე მითითებებს.
  • წარმადობა (Google PageSpeed API): ჩატვირთვის სიჩქარის, სერვერის პასუხის დროის (TTFB) და Core Web Vitals მეტრიკების (LCP, FCP, CLS) შესაფასებლად ვიყენებთ Google PageSpeed API-ის ოფიციალურ ინტეგრაციას. ეს უზრუნველყოფს, რომ ჩვენი მონაცემები მაქსიმალურად შეესაბამებოდეს იმას, თუ როგორ აფასებს საიტებს Google.

3. როგორ ვითვლით GDE Quality Score-ს (QS)

Quality Score წარმოადგენს ჩვენს შიდა, დინამიკურ ხარისხის რეიტინგს. იგი რეგულარულად ახლდება და ამ ეტაპზე ეფუძნება ბიზნესის გამჭვირვალობას, ტექნიკურ უსაფრთხოებასა და მომხმარებელთა აქტივობას. მაღალი პოპულარობის შემთხვევაში საიტმა შეიძლება 100 ქულასაც გადააჭარბოს.

მიმდინარე ფორმულა:

  • საბაზისო უსაფრთხოება: აქტიური HTTPS/SSL სერტიფიკატი (+20 ქულა).
  • ბიზნესის გამჭვირვალობა: საჯაროდ მითითებული ტელეფონის ნომერი (+15 ქულა), ოფიციალური სოციალური ქსელების ბმულები (მდე +15 ქულა).
  • ასაკი და ავტორიტეტი: +1 ქულა დომენის რეგისტრაციის ყოველი სრული წლისთვის (მაქსიმუმ +20 ქულა).
  • შეფასებები და მიმოხილვები: შეფასების ქულა გამრავლებული 5-ზე და დამატებითი ბონუსი დამტკიცებული მიმოხილვების რაოდენობის მიხედვით (მდე +25 ქულა).
  • რეაქციები (Emoji): დადებითი და უარყოფითი რეაქციების შეწონილი ალგორითმი (შესაძლებელია +50 ქულამდე დამატება ან -10 ქულამდე დაკლება სპამისა და თაღლითობის შემთხვევაში).
  • შიდა პოპულარობა: დამატებითი ქულები GDE.ge-ზე ყოველი 500 ნახვისთვის (მდე +10 ქულა).
შენიშვნა: მომავალ განახლებებში QS ფორმულას დაემატება წარმადობის ტექნიკური მაჩვენებლები, გვერდის ზომა და Google PageSpeed-ის მონაცემები.

4. გლობალური ანალიტიკა და OSINT კვლევები

ცალკეული ვებსაიტების პროფილების გარდა, ჩვენ ვაწვდით საქართველოს ინტერნეტსივრცის მასშტაბურ ანალიტიკას, მათ შორის CMS სისტემების პოპულარობას, რეგისტრატორების სტატისტიკასა და ვებსაიტების ასაკობრივ განაწილებას.

  • გლობალური სტატისტიკა: ავტომატურად ახლდება დღეში ოთხჯერ.
  • კატეგორიების სტატისტიკა: კონკრეტული სფეროების (მაგალითად, „ტურიზმი“ ან „ხელოვნება“) ანალიზი ახლდება დღეში ერთხელ.

ტრეკერები და ანალიტიკური კვალი (OSINT): ჩვენი სისტემა აგროვებს ანალიტიკური პლატფორმების იდენტიფიკატორებს (Google Analytics, Yandex Metrica, Facebook Pixel). ეს მონაცემები გამოიყენება მხოლოდ შიდა კვლევებისა და მაკროანალიტიკისთვის, მაგალითად ანალიტიკური სისტემების ბაზრის წილის შესაფასებლად ან დიდი ვებსაიტების ქსელების გამოსავლენად. უსაფრთხოების მიზნით, ამ იდენტიფიკატორებს საჯაროდ არ ვაქვეყნებთ.

5. ხელოვნური ინტელექტი (AI)

ჩვენი ყველა მეტრიკა, სტატისტიკა და გრაფიკი ეფუძნება მკაცრ მათემატიკურ ალგორითმებსა და ავტომატურ სკრიპტებს. ხელოვნური ინტელექტი არ იღებს გადაწყვეტილებებს საიტების რეიტინგთან დაკავშირებით.

თუმცა, თანამედროვე LLM მოდელებს (ნეირონულ ქსელებს) ვიყენებთ ენობრივი ამოცანების შესასრულებლად:

  • საიტის შინაარსის საფუძველზე მოკლე, ობიექტური და ადვილად წასაკითხი აღწერების (Summary) შექმნა.
  • მომხმარებელთა შეფასებებისა და კომენტარების ზუსტი მრავალენოვანი თარგმნა, რათა შემცირდეს ენობრივი ბარიერი ქართულ, ინგლისურ და რუსულ ენებს შორის.

6. მონაცემთა კონფიდენციალურობა (WHOIS და საკონტაქტო ინფორმაცია)

ჩვენ პატივს ვცემთ ვებსაიტების მფლობელების კონფიდენციალურობის უფლებას:

  • თუ დომენის მფლობელმა ან რეგისტრატორმა WHOIS-ის მონაცემები დამალა (Privacy Protection, Redacted), ჩვენ ვაჩვენებთ სტატუსს „მონაცემები დამალულია“.
  • ჩვენ არ ვაგროვებთ დამალულ ტელეფონის ნომრებსა და ელფოსტის მისამართებს რეესტრების სისტემებიდან. GDE.ge-ზე საკონტაქტო ბლოკში ნაჩვენებია მხოლოდ ის ტელეფონის ნომრები და ბმულები, რომლებიც ბიზნესის მფლობელებმა საკუთარი ნებით გამოაქვეყნეს თავიანთი ვებსაიტის მთავარ გვერდზე.

გაეცანით ჩვენს კვლევებს

.GE ანალიტიკის ნახვა

შეჯამებული სტატისტიკა, დომენების რეგისტრაციის ტენდენციები და პოპულარული ტექნოლოგიები