RevealTheme logo

RevealTheme डिटेक्टर कैसे काम करता है

जब आप हमारे किसी डिटेक्टर में कोई URL दर्ज करते हैं, तो परिणाम देखने से पहले के दो सेकंड में बहुत कुछ होता है। जिज्ञासुओं के लिए यहाँ तकनीकी झलक है, जिसमें वे सीमाएँ भी शामिल हैं जिन्हें हम इंजीनियरिंग से हल नहीं कर सकते।

चरण 1: सार्वजनिक HTML प्राप्त करना

जब आप कोई URL भेजते हैं, तो हमारा सर्वर एक मानक ब्राउज़र User-Agent का उपयोग करके उस URL के सार्वजनिक वेब पेज को प्राप्त करता है। यह वही HTML है जो आपका ब्राउज़र प्राप्त करता यदि आप साइट पर सीधे जाते। हम पेवॉल को पार नहीं करते, लॉगिन-संरक्षित सामग्री नहीं निकालते, न ही किसी प्रमाणीकरण का उपयोग करते।

प्राप्ति में 20 सेकंड का टाइमआउट उपयोग होता है। हम 10 तक रीडायरेक्ट का अनुसरण करते हैं (जो HTTP → HTTPS, www → बिना-www और देश-वार रीडायरेक्ट को कवर करता है)। यदि साइट 4xx या 5xx प्रतिक्रिया लौटाती है, या टाइमआउट विंडो के भीतर जवाब नहीं देती, तो हम अनुमान लगाने के बजाय एक स्पष्ट «पहुँच नहीं हो सकी» त्रुटि लौटाते हैं।

चरण 2: प्लेटफ़ॉर्म की पहचान

किसी विशिष्ट थीम की पहचान का प्रयास करने से पहले, हम जाँचते हैं कि साइट कौन-सा CMS चला रही है। हम 7 समर्थित प्लेटफ़ॉर्म — WordPress, Shopify, Magento, Joomla, Drupal, Moodle और PrestaShop — के फ़िंगरप्रिंट खोजते हैं और सबसे मज़बूत मिलान चुनते हैं।

यदि आप हमारे WordPress डिटेक्टर में कोई Shopify URL भेजते हैं (या इसके विपरीत), तो हम आपको बताते हैं और सही डिटेक्टर से लिंक करते हैं। कोई अनुमान नहीं, कोई फ़ॉल्स पॉज़िटिव नहीं।

चरण 3: थीम की पहचान

विशेष रूप से WordPress के लिए, थीम संदर्भ आमतौर पर पेज के HTML में wp-content/themes/THEME_NAME/style.css जैसे पथों में दिखाई देते हैं। हम दस्तावेज़ के किसी भी हिस्से से ऐसे प्रत्येक संदर्भ को निकालते हैं: link टैग, script टैग, इनलाइन JavaScript, JSON-LD ब्लॉक और यहाँ तक कि टेक्स्ट सामग्री भी। यह उन थीमों का पता लगाता है जिन्हें अत्यधिक-अनुकूलित साइटों ने मानक पहचान टूल से छिपा रखा है।

प्रत्येक पहचानी गई थीम के लिए, हम थीम की style.css फ़ाइल प्राप्त करने का प्रयास करते हैं। उस फ़ाइल का हेडर सीधे थीम डेवलपर से थीम का आधिकारिक नाम, लेखक, संस्करण, URI और विवरण रखता है। यही उस समृद्ध थीम जानकारी का स्रोत है जिसे हम पहचान परिणाम के साथ दिखाते हैं।

चरण 4: प्लगइन की पहचान

प्लगइन पहचान दो समानांतर तरीकों का उपयोग करती है। पहला, हम wp-content/plugins/PLUGIN_NAME/ से मेल खाने वाला कोई भी फ़ाइल पथ निकालते हैं। दूसरा, हम दर्जनों सिग्नेचर-आधारित जाँचें चलाते हैं: हम विशिष्ट HTML संरचनाएँ, CSS क्लास नाम, इनलाइन JavaScript चर और HTTP प्रतिक्रिया हेडर खोजते हैं जो Elementor, Yoast SEO, WPForms, WooCommerce, Wordfence और अन्य जैसे लोकप्रिय प्लगइन्स की विशिष्ट रूप से पहचान करते हैं।

दोहरे-तरीके का डिज़ाइन उन प्लगइन्स का पता लगाता है जो अपने फ़ाइल पथ छिपाते हैं (कैशिंग या रिसोर्स बंडलिंग के माध्यम से) पर फिर भी विशिष्ट सिग्नेचर छोड़ते हैं। प्रत्येक पहचाने गए प्लगइन के लिए, हम उसे WordPress.org प्लगइन निर्देशिका में खोजते हैं ताकि परिणाम को प्लगइन के आधिकारिक नाम, विवरण, लेखक और स्क्रीनशॉट से समृद्ध किया जा सके।

चरण 5: होस्टिंग + DNS खोज

होस्टिंग प्रदाता की पहचान करने के लिए, हम डोमेन पर एक DNS खोज करते हैं और IP पते, ASN तथा रिवर्स DNS का निरीक्षण करते हैं। हम इसे प्रदाता की पहचान के लिए ज्ञात होस्टिंग प्रदाता IP रेंज के डेटाबेस से मिलाते हैं। प्रमुख होस्टिंग (AWS, Cloudflare, Hostinger, SiteGround आदि) के लिए सटीकता अधिक है और निशे प्रदाताओं के लिए कम।

हम क्या नहीं कर सकते

कुछ ऐसे मामले जहाँ पहचान काम नहीं करेगी, चाहे हमारा कोड कितना भी अच्छा हो:

  • Cloudflare बॉट चुनौती। सख़्त Cloudflare बॉट सुरक्षा वाली साइटें («सुरक्षा सत्यापन कर रहे हैं...» स्क्रीन) हमारे फ़ेचर को उसी तरह ब्लॉक करती हैं जैसे वे किसी भी स्वचालित अनुरोध को ब्लॉक करतीं। इससे बचने का कोई साफ़ तरीका नहीं है।
  • भारी रूप से अनुकूलित थीम। यदि किसी थीम में इतना संशोधन हुआ है कि HTML से मूल थीम नाम का हर संदर्भ हटा दिया गया है, तो हमारे पास पहचानने को कुछ नहीं बचता।
  • रिसोर्स पथ पुनर्लेखन वाली आक्रामक कैशिंग। LiteSpeed Cache, WP Rocket और Cloudflare का Rocket Loader जैसे प्लगइन्स कभी-कभी स्रोत छिपाने के लिए रिसोर्स URL को फिर से लिखते हैं। हमारी सिग्नेचर-आधारित पहचान इनमें से अधिकांश का पता लगाती है, पर सभी का नहीं।
  • स्टैटिक-निर्यात साइटें। वह WordPress साइट जिसे स्टैटिक HTML में निर्यात कर दिया गया है, अधिकांश रनटाइम सिग्नेचर खो देती है जो पहचान को संभव बनाते हैं।

हम क्या नहीं करते

हमसे पूछा गया है। उत्तर हैं नहीं:

  • हम आपके द्वारा भेजे गए URL संग्रहीत नहीं करते
  • हम मार्केटिंग उद्देश्यों के लिए IP पते लॉग नहीं करते
  • हम पहचान डेटा प्रदाताओं के साथ साझा नहीं करते
  • हम प्रमाणीकरण, robots.txt या अन्य एक्सेस नियंत्रणों को पार नहीं करते
  • हम सुरक्षा कारणों से आंतरिक/निजी IP (127.0.0.1, 10.x.x.x आदि) पर डिटेक्टर नहीं चलाते

गोपनीयता के पूर्ण विवरण हमारी गोपनीयता नीति में हैं।

API एक्सेस

वर्तमान में हम सार्वजनिक API प्रदान नहीं करते, पर एजेंसियों और शोधकर्ताओं के लिए अनुरोध पर सीमित प्रोग्रामेटिक एक्सेस उपलब्ध है। अपने उपयोग के मामले और अनुमानित अनुरोध मात्रा के साथ hello@revealtheme.com पर लिखें।

यह ओपन-सोर्स क्यों नहीं है?

पहचान नियम उत्पाद का मूल हैं, और जैसे-जैसे थीम तथा प्लगइन्स विकसित होते हैं हम इन्हें बार-बार अपडेट करते हैं। इनका कोड ओपन-सोर्स करने से हमारी अपडेट की गति धीमी हो जाएगी। फिर भी, हम अपने ब्लॉग पर पहचान तकनीकों के बारे में विस्तृत प्रविष्टियाँ प्रकाशित करते हैं: उन्हें खोजने के लिए «पहचान» खोजें।

इसे आज़माने के लिए तैयार हैं?

जिस साइट का आप निरीक्षण करना चाहते हैं उससे मेल खाने वाले डिटेक्टर का उपयोग करें:

अपडेट के लिए सब्सक्राइब करें

हम आपका ईमेल नहीं बेचते। हम स्पैम नहीं करते।

© 2026 RevealTheme. All rights reserved.