वेब पेजों के लिए कभी-कभी सीएसएस कक्षाओं को अस्पष्ट/छोटा करना सामान्य बात है। यह यादृच्छिक वर्ग नामों के कारण पृष्ठ स्क्रैपिंग को रोकने का (शायद जानबूझकर) दुष्प्रभाव है।

पृष्ठ अच्छी तरह से परिभाषित है - जबकि प्रत्येक पृष्ठ लोड पर एचटीएमएल अलग है, प्रस्तुत पृष्ठ हमेशा वही दिखता है। उदाहरण के लिए, हमेशा font-size: 20px; color: black; पर एक शीर्षक होता है, या एक विवरण हमेशा font-size: 15px; line-height: 1.5; होता है और इसी तरह...

क्या कक्षा के नामों को अन-यादृच्छिक बनाने की कोई प्रक्रिया है? या प्रस्तुत शैली के आधार पर तत्वों का चयन करने का एक तरीका (जैसे font-size: 20px; color: black;)?

<div tabindex="0" class="styles__Header-sc-120s71t-1 bVobsP">
    <h6 class="jss85xpic jsspbfkgl jssfrl2gs" style="max-width: 100%;">Title</h6>
    <div class="styles__Description-sc-120s71t-2 cilEqp">
        <p class="jss85xpic jsspbfkgl jssou361l" style="max-width: 100%;">Description</p>
    </div>
    <div class="styles__ItemsList-sc-120s71t-3 gyRIpM">
        <div itemscope="" itemtype="http://schema.org/Product" role="button" tabindex="0" class="styles__Wrapper-sc-1xl58bi-2 gKTcIQ" style="max-width: 100%;">
            <div class="styles__FlexContainer-sc-1xl58bi-4 bLvOGI">
                <div class="styles__TextWrapper-sc-1xl58bi-9 liomPZ">
                    <div class="styles__Title-sc-1xl58bi-5 eqysaj">
                        <h3 class="jss85xpic jsspbfkgl jssws5ijf" style="max-width: 100%;"><span itemprop="name">Item 1</span></h3>
                    </div>
               </div>
           </div>
       </div>
   </div>
</div>
0
rese 27 अक्टूबर 2019, 05:41

1 उत्तर

सबसे बढ़िया उत्तर

यदि कक्षाएं वास्तव में हर बार यादृच्छिक हो रही हैं तो मुझे यकीन नहीं है कि आप वहां क्या कर सकते हैं। और स्टाइल द्वारा खोज करने के लिए प्रत्येक तत्व की गणना की गई शैली की जाँच करने के लिए पाशविक बल की आवश्यकता होगी।

यदि आप जो खोज रहे हैं वह इस HTML को पार करने का एक तरीका है: क्या आकार हमेशा संगत है? आप टैग चयनकर्ताओं, "तत्काल बच्चे" चयनकर्ताओं [>] और "शुरुआत के साथ" चयनकर्ताओं [^] (उन styles__*** वर्गों के लिए) के संयोजन का उपयोग कर सकते हैं। आप जिन तत्वों की तलाश कर रहे हैं।

उदा.: शीर्षक [class^="styles__Header"] > h6 होगा। विवरण [class^="styles__Description"] > p होगा।

2
SamVK 27 अक्टूबर 2019, 03:14