मैं केवल पहली छवि यूआरएल को स्क्रैप करने की कोशिश कर रहा हूं जिसमें एक जेपीजी है। मेरे पास वर्तमान में जो कोड है वह सभी जेपीजी छवियों को खींचता है जब मैं केवल पहला चाहता हूं।
images = soup.findAll('img', src=True)
image_src = [x['src'] for x in images]
image_src = [x for x in image_src if x.endswith('.jpg')]
print('Number of Images: ', len(images))
for image in image_src:
print(image)
2 जवाब
मैं इसके बजाय लूप के बाद break
जोड़ूंगा, फिर यह पहले पुनरावृत्ति पर टूट जाएगा:
image = soup.findAll('img', src=True)
image_src = [x['src'] for x in images]
image_src = [x for x in image_src if x.endswith('.jpg')]
print('Number of Images: ', len(images))
for image in image_src:
print(image)
break
आप इसका उपयोग पृष्ठ में छवियों के सभी लिंक को स्क्रैप करने के लिए कर सकते हैं, मैंने एक विकी पृष्ठ का उपयोग किया है
from bs4 import BeautifulSoup
import requests
content = requests.get('https://en.wikipedia.org/wiki/Blaise_Pascal').content
soup = BeautifulSoup(content, 'lxml')
image_tags = soup.findAll('img')
for image_tag in image_tags:
print(image_tag.get('src'))
पहला लिंक पृष्ठ में पहली छवि है। यदि आप अंत में break
जोड़ते हैं तो आपको साइट की पहली छवि प्राप्त होगी।
संबंधित सवाल
नए सवाल
python
पायथन एक बहु-प्रतिमान है, गतिशील रूप से टाइप किया हुआ, बहुउद्देशीय प्रोग्रामिंग भाषा है। यह एक साफ और एक समान वाक्यविन्यास सीखने, समझने और उपयोग करने के लिए त्वरित होने के लिए डिज़ाइन किया गया है। कृपया ध्यान दें कि अजगर 2 आधिकारिक तौर पर 01-01-2020 के समर्थन से बाहर है। फिर भी, संस्करण-विशिष्ट पायथन सवालों के लिए, [अजगर -२.०] या [अजगर -३.x] टैग जोड़ें। पायथन वेरिएंट (जैसे, ज्योथन, PyPy) या लाइब्रेरी (उदा।, पांडस और न्यूमपी) का उपयोग करते समय, कृपया इसे टैग में शामिल करें।