मुझे इनपुट टेक्स्ट में सभी वेबसाइट पते खोजने होंगे और सभी पतों को टेक्स्ट में दिखाई देने के क्रम में प्रिंट करना होगा, प्रत्येक एक नई लाइन पर। "https: //" "http: //" "www।"

मैंने स्ट्रिंग में स्प्लिट का इस्तेमाल किया, लेकिन मैं इस 'www' से शुरू होने वाली शुरुआत को वापस नहीं कर सकता। क्या कोई मुझे समझा सकता है कि मैं इसे कैसे हल कर सकता हूं?

नमूना इनपुट 1:

WWW.GOOGLE.COM 100 प्रतिशत नवीकरणीय ऊर्जा स्रोतों का उपयोग करता है और www.ecosia.com प्रत्येक 45 पर एक पेड़ लगाता है खोजता है!

नमूना आउटपुट 1:

WWW.GOOGLE.COM

www.ecosia.com

text = input()
text = text.lower()
words = text.split(" ")
for word in words:
-1
João Paulo Assunção 2 सितंबर 2020, 06:34

2 जवाब

सबसे बढ़िया उत्तर

रेगेक्स का उपयोग करने का एक बेहतर तरीका है। आप इस से अधिक अच्छे रेगेक्स पैटर्न सीख सकते हैं

import re
url_regex = r"(?i)(https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|www\.[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9]\.[^\s]{2,}|https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9]+\.[^\s]{2,}|www\.[a-zA-Z0-9]+\.[^\s]{2,})"
raw_string = "WWW.GOOGLE.COM uses 100-percent renewable energy sources and www.ecosia.com plants a tree for every 45 searches!"
urls = re.findall(url_regex, raw_string)
0
HoangYell 2 सितंबर 2020, 08:40

मैं क्या करूँगा "www" couse' को पकड़ने के लिए हम जानते हैं कि प्रत्येक यूआरएल भिखारी है, और एक स्पेसबार के साथ समाप्त होता है, इसलिए सब कुछ और सरणी डालें और फिर इसे प्रिंट करें, लेकिन पाइथन के पुस्तकालय में बहुत सारे स्ट्रिंग फ़ंक्शन हैं लेकिन मैं इसमें से बहुतों को नहीं जानता।

str = " www.GOOGLE.COM uses 100-percent renewable energy sources and www.ecosia.com plants a tree for every 45 searches! "
str.lower()
tmp = ""
all_url = []
k=0
for i in range(len(str)-3):
    if(str[i]+str[i+1]+str[i+2] == "www"):
        k=i+4
        while(str[k] != " "):
            tmp=tmp+str[k]
            k+=1
        all_url.append(tmp)
        tmp = ""
        i=k
for url in all_url:
    print("www." + url )
0
snow king of nothing 2 सितंबर 2020, 07:16