मैं Python3 में केवल इमोजी को परिमार्जन करने की कोशिश कर रहा हूं। मैंने if स्टेटमेंट के साथ starttwith मेथड का इस्तेमाल किया लेकिन परिणाम में कुछ यूनिकोड मिले कि इमोजी का HTML टैग दूसरों की तरह ही लगता है। मुझे नहीं पता कि कुछ इमोजी को यूनिकोड में क्यों बदला जाता है। क्या आप मुझे कोई सलाह दे सकते हैं ?? या इस यूनिकोड को सूची से हटाने का कोई तरीका है। यहां छवि विवरण दर्ज करें

from urllib.request import urlopen
import requests
from bs4 import BeautifulSoup
import re
import os

list0 = []

site_url = "https://www.emojiall.com/zh-hant/categories/A"
get_url = requests.get(site_url)
soup = BeautifulSoup(get_url.text, "lxml")

for script in soup(["span"]):
    script.extract()
    
emojis = soup.select('.emoji_font')
words = soup.select('.emoji_name_truncate')

for emoji0 in emojis:
    emoji1 = emoji0.getText()
    if not repr(emoji1).startswith(r'\U'):
        list0.append(emoji1)
    else:
        continue
print(list0)
0
amaturePy 27 सितंबर 2020, 12:06

1 उत्तर

सबसे बढ़िया उत्तर

मैंने संपादक को अपडेट किया और यह अच्छी तरह से काम करता है।

from urllib.request import urlopen
import requests
from bs4 import BeautifulSoup
import re
import os

list0 = []

site_url = "https://www.emojiall.com/zh-hant/categories/A"
get_url = requests.get(site_url)
soup = BeautifulSoup(get_url.text, "lxml")

for script in soup(["span"]):
    script.extract()

emojis = soup.select('.emoji_font')
words = soup.select('.emoji_name_truncate')

for emoji0 in emojis:
    emoji1 = emoji0.getText()
    if not repr(emoji1).startswith(r"'\U"):
        list0.append(emoji1)
    else:
        continue
print(list0)
0
amaturePy 27 सितंबर 2020, 09:26