इसलिए मैं एक ऐसे प्रोजेक्ट पर काम कर रहा हूं, जो इस पूरे साल के कोविड-19 डेटा का विश्लेषण करता है। मेरे पास किसी दिए गए निर्देशिका में एकाधिक सीएसवी फ़ाइलें हैं। मैं हर महीने सभी फाइलों की सामग्री को एक एकल, व्यापक सीएसवी फ़ाइल में मर्ज करने का प्रयास कर रहा हूं। जैसा कि नीचे दिखाया गया है, यहां तक ​​​​कि मुझे जो मिला है ... विशेष रूप से, दिखाई देने वाला त्रुटि संदेश 'EmptyDataError: फ़ाइल से पार्स करने के लिए कोई कॉलम नहीं है।' अगर मुझे df = pd.read_csv('./csse_covid_19_daily_reports_us/' + file) को हटाना है और बस print(file) चलाना है तो यह उन सभी सही फाइलों को सूचीबद्ध करता है जिन्हें मैं मर्ज करने का प्रयास कर रहा हूं। हालांकि, सभी डेटा को एक में मर्ज करने का प्रयास करते समय मुझे वह त्रुटि संदेश मिलता है। क्या दिया?

import pandas as pd
import os


df = pd.read_csv('./csse_covid_19_daily_reports_us/09-04-2020.csv')

files = [file for file in os.listdir('./csse_covid_19_daily_reports_us')]

all_data = pd.DataFrame()

for file in files:
    df = pd.read_csv('./csse_covid_19_daily_reports_us/' + file)
    all_data = pd.concat([all_data, df])

all_data.head()
1
Benjamin Parsons 9 सितंबर 2020, 21:14

1 उत्तर

सबसे बढ़िया उत्तर

दोस्तों, मैंने इस मुद्दे को सुलझा लिया है। files = [file for file in os.listdir('./csse_covid_19_daily_reports_us')] वाली फाइलों को छानने के बजाय, मैंने इसके बजाय files=[f for f in os.listdir("./") if f.endswith('.csv')] का उपयोग किया है। इसने कुछ कचरा फ़ाइलों को फ़िल्टर किया जो .csv नहीं थीं, इस प्रकार मुझे सभी डेटा को एक csv में संकलित करने की अनुमति मिली।

1
Benjamin Parsons 9 सितंबर 2020, 21:29