ऐसा लगता है कि पांडा एक तालिका में रिकॉर्ड से प्रमुख पात्रों को अलग कर रहे हैं, और मुझे यकीन नहीं है कि क्यों। प्रत्येक रिकॉर्ड 5 नंबर का होता है, और कुछ के आगे एक प्रतीक (-, +, ~) होता है। उदा: ~12345, +67890, -99999

नीचे दिए गए कोड का उपयोग करके, मैं डेटा को .xls से डेटाफ़्रेम में पढ़ता हूं, एक फ़ील्ड ड्रॉप करता हूं, एक फ़ील्ड का नाम बदलता हूं, शीट का नाम बदलता हूं, और कॉलम को पुनर्व्यवस्थित करता हूं। अंत में, इसे .xlsx के रूप में सहेजा जाता है।

अंतिम उत्पाद अच्छा दिखता है, इस तथ्य के अलावा कि CDP_PLACEFP के रिकॉर्ड में चिह्न छीन लिए गए हैं। यानी, ऊपर दिए गए मान 123456, 67890, -99999 हो जाते हैं (किसी कारण से माइनस दूसरों की तरह नहीं हटाया जाता है)।

प्रारंभिक तालिका में सही मान हैं। क्या इसे रोकने के लिए मुझे कोई स्पष्ट आदेश देने की आवश्यकता है?

arcpy.TableToExcel_conversion(cheapet_cdp_changes, cheapet_table_initial)
df = pd.read_excel(cheapet_table_initial)
df = df.drop(['FID'], axis=1) #Drop FID column
df = df.rename(columns={"TEMP_FP":"CDP_PLACEFP"}) #Rename TEMP_FP to CDP_PLACEFP
df = df.reindex(columns = ['PRIM_ID', 'STATEFP', 'COUNTYFP', 'CDP_PLACEFP']) #Rearrange columns
df.to_excel(os.path.join(pf, 'CHEAPET_{}.xlsx'.format(stcou)), sheet_name = 'CHEAPET', index=False)
1
Josh 22 मार्च 2021, 18:54

1 उत्तर

सबसे बढ़िया उत्तर

स्ट्रिंग के रूप में पढ़ने के लिए converters पैरामीटर का उपयोग read_excel() में करें।

df = pd.read_excel(cheapet_table_initial, converters={'your_column_name':str, ...)

संदर्भ pandas.read_excel

1
Tao-Lung Huang 22 मार्च 2021, 20:01