मेरे डेटासेट के कॉलम में से एक में "कीवर्ड" मान इस तरह संग्रहीत हैं:

monster|dna|tyrannosaurus rex|velociraptor|island

मैं प्रत्येक कीवर्ड को (|) पाइपलाइन पर विभाजित करना चाहता हूं और इसे एक नई पंक्ति के रूप में संग्रहीत करना चाहता हूं, इसलिए मैं बाद में कीवर्ड के आधार पर सहसंबंधों को देखने के लिए groupby का उपयोग कर सकता हूं।

मुझे जो सबसे दूर मिला वह था:

dfn = df['keywords'].str.split('|',expand=True)

लेकिन यह उन्हें नए कॉलम के रूप में संग्रहीत करता है, नई पंक्तियों के रूप में नहीं, और यह केवल इन मानों को केवल एक नए डेटाफ़्रेम में संग्रहीत करता है। मुझे अभी भी इसे मूल डेटाफ़्रेम में वापस जोड़ने की आवश्यकता है, और फिर कीवर्ड क्लस्टर वाली मूल पंक्तियों को छोड़ दें।

0
bytebybyte 16 अप्रैल 2018, 03:03

1 उत्तर

सबसे बढ़िया उत्तर

आप split के बाद stack जोड़ सकते हैं

dfn = df['keywords'].str.split('|',expand=True).stack()
1
BENY 16 अप्रैल 2018, 00:07