सबको सुप्रभात। कृपया मुझे एक समस्या है जिसे मैं पिछले कुछ समय से हल नहीं कर पाया हूं। (कृपया मेरे डेटा सेट का स्क्रीन शॉट देखने के लिए छवि लिंक पर एक नज़र डालें) < a href="https://i.stack.imgur.com/g2eTM.jpg" rel="nofollow noreferrer">https://i.stack.imgur.com/g2eTM.jpg
मेरे पास डेटा का एक कॉलम है (status) जिसमें मानों के दो सेट (1 और 2) शामिल हैं। ये डमी हैं जो आश्रित चर (जैसे Pp और Pt) की दो श्रेणियों (या स्थिति) का प्रतिनिधित्व करते हैं, जिनकी मुझे प्रतिगमन के लिए आवश्यकता है। उनके वास्तविक मूल्यों में अंतिम कॉलम Pp.Pt (Pp. पीटी सिर्फ एक नाम है और कुछ नहीं)।
मुझे पीपी या पीटी (अर्थात् पीपी.पीटी कॉलम में अपने संबंधित मानों का उपयोग करके प्रत्येक का दो अलग-अलग प्रतिगमन चलाने की आवश्यकता है (अंतिम कॉलम में प्रत्येक मान या तो स्थिति 1 या स्थिति 2 का है) मजबूत> । **मेरा सवाल है कि मैं उन्हें इन दो श्रेणियों 1 = पीपी और 2 = पीटी में कैसे अलग कर सकता हूं या समूह बना सकता हूं ताकि मैं उन्हें स्पष्ट रूप से पहचान और समूहित कर सकूं।
https://i.stack.imgur.com/g2eTM.jpg
आपकी तरह की मदद के लिए बहुत-बहुत धन्यवाद। बेस्ट लुडोविक
2 जवाब
यह दृष्टिकोण आपकी समस्या को ठीक कर सकता है
yourdata %>%
mutate(classofyourcolumn=ifelse(columntosplit<quantile(columntosplit,0.5),1,0))
Split-Apply-Combine
विधि :
# Using the mtcars dataset as an example:
df <- mtcars
# Allocate some memory for a list storing the split data.frame:
# df_list => empty list with the number of elements of the unique
# values of the cyl vector
df_list <- vector("list", length(unique(df$cyl)))
# Split the data.frame by the cyl vector:
df_list <- split(df, df$cyl)
# Apply the regression model, return the summary data:
lapply(df_list, function(x){
summary(lm(mpg ~ hp, data = x))
}
)