screenshot of the Dataset

सबको सुप्रभात। कृपया मुझे एक समस्या है जिसे मैं पिछले कुछ समय से हल नहीं कर पाया हूं। (कृपया मेरे डेटा सेट का स्क्रीन शॉट देखने के लिए छवि लिंक पर एक नज़र डालें) < a href="https://i.stack.imgur.com/g2eTM.jpg" rel="nofollow noreferrer">https://i.stack.imgur.com/g2eTM.jpg

मेरे पास डेटा का एक कॉलम है (status) जिसमें मानों के दो सेट (1 और 2) शामिल हैं। ये डमी हैं जो आश्रित चर (जैसे Pp और Pt) की दो श्रेणियों (या स्थिति) का प्रतिनिधित्व करते हैं, जिनकी मुझे प्रतिगमन के लिए आवश्यकता है। उनके वास्तविक मूल्यों में अंतिम कॉलम Pp.Pt (Pp. पीटी सिर्फ एक नाम है और कुछ नहीं)

मुझे पीपी या पीटी (अर्थात् पीपी.पीटी कॉलम में अपने संबंधित मानों का उपयोग करके प्रत्येक का दो अलग-अलग प्रतिगमन चलाने की आवश्यकता है (अंतिम कॉलम में प्रत्येक मान या तो स्थिति 1 या स्थिति 2 का है) मजबूत> । **मेरा सवाल है कि मैं उन्हें इन दो श्रेणियों 1 = पीपी और 2 = पीटी में कैसे अलग कर सकता हूं या समूह बना सकता हूं ताकि मैं उन्हें स्पष्ट रूप से पहचान और समूहित कर सकूं।

https://i.stack.imgur.com/g2eTM.jpg

आपकी तरह की मदद के लिए बहुत-बहुत धन्यवाद। बेस्ट लुडोविक

0
ThinkingEconomist 21 अप्रैल 2021, 16:03

2 जवाब

सबसे बढ़िया उत्तर

यह दृष्टिकोण आपकी समस्या को ठीक कर सकता है

yourdata %>%
mutate(classofyourcolumn=ifelse(columntosplit<quantile(columntosplit,0.5),1,0))  
0
Samet Sökel 21 अप्रैल 2021, 17:01

Split-Apply-Combine विधि :

# Using the mtcars dataset as an example: 
df <- mtcars

# Allocate some memory for a list storing the split data.frame: 
# df_list => empty list with the number of elements of the unique
# values of the cyl vector
df_list <- vector("list", length(unique(df$cyl)))

# Split the data.frame by the cyl vector: 
df_list <- split(df, df$cyl)

# Apply the regression model, return the summary data: 
lapply(df_list, function(x){
  summary(lm(mpg ~ hp, data = x))
  }
)
1
hello_friend 21 अप्रैल 2021, 16:18