मैं k-निकटतम पड़ोसी मॉडल के लिए अपने डेटा को मान्य करने का प्रयास करते समय प्राप्त होने वाले परिणामों की व्याख्या करने का प्रयास कर रहा हूं। मेरा डेटा सेट की तरह सेट किया गया है

वेरिएबल1 (इंट) | वेरिएबल2 (इंट) | वेरिएबल3 (इंट) | वेरिएबल4 (इंट) | प्रतिक्रिया (कारक)

एक बार जब मैं अपना मॉडल चुन लेता हूं तो मैंने अपना डेटा 80% cvdata में और 20% परीक्षण के लिए विभाजित कर दिया।

मेरे कोड के लिए एक एकल पुनरावृत्ति नीचे है:

    cv <- cv.kknn(formula = Response~., cvdata, kcv = 10, k = 7, kernel = 'optimal', scale = TRUE)
    cv

जब मैं 'सीवी' चलाता हूं तो यह सिर्फ एक सूची देता है() जिसमें कुछ प्रतीत होता है यादृच्छिक संख्याएं होती हैं जैसे कि पंक्तिनाम, देखे गए परिणाम चर (वाई) और अनुमानित परिणाम चर (yhat)। मैं परीक्षण सेट में किसी प्रकार की सटीकता की गणना करने की कोशिश कर रहा हूं। क्या मुझे पुष्टि करने के लिए y से yhat की तुलना करनी चाहिए?

संपादित करें: आउटपुट नीचे जोड़ा गया

    [[1]]
         y        yhat
    492 1 0.724282776
    654 0 0.250394372
    427 0 0.125159894
    283 0 0.098561768
    218 1 0.409990851

    [[2]]
     [1] 0.2267058 0.1060212
3
tnerbusas 31 अगस्त 2019, 20:25

1 उत्तर

सबसे बढ़िया उत्तर

[२] में पहला तत्व माध्य पूर्ण त्रुटि है, दूसरा माध्य चुकता त्रुटि है। मान लीजिए df आपका डेटाफ़्रेम है, तो उन मानों को माध्य (abs(df$y - df$yhat)) और माध्य ((df$y - df$yhat)^2) द्वारा आसानी से परखा जा सकता है।

1
L_HE 18 जिंदा 2020, 14:17