मुझे एक अविभाज्य समय-श्रृंखला डेटा सेट के औसत अंतराल आकार की गणना करने की आवश्यकता है। imputeTS पैकेज इस डेटा का उपयोग करके प्लॉट बनाता है। क्या statsNA या plotNA.gapsize से 'अंतर आकार' और 'घटना की संख्या' निकालना संभव है? या समय-श्रृंखला डेटा सेट में अंतराल के औसत आकार को खोजने का कोई अन्य तरीका है? (आप imputeTS पैकेज से tsNH4 डेटा सेट का उपयोग कर सकते हैं)

(यह पहली बार है जब मैं यहां प्रश्न पूछ रहा हूं और मैं 'आर' के लिए बिल्कुल नया हूं)

1
Charitha 1 जून 2020, 20:26

1 उत्तर

सबसे बढ़िया उत्तर

फिलहाल आप imputeTS के CRAN संस्करण के साथ कुछ अतिरिक्त कार्य के साथ केवल अप्रत्यक्ष रूप से औसत अंतर आकार प्राप्त कर सकते हैं।

लेकिन मैंने GitHub पर विकास संस्करण के लिए एक त्वरित अद्यतन किया। अब आप statsNA फ़ंक्शन के साथ औसत अंतर आकार भी प्राप्त कर सकते हैं।

इसलिए आपको पहले गिटहब से नया संस्करण स्थापित करना होगा (क्योंकि यह अभी तक सीआरएएन पर नहीं है):

library("devtools")
install_github("SteffenMoritz/imputeTS")

यदि आपके पास "devtools" स्थापित नहीं है, तो इस पुस्तकालय को भी शुरुआत में ही स्थापित करें

install.packages("devtools")

बाद में हमेशा की तरह imputeTS पैकेज का उपयोग करें।

library("imputeTS")

#Example with the tsNH4 dataset
statsNA(tsNH4)

यह अब आपको निम्नलिखित प्रिंट करेगा:

> statsNA(tsNH4)

[1] "Length of time series:"
[1] 4552
[1] "-------------------------"
[1] "Number of Missing Values:"
[1] 883
[1] "-------------------------"
[1] "Percentage of Missing Values:"
[1] "19.4%"
[1] "-------------------------"
[1] "Number of Gaps:"
[1] 155
[1] "-------------------------"
[1] "Average Gap Size:"
[1] 5.696774
[1] "-------------------------"
[1] "Stats for Bins"
[1] "  Bin 1 (1138 values from 1 to 1138) :      233 NAs (20.5%)"
[1] "  Bin 2 (1138 values from 1139 to 2276) :      433 NAs (38%)"
[1] "  Bin 3 (1138 values from 2277 to 3414) :      135 NAs (11.9%)"
[1] "  Bin 4 (1138 values from 3415 to 4552) :      82 NAs (7.21%)"
[1] "-------------------------"
[1] "Longest NA gap (series of consecutive NAs)"
[1] "157 in a row"
[1] "-------------------------"
[1] "Most frequent gap size (series of consecutive NA series)"
[1] "1 NA in a row (occuring 68 times)"
[1] "-------------------------"
[1] "Gap size accounting for most NAs"
[1] "157 NA in a row (occuring 1 times, making up for overall 157 NAs)"

जैसा कि आप देख सकते हैं, 'अंतराल की संख्या' और 'औसत अंतर आकार' अब आउटपुट में नया जोड़ा गया है।

आप आउटपुट को एक चर के रूप में भी एक्सेस कर सकते हैं:

library("imputeTS")

#To actually get a output object, set print_only to false

out <- statsNA(tsNH4, print_only = F)

# Average gap size
out$average_size_na_gaps

# Number of Gaps
out$number_na_gaps

#Number of NAs
out$number_NAs

अपडेट अगले सीआरएएन अपडेट में भी होंगे। (सुझाव के लिए धन्यवाद) बस थोड़ा सा सावधान रहें, क्योंकि यह एक विकास संस्करण है - इस प्रकार सीआरएएन संस्करण के रूप में इतनी अच्छी तरह से परीक्षण नहीं किया गया है।

0
Steffen Moritz 3 जून 2020, 03:00