6 सूत्री केन्द्रित चलती - औसत


डेविड, हां, मानचित्रराडस का उद्देश्य बड़ी मात्रा में डेटा पर काम करना है और यह विचार यह है कि आम तौर पर, मानचित्र और कम करने के कार्य को ध्यान में रखना चाहिए कि कितने मैपर्स या कितने रेड्यूसर हैं, यह सिर्फ अनुकूलन है। यदि आप मुझे एल्गोरिथ्म के बारे में सावधानी से सोचते हैं, तो आप देख सकते हैं कि यह कोई बात नहीं है कि कौन सा मैपर डेटा के कुछ हिस्से को प्राप्त करता है। प्रत्येक इनपुट रिकॉर्ड प्रत्येक कम ऑपरेशन के लिए उपलब्ध होगा जो इसकी आवश्यकता है। ndash जो के के सितम्बर 18 18 12 12:30 में सबसे अच्छा मेरी समझ में चलती औसत मैप नक्शे के लिए नक्शे नहीं है क्योंकि इसकी गणना अनिवार्य रूप से सॉर्ट किए गए डेटा पर खिड़की स्लाइडिंग है, जबकि एमआर सॉर्ट किए गए डेटा के गैर-अन्तर्निहित श्रेणियों की प्रक्रिया कर रहा है। मैं जो समाधान देख रहा हूं वह निम्नलिखित है: क) कस्टम पार्टिशनर को कार्यान्वित करने के लिए दो रनों में दो अलग-अलग विभाजन बनाने में सक्षम होना। प्रत्येक रन में आपके रिड्यूसर को डेटा की विभिन्न श्रेणियां मिलेंगी और औसत चलती का अनुमान लगाया जाता है जहां उपयुक्तता को मैं उदाहरण देने की कोशिश करूँगा: रेडर्स के पहले रन डेटा में होना चाहिए: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 । यहां आप कुछ क्यू के लिए चलती औसत को कैलोरी कर देंगे। अगले रन में आपके रिड्यूसर को डेटा मिलना चाहिए: R1: Q1 Q6 R2: Q6 Q10 R3: Q10..Q14 और शेष चलती औसतों को सीक्यूलेट करें। फिर आपको परिणामों को एकसाथ करना होगा। कस्टम पार्टीशनर की आइडिया में ऑपरेशन के दो तरीके होंगे - हर बार समान श्रेणियों में विभाजित होता है, लेकिन कुछ बदलाव के साथ। एक छद्मकोंड में यह इस तरह दिखाई देगा। विभाजन (कुंजीएसएचआईआईएफटी) (मैक्सकेनमऑफ पार्टिशन) जहां: SHIFT कॉन्फ़िगरेशन से लिया जाएगा। अधिकतम कुंजी का अधिकतम मूल्य मैं सादगी के लिए मानता हूँ कि वे शून्य से शुरू करते हैं रिकॉर्डरडर, आईएमएचओ एक समाधान नहीं है क्योंकि यह विशिष्ट विभाजन तक सीमित है और विभाजन सीमा पर स्लाइड नहीं कर सकता। एक अन्य समाधान विभाजन इनपुट डेटा के कस्टम लॉजिक को लागू करना होगा (यह इनपुट फ़ार्मैट का हिस्सा है) यह विभाजन के समान 2 अलग-अलग स्लाइड्स करने के लिए किया जा सकता है। उत्तर 17 सितंबर को 8: 59 चलते औसत की टिप्पणी विधि बंद हैं मान लीजिए कि कई बार समय-समय पर और वैरिएबल के संगत मूल्य हैं। सबसे पहले हमें चलती औसत की अवधि तय करनी होगी। कम समय श्रृंखला के लिए, हम 3 या 4 मूल्यों की अवधि का उपयोग करते हैं। लंबी अवधि की श्रृंखला के लिए, अवधि 7, 10 या अधिक हो सकती है। त्रैमासिक समय श्रृंखला के लिए, हम हमेशा एक समय में 4-क्वार्टर लेने के औसत की गणना करते हैं। मासिक समय श्रृंखला में, 12-मासिक चलती औसत गणना की जाती है। मान लीजिए कि दी गई समय श्रृंखला साल में है और हमने 3-वर्ष की औसत चलने की गणना करने का निर्णय लिया है। चलने वाली औसत की गणना निम्न के रूप में की जाती है: जब एक चलती हुई औसत की गणना होती है, तो औसत समय में औसत बनाकर समझ में आता है पिछले उदाहरण में हमने पहली बार 3 समय की अवधि की गणना की और इसे 3 अवधि के बगल में रखा। हम तीन अवधि के अंतराल के बीच में औसतन औसत रखा हो सकता था, जो कि 2 के बगल में है। यह अजीब समय अवधि के साथ अच्छी तरह से काम करता है, लेकिन समयावधि के लिए इतना अच्छा नहीं है। तो हम पहली चलती औसत स्थान कहां रखेंगे जब एम 4 तकनीकी तौर पर, मूविंग एवरेज टी 2.5, 3.5 पर गिर जाएगी। इस समस्या से बचने के लिए हम एम 2 का इस्तेमाल करते हुए एमई को चिकना करते हैं। इस प्रकार हम चिकनी मूल्यों को चिकना कर देते हैं यदि हम एक भी संख्या में औसत दर्जे के हैं, तो हमें सुचारू मूल्यों को सुचारू बनाने की आवश्यकता है निम्न तालिका एम 4 का उपयोग करते हुए परिणाम दिखाती है।

Comments