अपूर्ण डेटा और अपूर्ण मॉडल के साथ पूर्वानुमान

नाना नानी की कहानी (छत्तीसगढ़ी) (जून 2019).

Anonim

नोबेल पुरस्कार विजेता नील्स बोहर ने एक बार कहा, "भविष्यवाणी बहुत मुश्किल है, खासकर अगर यह भविष्य के बारे में है।"

Argonne शोधकर्ता जूली बेसाक और उसके फ्रांसीसी सहयोगी फिलिप नेव्यू सहमत हैं - और उन्होंने मौसम पूर्वानुमान मूल्यांकन में कठिनाई को कम करने के लिए एक अध्ययन किया है। उनके पेपर, "अपूर्ण अवलोकनों और अपूर्ण मॉडल के साथ पूर्वानुमान मूल्यांकन" शीर्षक, अवलोकन और पूर्वानुमान में त्रुटियों के कारण नए गुणवत्ता मूल्यांकन मीट्रिक, स्कोरिंग नियमों पर केंद्रित है।

शास्त्रीय स्कोरिंग योजनाओं में आम तौर पर अवलोकनों के साथ विभिन्न पूर्वानुमानों की तुलना करना शामिल है। लेकिन इस तरह के अवलोकनों में लगभग हमेशा त्रुटियां होती हैं - उदाहरण के लिए, डेटा रिकॉर्डिंग समस्याओं या साधन की कमी के कारण। दरअसल, एक हालिया अध्ययन से पता चला है कि इस तरह की योजनाओं द्वारा उपयोग किए जाने वाले शास्त्रीय लॉगरिदम स्कोर अवलोकन त्रुटियों के दौरान सबसे अच्छा पूर्वानुमान चुनने में भ्रामक है, और सत्यापन डेटा के संभाव्य वितरण को अंतर्निहित भौतिक प्रक्रियाओं के मॉडलिंग पर निर्भर होना चाहिए।

उस अध्ययन के परिणामों पर बिल्डिंग, बेसाक और नेवाउ ने एक नया स्कोरिंग मॉडल प्रस्तावित किया है जो जोड़ों के पूर्वानुमान और अवलोकन वितरण को सत्यापन डेटा में और पूर्वानुमान में त्रुटियों के दौरान स्कोर को सही करने के लिए करता है। उन्होंने आमतौर पर अभ्यास में उपयोग किए जाने वाले औसत स्कोर की तुलना में आगे के आंकड़ों की जांच करने की आवश्यकता पर प्रकाश डाला है।

टीम ने दो लोकप्रिय मॉडलों के साथ अपने नए दृष्टिकोण की तुलना / निर्माण किया। पहला मॉडल वायुमंडल एक्स की गैर-मनाई गई वास्तविक स्थिति के संबंध में अवलोकन संबंधी त्रुटियों की भूमिका और प्रभाव को समझने में मदद करता है, लेकिन यह पूर्वानुमान त्रुटि के विचार को शामिल नहीं करता है। दूसरे मॉडल में दोनों अवलोकन वाई और पूर्वानुमान जेड को वायुमंडल एक्स की स्थिति की त्रुटियों वाले संस्करणों के रूप में मॉडलिंग किया गया है, जिसे फिर से नहीं देखा जाता है।

"अप्रसन्न सत्य (छिपी हुई प्रक्रियाओं) और मनाए गए (लेकिन गलत) सत्यापन डेटा के बीच अंतर पूर्वानुमान मॉडलिंग पर अपूर्ण अवलोकनों के प्रभाव को समझने के लिए मौलिक है, " बेसेक ने गणोन और कंप्यूटर साइंस डिवीजन में Argonne में सहायक कम्प्यूटेशनल सांख्यिकीविद के रूप में कहा।

नया मॉडल कई फायदे प्रदान करता है: (1) यह सत्यापन डेटा में और पूर्वानुमान में त्रुटियों के लिए खाते के लिए एक सरल ढांचा का प्रस्ताव करता है; (2) यह केवल माध्य पर ध्यान केंद्रित करने के बजाय स्कोर के वितरण की खोज के महत्व पर प्रकाश डाला गया है; और (3) यह सत्यापन डेटा में त्रुटि के लिए लेखांकन का महत्व दिखाता है जो संभावित रूप से भ्रामक हो सकता है।

मॉडल को दो मामलों पर परीक्षण किया गया था जहां शामिल वितरण के मानकों को जाना जाता है। हालांकि इन्हें आदर्शीकृत मामले थे, शोधकर्ताओं ने जोर दिया कि परीक्षण के परिणाम स्कोर के वितरण की जांच के महत्व को हाइलाइट करते हैं जब सत्यापन डेटा को यादृच्छिक चर माना जाता है।

menu
menu