Saturday 18 November 2017

स्टाटा फॉरेक्स में छोड़े गए चर पूर्वाग्रह की जांच


स्टेटा: डेटा विश्लेषण और सांख्यिकीय सॉफ्टवेयर जेम्स हार्डिन, स्टैटाकार्प जब आप प्रतिगमन (या अन्य आकलन कमांड) चलाते हैं और आकलन रूटीन एक चर को छोड़ देते हैं, तो ऐसा इसलिए होता है क्योंकि प्रस्तावित मॉडल में स्वतंत्र चर के बीच एक निर्भरता होती है। आप एक प्रतिगमन चलाने के द्वारा इस निर्भरता की पहचान कर सकते हैं जहां आप निरंतर चर के रूप में छोड़े गए वैरिएबल और शेष चर को स्वतंत्र चर के रूप में निर्दिष्ट करते हैं। नीचे हम स्पष्ट करने के लिए उद्देश्य पर एक निर्भरता उत्पन्न करते हैं: प्रतिगमन ने एक चर को छोड़ दिया जो कि हमने बनाए गए निर्भरता में था। जो चर यह omits कुछ हद तक मनमाना है, लेकिन यह हमेशा निर्भरता में एक चर को छोड़ देगा। यह पता लगाने के लिए कि निर्भरता क्या है, हम अपने निरंतर चर के रूप में छोड़े गए चर का उपयोग करके प्रतिगमन को चला सकते हैं और इस प्रतिगमन में स्वतंत्र चर के रूप में मूल प्रतिगमन से शेष स्वतंत्र चर सकते हैं। जिस प्रतिगमन में हम दौड़ गए थे, जहां छोड़े गए चर में निर्भर चर में था, वह 1.00 का आर-स्क्ववर्ड मान था और वर्गों का अवशिष्ट योग शून्य (ठीक, लगभग) है। इसके अलावा, प्रतिगमन के गुणांक मूल्य के बीच के संबंध को दर्शाते हैं। newvar। और विस्थापन चर इस प्रतिगमन का उत्पादन हमें बताता है कि हमारे पास निर्भरता है जो ऊपर निर्भरता के आधार पर निर्भरता के बराबर होती है। त्वरित प्रश्नों के लिए ईमेल डाटप्रिनसटन. एडू कोई ऐप नहीं वॉकर-इन बजे के दौरान आवश्यक नोट: डीएसएएस प्रयोगशाला तब तक खुली है जब तक कि अग्नि का पत्थर खुले नहीं है, प्रयोगशाला कंप्यूटरों को अपने विश्लेषण के लिए उपयोग करने के लिए आवश्यक कोई नियुक्ति नहीं है। पैनल डेटा परिचय पैनल डेटा, जिसे रेिडिट्यूडिकल डेटा या क्रॉस-अनुभागीय समय श्रृंखला डेटा भी कहा जाता है, वे डेटा हैं जहां एकाधिक मामलों (लोगों, फर्मों, देशों आदि) को दो या अधिक समय अवधि में मनाया गया था। एक उदाहरण युवाओं के राष्ट्रीय अनुदैर्ध्य सर्वेक्षण है, जहां युवा लोगों का राष्ट्रीय स्तर पर एक प्रतिनिधि नमूना बार-बार कई वर्षों से प्रत्येक सर्वेक्षण किया गया था। पार-अनुभागीय समय-श्रृंखला डेटा में दो प्रकार की जानकारी है: समय के साथ विषयों के बीच परिवर्तनों में परिलक्षित विषयों, और समय-श्रृंखला या भीतर-विषय वाली जानकारी के बीच अंतर में क्रॉस-अनुभागीय जानकारी दिखाई देती है। पैनल डेटा प्रतिगमन तकनीक आपको इन विभिन्न प्रकार की सूचनाओं का लाभ उठाने की अनुमति देते हैं। हालांकि पैनल डेटा पर सामान्य एकाधिक प्रतिगमन तकनीकों का उपयोग करना संभव है, लेकिन वे इष्टतम नहीं हो सकते हैं। प्रतिगमन से प्राप्त गुणांक का अनुमान छोड़े गए चर पूर्वाग्रह के अधीन हो सकता है - एक ऐसी समस्या जो उत्पन्न होती है, जब कुछ अनजान चर या वेरिएबल होते हैं जो कि आश्रित चर को प्रभावित करने के लिए नियंत्रित नहीं किया जा सकता है। पैनल डेटा के साथ, समय के आश्रित चर में परिवर्तनों को देखकर, उन्हें देखे बिना कुछ प्रकार के छोड़े गए चर को नियंत्रित करना संभव है। इस मामले में अंतर करने वाले छोड़े गए चर के लिए यह नियंत्रण होता है, लेकिन समय के साथ स्थिर रहता है। समय के साथ भिन्न छोड़े गए चर को नियंत्रित करने के लिए पैनल डेटा का उपयोग करना भी संभव है, लेकिन मामलों के बीच स्थिर है स्टेटा में पैनल डेटा का उपयोग करना एक पैनल डेटासेट में कुल n बार टी टिप्पणियों के लिए, n मामलों पर डेटा, समय अवधि से अधिक होना चाहिए। इस तरह के डेटा को लंबे समय के रूप में कहा जाता है। कुछ मामलों में आपके डेटा को व्यापक रूप में कहा जा सकता है, प्रत्येक मामले में केवल एक अवलोकन और प्रत्येक अलग-अलग समय पर प्रत्येक भिन्न मूल्य के लिए वेरिएबल। पैनल डेटा विश्लेषण के लिए आदेशों का उपयोग करते हुए स्टैटा में इस तरह के डेटा का विश्लेषण करने के लिए, आपको इसे पहले लंबे प्रारूप में बदलने की आवश्यकता है। यह Statas reshape कमांड का उपयोग करके किया जा सकता है Reshape का उपयोग करने में सहायता के लिए, आंकड़े ऑनलाइन सहायता या इस वेब पेज को देखें। पैनल डेटा के विश्लेषण के लिए स्ताटा कई उपकरण प्रदान करता है सभी आदेश उपसर्ग xt से शुरू होते हैं और परिचित रेग, प्रोविट, योग और टैब कमांड के xtreg, xtprobit, xtsum और xttab-panel डेटा संस्करणों को शामिल करते हैं। इन आदेशों का उपयोग करने के लिए, पहले बताएं कि आपका डेटासेट पैनल डेटा है आपके पास एक वेरिएबल होना चाहिए जो आपके पैनल के केस एलिमेंट को पहचानता है (उदाहरण के लिए, एक देश या व्यक्ति पहचानकर्ता) और एक टाइम वेरिएबल जो कि स्टेट तिथि दिनांक में है स्टेटस डेट वैरिएबल फॉर्मेट के बारे में जानकारी के लिए, स्टैट पेज में हमारा टाइम सीरीज़ डेटा देखें। पैनल वैरिएबल और फिर पैनल वैरिएबल के भीतर दिनांक वैरिएबल द्वारा अपना डेटा सॉर्ट करें। उसके बाद आपको पैनल और दिनांक चर को पहचानने के लिए tsset कमांड जारी करना होगा। यदि आपका पैनल वैरिएबल को पैनलवायर कहा जाता है और आपकी डेट वैरिएबल को डेटवेर कहते हैं, तो आवश्यक कमांड्स हैं: यदि आप मेन्यू का इस्तेमाल करना पसंद करते हैं, तो आंकड़े टाइम सीरीज सेटअप और यूटिलिटी के तहत कमांड का इस्तेमाल करें। फिक्स्ड, बीच और रैंडम इफेक्ट मॉडल फिक्स्ड इफेक्ट्स रिग्रेसन फिक्स्ड फिक्स रिग्रेशन का उपयोग करने के लिए मॉडल है, जब आप छोड़े गए व्हेरिएबल्स के लिए अलग-अलग मामलों में अंतर करना चाहते हैं, लेकिन समय के साथ स्थिर हैं। यह आपको आपके आश्रित चर पर स्वतंत्र चर के प्रभावों का अनुमान लगाने के लिए समय के साथ चर में परिवर्तनों का उपयोग करने देता है, और पैनल डेटा के विश्लेषण के लिए उपयोग की जाने वाली मुख्य तकनीक है। स्टेटा में निश्चित प्रभाव के साथ पैनल डेटा पर रैखिक प्रतिगमन के लिए कमांड फ़े विकल्प के साथ xtreg है, इस तरह से उपयोग किया जाता है: यदि आप मेनू का उपयोग करना पसंद करते हैं, तो आदेश कमर्शियल क्रॉस-अनुभागीय समय सीमा रेखा के नीचे रैखिक मॉडल रेखीय प्रतिगमन है। यह आपके प्रत्येक मामले के लिए डमी वैरिएबल बनाने और इन निश्चित केस प्रभावों को नियंत्रित करने के लिए एक मानक रैखिक प्रतिगमन में शामिल होने के बराबर है। जब आपके पास अपेक्षाकृत कम मामलों और अधिक समय अवधि हो, तो यह सबसे अच्छा काम करता है, क्योंकि प्रत्येक डमी वैरिएबल आपके मॉडल से एक डिग्री स्वतंत्रता को निकालती है। इफेक्ट्स के बीच रिग्रेशन के बीच इफेक्ट्स मॉडल का इस्तेमाल होता है जब आप छोड़ दिए गए वैरिएबल को नियंत्रित करना चाहते हैं, जो कि समय के साथ बदलते हैं लेकिन मामलों के बीच स्थिर होते हैं यह आपको अपने आश्रित चर पर छोड़े गए स्वतंत्र चर के प्रभाव का आकलन करने के लिए मामलों के बीच भिन्नता का उपयोग करने की अनुमति देता है। स्टेटा में प्रभावों के बीच के साथ पैनल डेटा पर रैखिक प्रतिगमन के लिए आदेश विकल्प के साथ xtreg है। प्रभावों के बीच xtreg चलाना प्रत्येक मामले के प्रत्येक समय के लिए चर का मतलब लेने के लिए और अर्थों के ढह गई डेटासेट पर प्रतिगमन चलाने के बराबर है। चूंकि यह जानकारी की हानि में परिणाम है, प्रभावों के बीच अभ्यास में बहुत ज्यादा प्रयोग नहीं किया जाता है। शोधकर्ता जो पैनल प्रभावों को बिना विचार किए बिना समय के प्रभावों को देखना चाहते हैं, वे आमतौर पर समय के डमी वैरिएबल का उपयोग करेंगे, जो चलने वाले समय के प्रभाव के समान है। प्रभाव अनुमानक के बीच अधिकतर महत्वपूर्ण होता है क्योंकि इसका उपयोग यादृच्छिक प्रभाव अनुमानक उत्पन्न करने के लिए किया जाता है। रैंडम इफेक्ट्स यदि आपके पास यह विश्वास करने का कारण है कि कुछ छोड़े गए चर समय के साथ स्थिर हो सकते हैं लेकिन मामलों के बीच भिन्न हो सकते हैं, और अन्य मामलों के बीच तय हो सकते हैं लेकिन समय के साथ-साथ भिन्न हो सकते हैं, फिर आप यादृच्छिक प्रभावों का उपयोग करके दोनों प्रकार शामिल कर सकते हैं। आंकड़े यादृच्छिक-प्रभाव अनुमानक निश्चित और प्रभावों के बीच का भारित औसत है। स्टेटा में यादृच्छिक प्रभाव के साथ पैनल डेटा पर एक रेखीय प्रतिगमन के लिए आदेश पुनः विकल्प के साथ xtreg है। फिक्स्ड और रैंडम इफेक्ट्स के बीच चुनना निश्चित और यादृच्छिक प्रभावों के बीच चुनने का आम तौर पर स्वीकृत तरीका हॉसैन टेस्ट चल रहा है। सांख्यिकीय, निश्चित प्रभाव हमेशा पैनल डेटा (वे हमेशा सुसंगत परिणाम देते हैं) के साथ करने के लिए एक उचित वस्तु हैं, लेकिन वे चलाने के लिए सबसे कुशल मॉडल नहीं हो सकते हैं रैंडम इफेक्ट्स आपको बेहतर पी-मान देगी क्योंकि वे अधिक कुशल अनुमानक हैं, इसलिए आपको यादृच्छिक प्रभाव चलाना चाहिए यदि यह ऐसा करने के लिए सांख्यिकीय रूप से उचित है। हाउस्मान परीक्षण एक कम कुशल लेकिन लगातार मॉडल के खिलाफ एक और अधिक कुशल मॉडल की जांच करता है ताकि यह सुनिश्चित हो सके कि अधिक कुशल मॉडल भी लगातार परिणाम प्रदान करता है। स्टेटा में यादृच्छिक प्रभाव के साथ तय की गई एक हॉउसमैन टेस्ट चलाने के लिए, आपको पहले निश्चित मॉडल का अनुमान लगाया जाना चाहिए, गुणांक को बचाने के लिए ताकि आप उन्हें अगले मॉडल के परिणामों से तुलना कर सकते हैं, यादृच्छिक प्रभाव मॉडल का अनुमान लगा सकते हैं, और फिर तुलना। हाउस्मान टेस्ट परीक्षाओं की निरर्थक अवधारणाओं का परीक्षण करती है कि कुशल यादृच्छिक प्रभाव अनुमानक द्वारा अनुमानित गुणांक समान रूप से एक निश्चित निर्धारण प्रभाव अनुमानक के अनुसार हैं। यदि वे (महत्वपूर्ण पी-मान, Probby2 .05 से बड़ा है) तो यादृच्छिक प्रभाव का उपयोग करने के लिए सुरक्षित है। यदि आपको एक महत्वपूर्ण पी-मान मिलता है, तो आपको निश्चित प्रभाव का उपयोग करना चाहिए। स्टेटा के अनुमानकों के बीच आगे की समीक्षा अनुमानक के बीच यादृच्छिक प्रभाव अनुमानक की तुलना में एक चर्चा। स्टेटा से पैनल-स्तरीय हेरोरोस्केडस्टेलिटी और ऑटोोकॉरेरलेशन के लिए परीक्षण में उपयोगकर्ता-लिखित कमांड शामिल है जो धारावाहिक सहसंबंध के लिए एक साधारण परीक्षण करता है। जेम्स एच। स्टॉक और मार्क डब्ल्यू। वॉटसन द्वारा अर्थमिति का परिचय, 2003 इस पाठ में पैनल डेटा विश्लेषण के सिद्धांत के बारे में अच्छी चर्चा है, और इस पृष्ठ की तैयारी में इसका इस्तेमाल किया गया था। विशिष्ट अध्याय 8 में देखें, पैनल डेटा के साथ प्रतिगमन प्रतिलिपि 2007 प्रिंसटन विश्वविद्यालय के ट्रस्टी सर्वाधिकार सुरक्षित। dataprinceton. edu नोट: सूचना प्रिंसटन विश्वविद्यालय के लिए है प्रलेखन का उपयोग करने के लिए स्वतंत्र महसूस करें लेकिन हम प्रिंसटन के बाहर के सवालों के जवाब नहीं दे सकते हैं।

No comments:

Post a Comment