Thursday 14 December 2017

स्टाटा फॉरेक्स में गायब डेटा रिकॉर्ड करना


सूचना: आईडीआरई सांख्यिकी परामर्श समूह वेबसाइट को वर्डप्रेस सीएमएस में फरवरी में माइग्रेट कर देगा ताकि नई सामग्री के रख-रखाव और सृजन की सुविधा मिल सके। हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है एक उपहार देने के लिए स्टेट कंसल्टिंग ग्रुप द्वारा सहायता करें। स्टेटा एफएक्यू। मैं अलग-अलग श्रेणियों में लापता मूल्यों को कैसे पढ़ सकता हूं। स्टेटा हमें विभिन्न प्रकार के संख्यात्मक लापता मूल्यों को कोड करने की इजाजत देता है। इसमें 27 संख्यात्मक लापता वर्ग हैं। quot। ए को quot. z quot और quot quot। इस पृष्ठ में हम दिखाएंगे कि कैसे भिन्न श्रेणियों में गायब मूल्यों को कोडित किया जाए। पहले हम उदाहरण के उद्देश्य के लिए एक डेटा सेट बनाते हैं। इस डेटा सेट में, सभी चर संख्यात्मक होते हैं और वेरिएबल्स मादा और एसईएस में मूल्यों की कमी है। चर वाली महिला के लिए अनुपस्थित मूल्य 0 (पुरुष) और 1 (महिला के लिए) है। चर एसईएस के लिए गैर-अनुपलब्ध मान 0 (कम), 1 (मेड) और 2 (उच्च) हैं बाकी मूल्यों को मान गायब मानी जाती है। चलिए कहते हैं कि हम एक श्रेणी में -999 -999 को एक-दूसरे में और सभी चर के लिए एक तीसरे वर्ग में दूसरे के लिए लापता मूल्यों को छोड़ना चाहते हैं। विधि 1: कमांड का इस्तेमाल करना हम अनुपस्थित मूल्यों को प्रति -99 9 के लिए. a quot के साथ मैन्युअल रूप से प्रतिस्थापित कर सकते हैं, उद्धरण के लिए -99 और। उदाहरण के लिए, चर वाली महिला के लिए हम निम्न कार्य कर सकते हैं: ऊपर दिए गए कोडबुक कमांड में दिखाया गया है कि चर वाली महिला में तीन प्रकार के लापता मूल्य और 4 लापता मूल्य हैं। विधि 2: कमांड mvdecode विधि 1 का उपयोग करना विभिन्न श्रेणियों में गायब मूल्यों को रिकॉशिंग का सर्वोत्तम तरीका नहीं हो सकता है। एक बात के लिए, हमें इसे एक समय में एक चर करना होगा। Statas mvdecode आदेश हमारे लिए आसान आता है बेहतर अभी तक, हम डेटा सेट में सभी चर को संदर्भित करने के लिए सभी प्रमुख शब्द का उपयोग कर सकते हैं। लापता मूल्य कोड से अंकीय मूल्यों में जाने से हम जो अन्य मुद्दे यहां कवर करेंगे, यह है कि लापता मूल्य कोड वापस अंकीय मानों में कैसे परिवर्तित करें। कमांड mvencode कमांड mvdecode के साथ जोड़ा गया है कि हम सिर्फ ऊपर कवर और यहाँ का उपयोग करने के लिए एक है। इस वेब साइट की सामग्री को कैलिफ़ोर्निया यूनिवर्सिटी द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए। नोट: आईडीआरई सांख्यिकीय परामर्श समूह वेबसाइट को WordPress सीएमएस में माइग्रेट करने के लिए फरवरी में सुविधा प्रदान करेगा रखरखाव और नई सामग्री का निर्माण हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है स्टेट कंसल्टिंग ग्रुप को उपहार देने से STATA लर्निंग मॉड्यूल लापता डेटा 1. परिचय यह मॉड्यूल संख्यात्मक लापता डेटा पर ध्यान केंद्रित करते हुए, STATA में गायब डेटा का पता लगाएगा। यह वर्णन करता है कि कैसे अपने कच्चे डेटा फ़ाइलों में लापता डेटा का संकेत मिलता है, साथ ही साथ STATA लॉजिकल कमांडों और असाइनमेंट स्टेटमेंट्स में डेटा कैसे लापता है। हम चर आईडी से संकेतित आठ विषयों के साथ प्रतिक्रिया समय अध्ययन से डेटा का उपयोग करते हुए STATA में कुछ ग़लत डेटा गुणों को वर्णन करेंगे। और विषयों की प्रतिक्रिया समय तीन बार अंक (परीक्षण 1 ट्रायल 2 ट्रायल 3) पर मापा गया था। इनपुट डेटा फ़ाइल नीचे दिखाया गया है आप देख सकते हैं कि प्रतिक्रिया के कुछ समय एक एकल का उपयोग करके कोडित किए जाते हैं जैसा कि विषय 2 के लिए मामला है। उस परीक्षण के लिए समय मापने वाला व्यक्ति प्रतिक्रिया समय को सही तरीके से नहीं मापता था, इसलिए दूसरे परीक्षण के लिए डेटा गायब है। 2. STATA प्रक्रियाओं में आंकड़े कैसे अनुपलब्ध हैं एक सामान्य नियम के रूप में, एसटीएटीए आदेश जो किसी प्रकार की संगतता को संभालते हैं, लापता मूल्यों को छोड़कर गुम डेटा को संभालते हैं। हालांकि, जिस तरह से अनुपलब्ध मानों को छोड़ा जाता है, वह हमेशा आदेशों के अनुरूप नहीं होता है, इसलिए हम कुछ उदाहरणों पर एक नज़र डालें। सबसे पहले, चलो, हमारे प्रतिक्रिया समय चर का सारांश करें और देखें कि कैसे STATA लापता मूल्यों को संभालता है। जैसा कि आप नीचे दिए गए आउटपुट में देखते हैं, परीक्षण 1 के लिए 4 टिप्पणियों और ट्रायल 2 और ट्रायल 3 के लिए 6 टिप्पणियों का उपयोग करते हुए गणना की गई संख्या का सारांश करें। संक्षेप में, summarize कमांड ने सभी उपलब्ध आंकड़ों पर कंप्यूटेशन किया। दूसरा उदाहरण, दिखाता है कि कैसे सारणीकरण या टैब 1 कमांड लापता डेटा संभालता है। संक्षेप की तरह, टैब 1 केवल उपलब्ध डेटा का उपयोग करता है ध्यान दें कि प्रतिशत की गणना गैर-गायब मामलों की कुल संख्या के आधार पर की जाती है। यह संभव है कि आप चाहते हो कि प्रतिशत की गणना अवलोकन के कुल संख्या से की जा सकें, और तालिका में दिखाए गए प्रत्येक चर के लिए गुणा प्रतिशत। यह सारणीकरण के बाद अनुपलब्ध विकल्प को शामिल करके प्राप्त किया जा सकता है। कमांड, चलिए देखते हैं कि कैसे सहसंबद्ध कमांड लापता डेटा संभालता है हम उम्मीद करेंगे कि यह उपलब्ध आंकड़ों के आधार पर कम्प्यूटेशन का प्रदर्शन करेगा, और लापता मूल्यों को छोड़ देगा। यहाँ एक उदाहरण कमांड है आउटपुट नीचे दिखाया गया है। ध्यान दें कि कैसे लापता मूल्यों को बाहर रखा गया था। स्ताता सूचीबद्ध हटाएगी और केवल उन अवलोकनों के लिए सहसंबंध प्रदर्शित करेगा, जिनमें सूचीबद्ध सभी चर पर अनुपलब्ध मान हैं स्थिति भी जोड़ों को हटाने के लिए अनुमति देता है वेरिएशन के प्रत्येक जोड़ी के लिए अनुपयोगी मान वाले अवलोकनों के लिए सहसंबंध दिखाए जाते हैं। यह pwcorr कमांड का उपयोग करके किया जा सकता है हम प्रत्येक विकल्प के लिए इस्तेमाल किए गए अवलोकन की संख्या को प्रदर्शित करने के लिए ऑब् विकल्प का उपयोग करते हैं, जैसा कि आप देख सकते हैं, वे गायब होने की मात्रा के आधार पर भिन्न होते हैं। 3. एसएटीएए प्रक्रियाओं में लापता मूल्यों को कैसे संभाला जाए इसका सारांश सारांश प्रत्येक चर के लिए, गैर-अनुपलब्ध मानों की संख्या का उपयोग किया जाता है। सारणीकरण डिफ़ॉल्ट रूप से, अनुपलब्ध मानों को बाहर रखा जाता है और प्रतिशत गैर-अनुपलब्ध मानों की संख्या पर आधारित होते हैं। यदि आप टैब कमांड पर अनुपलब्ध विकल्प का उपयोग करते हैं, तो प्रतिशत अवलोकन की कुल संख्या (गैर-अनुपलब्ध और गायब) पर आधारित होते हैं और तालिका में अनुपलब्ध मानों का प्रतिशत रिपोर्ट किया जाता है। corr डिफ़ॉल्ट रूप से, सहसंबंधों की गणना गैर-लापता डेटा के साथ युग्मों की संख्या के आधार पर की जाती है (अनुपलब्ध डेटा की जोड़-विपत्र हटाएं)। Pwcorr कमांड का उपयोग करने के लिए अनुरोध किया जा सकता है कि सहसंबंधों की गणना केवल उन टिप्पणियों के लिए की जाती है जिनके पास pwcorr कमांड (सूचीबद्ध डेटा के सूचीगत हटाने) के बाद सूचीबद्ध सभी चर के लिए गैर-अनुपलब्ध डेटा है। reg यदि reg कमांड के बाद सूचीबद्ध किसी भी चर याद आ रही है, तो वे टिप्पणियां अनुपलब्ध हैं जो मान (ओं) को विश्लेषण से बाहर रखा गया है (अर्थात गायब डेटा को सूची में हटाया जाना)। अन्य प्रक्रियाओं के लिए, डेटा को संभालने के बारे में जानकारी के लिए STATA मैनुअल देखें। 4. असाइनमेंट स्टेटमेंट्स में गुम मूल्यों को समझना महत्वपूर्ण है कि असाइनमेंट स्टेटमेंट में लापता मान कैसे नियंत्रित किए जाते हैं। नीचे दिए गए उदाहरण पर विचार करें नीचे दिए गए सूची के आदेश से पता चलता है कि असाइनमेंट स्टेटमेंट में लापता मान कैसे नियंत्रित किए जाते हैं। चर sum1 चर पर आधारित है tri1 trial2 और tri3 यदि उन चर में से कोई भी गायब है, तो sum1 के लिए मूल्य गायब हो गया था। अतः अवलोकन के लिए sum1 1, 3 और 4 के लिए अनुपलब्ध है, जैसा कि अवलोकन के लिए मामला है 7। एक सामान्य नियम के रूप में, लापता मूल्यों से युक्त कम्प्यूटेशंस अनुपलब्ध मूल्यों को प्राप्त करते हैं। उदाहरण के लिए, 2 2 पैदावार 4 2 पैदावार 2 2 पैदावार 1 2 पैदावार 2 3 पैदावार 6 2 पैदावार जब भी आप जोड़ते हैं, घटाना, गुणा, विभाजित करते हैं, आदि मूल्यों में लापता डेटा शामिल होता है, परिणाम ग़ैर है। हमारे प्रतिक्रिया समय प्रयोग में, सात मामलों में से चार के लिए कुल प्रतिक्रिया समय sum1 गायब है। नीचे दिए गए उदाहरण में दिखाए गए अनुसार हम रॉटटॉटल फ़ंक्शन का उपयोग करके गैर-अनुपलब्ध परीक्षणों के लिए डेटा का आदान-प्रदान करने की कोशिश कर सकते हैं। नीचे दिए गए परिणाम दिखाते हैं कि sum2 में अब गैर-अनुपलब्ध परीक्षणों का योग है। ध्यान दें कि पंक्ति का कार्य शून्य मान के रूप में लापता व्यवहार करता है। जब कई चर का संक्षेप किया जाता है तो यह शून्य के रूप में लापता होने के लिए उचित नहीं हो सकता है, अगर सभी चर पर एक अवलोकन में गायब होने की संभावना है अनुपलब्ध विकल्प के साथ पंक्ति का कार्य एक गायब मूल्य वापस करेगा यदि सभी चर पर एक अवलोकन अनुपलब्ध है। अन्य विवरण समान रूप से काम करते हैं उदाहरण के लिए, देखा गया कि जब हम किसी फ़ंक्शन का उपयोग किए बिना औसत चर बनाने की कोशिश करते हैं (नीचे दिए गए उदाहरण के अनुसार)। यदि परीक्षण 1, ट्रायल 2 या ट्रायल 3 में से कोई भी चर अनुपलब्ध है, तो avg1 का मान गायब करने के लिए सेट है। वैकल्पिक रूप से, पंक्तिमाइंस फ़ंक्शन औसत न होने वाले परीक्षणों के लिए डेटा की समानता के समान होती है, जैसे कि पंक्ति का कार्य। नोट: अगर बड़ी संख्या में परीक्षण होते हैं, तो 50 परीक्षण कहते हैं, तो एग्रोवेमेन टाइप करने के लिए परेशानी होगी (ट्रायल 1 ट्रायल 2 ट्रायल 3 ट्रायल 4।) यहां एक शॉर्टकट है जिसे आप इस तरह की स्थिति में इस्तेमाल कर सकते हैं: अंत में, आप क्रमशः की सूची में क्रमशः गायब होने की संख्या और अनुपलब्ध मूल्यों की संख्या निर्धारित करने के लिए पंक्तिमीटर और रोनोमास फ़ंक्शंस का उपयोग कर सकते हैं। यह नीचे सचित्र है चर नामांकन के लिए टिप्पणियों 1, 5 और 6 के तीन वैध मूल्य थे, टिप्पणियों 2 और 3 के दो वैध मूल्य थे, अवलोकन 4 में केवल एक वैध मान था और अवलोकन 7 के पास कोई वैध मूल्य नहीं था। चर चूक विपरीत दिखाती है, यह लापता मूल्यों की संख्या की संख्या प्रदान करता है। 5. तार्किक बयान में गुम मूल्यों यह समझना महत्वपूर्ण है कि कैसे तार्किक बयानों में लापता मूल्यों को संभाला जाता है। उदाहरण के लिए, कहते हैं कि आप ट्रायल 1 के लिए 01 वैरिएबल बनाना चाहते हैं जो कि 1 है अगर यह 1.5 या उससे कम है, और 0 अगर यह 1.5 से अधिक है। हम इसे नीचे दिखाते हैं (गलत तरीके से, जैसा कि आप देखेंगे)। ऐसा प्रतीत होता है कि हमारे नये निर्मित चर newvar1 में कुछ गलत हो गया था। परीक्षण 2 के लिए लापता मूल्यों के साथ टिप्पणियों को न्यूवारा 1 के लिए शून्य सौंपा गया था। चलिए देखते हैं कि ट्रायल 2 की आवृत्ति सारणी को देखकर ऐसा क्यों हुआ। जैसा कि आप आउटपुट में देख सकते हैं, लापता मान सर्वोच्च मूल्य के बाद सूचीबद्ध होते हैं 2.1 यह इसलिए है क्योंकि STATA संभवतः सबसे बड़ा संभावित मूल्य (उदाहरण के लिए, सकारात्मक अनन्तता) के रूप में अनुपलब्ध मान मानता है और वह मान 2.1 से अधिक है, तो इसके लिए मान newvar1 0 बन जाते हैं। अब जब हम समझते हैं कि STATA द्वारा अनुपलब्ध मूल्यों का व्यवहार कैसे होता है, तो हम यह सुनिश्चित करने के लिए गायब मूल्यों को स्पष्ट रूप से बहिष्कृत करेंगे कि वे सही तरीके से व्यवहार करते हैं, जैसा कि नीचे दिखाया गया है जैसा कि आप नीचे STATA आउटपुट में देख सकते हैं, नए वैरिएबल न्यूवारा 2 में उन टिप्पणियों के लिए मूल्य नहीं हैं जो परीक्षण 2 के लिए भी गुम हैं। 6. लॉजिकल स्टेटमेंट्स में गुम मूल्यों में लापता मूल्यों को शामिल करते समय वेरिएबल बनाने या रीडिंग करते हुए, हमेशा ध्यान दें कि क्या चर में अनुपलब्ध मूल्य शामिल हैं। 7. अधिक जानकारी के लिए इस वेब साइट की सामग्री को कैलिफ़ोर्निया यूनिवर्सिटी द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए।

No comments:

Post a Comment