كيف تحسب الانبعاثات

مؤلف: Janice Evans
تاريخ الخلق: 23 تموز 2021
تاريخ التحديث: 1 تموز 2024
Anonim
Homeworking Emissions Calculation Methodology Webinar
فيديو: Homeworking Emissions Calculation Methodology Webinar

المحتوى

في الإحصائيات ، القيم المتطرفة هي قيم تختلف بشكل حاد عن القيم الأخرى في مجموعة البيانات المجمعة. يمكن أن يشير الانحراف إلى الانحرافات في توزيع البيانات أو أخطاء القياس ، لذلك غالبًا ما يتم استبعاد القيم المتطرفة من مجموعة البيانات. من خلال التخلص من القيم المتطرفة من مجموعة البيانات ، يمكنك التوصل إلى استنتاجات غير متوقعة أو أكثر دقة. لذلك ، من الضروري أن تكون قادرًا على حساب وتقدير القيم المتطرفة من أجل ضمان الفهم الصحيح للإحصاءات.

خطوات

  1. 1 تعلم كيفية التعرف على القيم المتطرفة المحتملة. يجب تحديد القيم المتطرفة المحتملة قبل استبعاد القيم المتطرفة من مجموعة البيانات. القيم المتطرفة هي قيم تختلف تمامًا عن معظم القيم في مجموعة البيانات ؛ بعبارة أخرى ، القيم المتطرفة تقع خارج اتجاه معظم القيم. من السهل العثور على هذا في جداول القيم أو (خاصة) في الرسوم البيانية. إذا تم رسم القيم في مجموعة البيانات ، فإن القيم المتطرفة ستكون بعيدة عن معظم القيم الأخرى. إذا كانت معظم القيم ، على سبيل المثال ، تقع على خط مستقيم ، فإن القيم المتطرفة تقع على جانبي هذا الخط المستقيم.
    • على سبيل المثال ، ضع في اعتبارك مجموعة بيانات تمثل درجات حرارة 12 عنصرًا مختلفًا في الغرفة. إذا كانت 11 عنصرًا تبلغ 70 درجة تقريبًا ، لكن الجسم الثاني عشر (ربما يكون الفرن) يبلغ 300 درجة ، فإن نظرة سريعة على القيم يمكن أن تشير إلى أن الفرن هو انفجار محتمل.
  2. 2 قم بفرز البيانات بترتيب تصاعدي. تتمثل الخطوة الأولى في تحديد القيم المتطرفة في حساب متوسط ​​مجموعة البيانات. يتم تبسيط هذه المهمة إلى حد كبير إذا تم ترتيب القيم الموجودة في مجموعة البيانات بترتيب تصاعدي (من الأصغر إلى الأكبر).
    • متابعة للمثال أعلاه ، ضع في اعتبارك مجموعة البيانات التالية التي تمثل درجات حرارة كائنات متعددة: {71 ، 70 ، 73 ، 70 ، 70 ، 69 ، 70 ، 72 ، 71 ، 300 ، 71 ، 69}. يجب ترتيب هذه المجموعة على النحو التالي: {69 ، 69 ، 70 ، 70 ، 70 ، 70 ، 71 ، 71 ، 71 ، 72 ، 73 ، 300}.
  3. 3 احسب وسيط مجموعة البيانات. متوسط ​​مجموعة البيانات هو القيمة الموجودة في منتصف مجموعة البيانات. إذا كانت مجموعة البيانات تحتوي على عدد فردي من القيم ، فإن الوسيط هو القيمة التي تسبقها وبعدها يوجد نفس عدد القيم في مجموعة البيانات. ولكن إذا كانت مجموعة البيانات تحتوي على عدد زوجي من القيم ، فأنت بحاجة إلى إيجاد المتوسط ​​الحسابي للوسيلتين. لاحظ أنه عند حساب القيم المتطرفة ، عادةً ما يُشار إلى الوسيط باسم Q2 ، لأنه يقع بين Q1 و Q3 ، الربعين السفلي والعليا ، اللذين سنحددهما لاحقًا.
    • لا تخف من العمل مع مجموعات البيانات التي تحتوي على عدد زوجي من القيم - سيكون المتوسط ​​الحسابي للوسيلتين رقمًا غير موجود في مجموعة البيانات ؛ هذا امر طبيعي. ولكن إذا كانت القيمتان المتوسطتان هما نفس الرقم ، فإن المتوسط ​​الحسابي يساوي هذا الرقم ؛ هذا أيضًا في ترتيب الأشياء.
    • في المثال أعلاه ، القيمتان الوسطيتان هما 70 و 71 ، لذا فإن الوسيط هو ((70 + 71) / 2) = 70.5.
  4. 4 احسب الربع السفلي. هذه القيمة ، المشار إليها باسم Q1 ، هي أقل من 25٪ من قيم مجموعة البيانات. بمعنى آخر ، إنها نصف القيم حتى الوسيط. إذا كان هناك عدد زوجي من القيم من مجموعة البيانات قبل الوسيط ، فأنت بحاجة إلى إيجاد المتوسط ​​الحسابي للوسيطتين من أجل حساب Q1 (هذا مشابه لحساب الوسيط).
    • في مثالنا ، توجد 6 قيم بعد الوسيط و 6 قيم - قبلها. هذا يعني أنه لحساب الربيع الأدنى ، علينا إيجاد المتوسط ​​الحسابي لوسطي القيم الست التي تقع قبل الوسيط. هنا متوسط ​​القيم 70 و 70. وهكذا ، Q1 = ((70 + 70) / 2) = 70.
  5. 5 احسب الربيع الأعلى. هذه القيمة ، المشار إليها باسم Q3 ، تقع فوق 25٪ من قيم مجموعة البيانات. تشبه عملية حساب Q3 عملية حساب Q1 ، ولكن هنا يتم أخذ القيم بعد الوسيط في الاعتبار.
    • في المثال أعلاه ، متوسطان للستة بعد الوسيط هما 71 و 72. إذن Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 احسب المدى الربيعي. بعد حساب Q1 و Q3 ، من الضروري إيجاد المسافة بين هذه القيم. للقيام بذلك ، اطرح Q1 من Q3. تعد قيمة النطاق الربيعي مهمة للغاية لتحديد حدود القيم التي ليست القيم المتطرفة.
    • في مثالنا ، Q1 = 70 و Q3 = 71.5. المدى الربيعي هو 71.5 - 70 = 1.5.
    • لاحظ أن هذا ينطبق أيضًا على القيم السلبية Q1 و Q3. على سبيل المثال ، إذا كان Q1 = -70 ، فإن النطاق الربيعي هو 71.5 - (-70) = 141.5.
  7. 7 ابحث عن "الحدود الداخلية" للقيم في مجموعة البيانات. يتم تحديد القيم المتطرفة من خلال تحليل القيم - سواء كانت تقع ضمن ما يسمى "الحدود الداخلية" و "الحدود الخارجية" أم لا. يتم تصنيف القيمة خارج "الحدود الداخلية" على أنها "قيمة خارجية ثانوية" ، بينما يتم تصنيف القيمة خارج "الحدود الخارجية" على أنها "قيمة خارجية مهمة". للعثور على الحدود الداخلية ، تحتاج إلى ضرب النطاق الربيعي بمقدار 1.5 ؛ يجب إضافة النتيجة إلى Q3 وطرحها من Q1. الرقمان اللذان تم العثور عليهما هما الحدود الداخلية لمجموعة البيانات.
    • في مثالنا ، المدى الربيعي هو (71.5 - 70) = 1.5. علاوة على ذلك: 1.5 * 1.5 = 2.25. يجب إضافة هذا الرقم إلى Q3 وطرحه من Q1 للعثور على الحدود الداخلية:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • وبالتالي ، فإن الحدود الداخلية هي 67.75 و 73.75.
    • في مثالنا ، فقط درجة حرارة الفرن - 300 درجة - تقع خارج هذه الحدود ويمكن اعتبارها انبعاثًا ضئيلًا. لكن لا تقفز إلى الاستنتاجات - علينا تحديد ما إذا كانت درجة الحرارة هذه متقطعة بشكل كبير.
  8. 8 ابحث عن "الحدود الخارجية" لمجموعة البيانات. يتم ذلك بنفس الطريقة المتبعة مع الحدود الداخلية ، باستثناء أن النطاق الربيعي مضروب في 3 بدلاً من 1.5. يجب إضافة النتيجة إلى Q3 وطرحها من Q1. الرقمان اللذان تم العثور عليهما هما الحدود الخارجية لمجموعة البيانات.
    • في مثالنا ، اضرب النطاق الربيعي في 3: 1.5 * 3 = 4.5. احسب الحدود الخارجية:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • إذن ، الحدين الخارجيين هما 65.5 و 76.
    • تعتبر أي قيم تقع خارج الحدود الخارجية انبعاثات كبيرة. في مثالنا ، تعتبر درجة حرارة الفرن 300 درجة انفجارًا كبيرًا.
  9. 9 استخدم تقديرًا نوعيًا لتحديد ما إذا كان يجب استبعاد القيم المتطرفة من مجموعة البيانات. تتيح لك الطريقة الموضحة أعلاه تحديد ما إذا كانت بعض القيم قيمًا متطرفة (ثانوية أو مهمة). لا تخطئ ، على الرغم من ذلك - القيمة التي يتم تصنيفها على أنها قيمة خارجية ليست سوى "مرشح" للاستثناء ، مما يعني أنه لا يتعين عليك استبعادها. سبب الشذوذ هو العامل الرئيسي الذي يؤثر على قرار استبعاد الخارج. كقاعدة عامة ، يتم استبعاد القيم المتطرفة التي تحدث بسبب الأخطاء (في القياسات والتسجيلات وما إلى ذلك). من ناحية أخرى ، عادةً ما يتم ترك القيم المتطرفة المرتبطة ليس بالأخطاء ولكن بمعلومات أو اتجاهات جديدة في مجموعة البيانات.
    • من المهم بنفس القدر تقييم تأثير القيم المتطرفة على متوسط ​​مجموعة البيانات (سواء كانت تشوهها أم لا). هذا مهم بشكل خاص عند استخلاص النتائج من وسيط مجموعة البيانات.
    • في مثالنا ، من المستبعد جدًا أن ترتفع درجة حرارة الفرن إلى 300 درجة (ما لم نأخذ في الاعتبار الحالات الشاذة الطبيعية). لذلك ، يمكن الاستنتاج (بدرجة عالية من اليقين) أن درجة الحرارة هذه هي خطأ قياس يجب استبعاده من مجموعة البيانات. علاوة على ذلك ، إذا لم تستبعد القيم الشاذة ، فسيكون متوسط ​​مجموعة البيانات (69 + 69 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89.67 درجة ، ولكن إذا استبعدت القيم الخارجية ، فسيكون الوسيط (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 درجة.
      • عادة ما تكون القيم المتطرفة نتيجة خطأ بشري ، لذلك يجب استبعاد القيم المتطرفة من مجموعات البيانات.
  10. 10 افهم أهمية القيم المتطرفة (أحيانًا) المتبقية في مجموعة البيانات. يجب استبعاد بعض القيم المتطرفة من مجموعة البيانات لأنها ناتجة عن أخطاء ومشكلات فنية ؛ يجب ترك القيم المتطرفة الأخرى في مجموعة البيانات. إذا لم يكن الانحراف ، على سبيل المثال ، نتيجة خطأ و / أو يوفر فهمًا جديدًا للظاهرة قيد الاختبار ، فيجب تركه في مجموعة البيانات. تعتبر التجارب العلمية حساسة بشكل خاص للقيم المتطرفة - فمن خلال القضاء على الانحراف عن طريق الخطأ ، قد تفقد بعض الاتجاهات أو الاكتشافات الجديدة.
    • على سبيل المثال ، نقوم بتطوير دواء جديد لزيادة حجم الأسماك في مصايد الأسماك. سنستخدم مجموعة البيانات القديمة ({71 ، 70 ، 73 ، 70 ، 70 ، 69 ، 70 ، 72 ، 71 ، 300 ، 71 ، 69}) ، ولكن هذه المرة ستمثل كل قيمة وزن السمكة (بالجرام) بعد تناول عقار تجريبي. بمعنى آخر ، يؤدي الدواء الأول إلى زيادة وزن الأسماك حتى 71 جم ، والعقار الثاني - حتى 70 جم ، وهكذا. في هذه الحالة ، 300 هو أمر بعيد المنال ، لكن يجب ألا نستبعده ؛ إذا افترضنا أنه لا توجد أخطاء في القياس ، فإن مثل هذا الانحراف يعد نجاحًا كبيرًا في التجربة. الدواء ، الذي زاد من وزن السمك إلى 300 جرام ، يعمل بشكل أفضل بكثير من الأدوية الأخرى ؛ وبالتالي فإن 300 هي القيمة الأكثر أهمية في مجموعة البيانات.

نصائح

  • عند العثور على القيم المتطرفة ، حاول شرح وجودها قبل استبعادها من مجموعة البيانات. يمكن أن تشير إلى أخطاء القياس أو التوزيع الشاذ.

ماذا تحتاج

  • آلة حاسبة