طرق حساب التباين

مؤلف: Robert Simon
تاريخ الخلق: 21 يونيو 2021
تاريخ التحديث: 1 تموز 2024
Anonim
مبادئ الإحصاء - التباين والإنحراف المعياري 1
فيديو: مبادئ الإحصاء - التباين والإنحراف المعياري 1

المحتوى

يقيس التباين تشتت مجموعة البيانات. إنه مفيد جدًا في بناء النماذج الإحصائية: يمكن أن يكون التباين المنخفض مؤشرًا على أنك تصف خطأ عشوائيًا أو ضوضاء بدلاً من العلاقة الأساسية في البيانات. مع هذا المقال ، تعلمك wikiHow كيفية حساب التباين.

خطوات

طريقة 1 من 2: حساب التباين في عينة

  1. اكتب مجموعة بياناتك النموذجية. في معظم الحالات ، لا يمتلك الإحصائيون سوى معلومات عن عينة أو مجموعة فرعية من السكان الذين يدرسونها. على سبيل المثال ، بدلاً من إجراء تحليل عام لـ "تكلفة كل سيارة في ألمانيا" ، قد يجد الإحصائي تكلفة عينة عشوائية من بضعة آلاف من السيارات. يمكن للإحصائي استخدام هذه العينة للحصول على تقدير جيد لتكلفة السيارات في ألمانيا. ومع ذلك ، فمن الأرجح أنه لن يتطابق تمامًا مع الأرقام الفعلية.
    • فمثلا: عند تحليل عدد الفطائر المباعة يوميًا في المقهى ، أخذت عينة عشوائية مدتها ستة أيام وحصلت على النتائج التالية: 38 ، 37 ، 36 ، 28 ، 18 ، 14 ، 12 ، 11 ، 10.7 ، 9.9. هذه عينة وليست مجموعة سكانية ، لأنه ليس لديك بيانات عن كل يوم يفتح فيه المتجر.
    • إذا كل نقاط البيانات في البرنامج الرئيسي ، يرجى الانتقال إلى الطريقة أدناه.

  2. اكتب معادلة تباين العينة. يشير تباين مجموعة البيانات إلى درجة تشتت نقاط البيانات. كلما اقترب التباين من الصفر ، كلما اقترب تجميع نقاط البيانات. عند العمل باستخدام مجموعات البيانات النموذجية ، استخدم الصيغة التالية لحساب التباين:
    • = /(ن - 1)
    • هو التباين. يُحسب التباين دائمًا بوحدات مربعة.
    • يمثل قيمة في مجموعة البيانات الخاصة بك.
    • ∑ ، التي تعني "المجموع" ، تخبرك بحساب المعلمات التالية لكل قيمة ، ثم جمعها معًا.
    • x̅ هو متوسط ​​العينة.
    • n هو عدد نقاط البيانات.

  3. احسب متوسط ​​العينة. يستخدم الرمز x̅ أو "x -orizontal" للإشارة إلى متوسط ​​العينة. احسب كما تفعل مع أي متوسط: اجمع كل نقاط البيانات واقسمها على عدد النقاط.
    • فمثلا: أولاً ، اجمع نقاط البيانات: 17 + 15 + 23 + 7 + 9 + 13 = 84
      بعد ذلك ، اقسم الناتج على عدد نقاط البيانات ، في هذه الحالة ستة: 84 ÷ 6 = 14.
      متوسط ​​العينة = x̅ = 14.
    • يمكنك التفكير في المتوسط ​​على أنه "نقطة مركزية" للبيانات. إذا كانت البيانات تتمحور حول المتوسط ​​، يكون التباين منخفضًا. إذا كانت مشتتة بعيدًا عن المتوسط ​​، يكون التباين مرتفعًا.

  4. اطرح المتوسط ​​من كل نقطة بيانات. حان الوقت الآن لحساب - x̅ ، حيث توجد كل نقطة في مجموعة البيانات الخاصة بك. ستشير كل نتيجة إلى الانحراف عن متوسط ​​كل نقطة مقابلة ، أو ببساطة ، المسافة من المتوسط ​​إلى المتوسط.
    • فمثلا:
      - س̅ = 17-14 = 3
      - س̅ = 15-14 = 1
      - س̅ = 23-14 = 9
      - س̅ = 7-14 = -7
      - س̅ = 9-14 = -5
      - س̅ = 13-14 = -1
    • من السهل جدًا التحقق من حساباتك ، لأن مجموع النتائج يجب أن يكون صفرًا ، وذلك بسبب متوسط ​​النتائج السلبية (المسافة من المتوسط ​​إلى الأرقام الصغيرة) النتائج الإيجابية (المسافة من المتوسط ​​إلى الأعداد الأكبر) يتم التخلص منها تمامًا.
  5. مربّع جميع النتائج. كما لوحظ أعلاه ، فإن قائمة الانحراف الحالي (- x̅) لها مجموع صفر ، وهذا يعني أن "متوسط ​​الانحراف" سيكون دائمًا صفرًا ولا يمكن قول أي شيء عن تشتت البيانات. لحل هذه المسألة ، نجد مربع كل انحراف. نتيجة لذلك ، كلها أرقام موجبة ، والقيم السالبة والقيم الموجبة لم تعد تلغي بعضها البعض وتعطي المجموع صفر.
    • فمثلا:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • لديك الآن (- x̅) لكل نقطة بيانات في العينة.
  6. أوجد مجموع القيم التربيعية. حان الوقت الآن لحساب البسط الكامل للصيغة: ∑. يتطلب cyclo الكبير ، ∑ ، أن تضيف قيمة العنصر التالية لكل قيمة. لقد قمت بحساب (- x̅) لكل قيمة في العينة ، لذلك كل ما عليك فعله هو مجرد إضافة النتائج معًا.
    • فمثلا: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. اقسم على n - 1 ، حيث n هو عدد نقاط البيانات. منذ زمن بعيد ، عند حساب تباين العينة ، كان الإحصائيون مقسومًا على n فقط. ستمنحك هذه القسمة متوسط ​​الانحراف التربيعي ، والذي يتطابق تمامًا مع تباين تلك العينة. ومع ذلك ، ضع في اعتبارك أن العينة ليست سوى تقدير لعدد أكبر من السكان. إذا أخذت عينة عشوائية أخرى وقمت بنفس الحساب ، فستحصل على نتيجة مختلفة. كما اتضح ، فإن القسمة على n -1 بدلاً من n تمنحك تقديرًا أفضل للتباين في عدد أكبر من السكان - وهو ما يهمك حقًا. هذا التصحيح شائع جدًا لدرجة أنه أصبح الآن التعريف المقبول لتباين العينة.
    • فمثلا: هناك ست نقاط بيانات في العينة ، لذا ن = 6.
      تباين العينة = 33,2
  8. افهم التباين والانحراف المعياري. لاحظ أنه نظرًا لوجود قوى في الصيغة ، يقاس التباين في مربع وحدات البيانات الأصلية. هذا محير بصريا. بدلاً من ذلك ، غالبًا ما يكون الانحراف المعياري مفيدًا جدًا. لكن لا فائدة من إهدار أي جهد ، حيث يتم تحديد الانحراف المعياري بواسطة الجذر التربيعي للتباين. هذا هو السبب في كتابة تباين العينة من حيث ، والانحراف المعياري للعينة هو.
    • على سبيل المثال ، الانحراف المعياري للعينة أعلاه = s = √33.2 = 5.76.
    الإعلانات

طريقة 2 من 2: حساب التباين لمحتوى

  1. بدءا من مجموعة البيانات الرئيسية. يستخدم مصطلح "السكان" للإشارة إلى جميع الملاحظات ذات الصلة. على سبيل المثال ، إذا كنت تبحث عن عمر سكان هانوي ، فسيشمل إجمالي عدد سكانك أعمار جميع الأفراد الذين يعيشون في هانوي. عادةً ما تقوم بإنشاء جدول بيانات لمجموعة كبيرة من البيانات مثل هذه ، ولكن إليك مجموعة بيانات أصغر كمثال:
    • فمثلا: في غرفة حوض السمك ، يوجد بالضبط ستة أحواض مائية. تحتوي هذه الخزانات الستة على الأعداد التالية من الأسماك:





  2. اكتب معادلة التباين الكلي. نظرًا لأن المحتوى يحتوي على جميع البيانات التي نحتاجها ، فإن هذه الصيغة تعطينا التباين الدقيق للسكان. لتمييزه عن تباين العينة (وهو مجرد تقدير) ، يستخدم الإحصائيون متغيرات أخرى:
    • σ = /ن
    • σ = عينة التباين. هذا هو عادة نقانق مربعة. يقاس الفرق بوحدات مربعة.
    • يمثل عنصرًا في مجموعة البيانات الخاصة بك.
    • يتم حساب العنصر الموجود في ∑ لكل قيمة ، ثم يتم إضافته.
    • μ هو المتوسط ​​العام.
    • n هو عدد نقاط البيانات في المجتمع.
  3. أوجد متوسط ​​عدد السكان. عند تحليل مجتمع ما ، يمثل الرمز μ ("mu") الوسط الحسابي. للعثور على المتوسط ​​، اجمع كل نقاط البيانات ، ثم اقسم على عدد النقاط.
    • يمكنك التفكير في المتوسط ​​على أنه "متوسط" ، ولكن كن حذرًا ، لأن هذه الكلمة لها العديد من التعريفات الرياضية.
    • فمثلا: متوسط ​​القيمة = μ = = 10,5
  4. اطرح المتوسط ​​من كل نقطة بيانات. نقاط البيانات الأقرب إلى المتوسط ​​لها فرق أقرب إلى الصفر. كرر مشكلة الطرح لجميع نقاط البيانات ، ومن المحتمل أن تبدأ في الشعور بتشتت البيانات.
    • فمثلا:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. ربّع كل علامة. في هذه المرحلة ، ستكون بعض النتائج التي تم الحصول عليها من الخطوة السابقة سلبية وبعضها ستكون إيجابية.إذا قمت بتصور البيانات على خط متماثل ، فإن هذين العنصرين يمثلان الأرقام الموجودة على يسار ويمين الوسط. لن يكون هذا مفيدًا في حساب التباين ، لأن هاتين المجموعتين ستلغيان بعضهما البعض. بدلاً من ذلك ، قم بترتيبها جميعًا بحيث تكون جميعها إيجابية.
    • فمثلا:
      (- μ) لكل قيمة أنا يمتد من 1 إلى 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. ابحث عن متوسط ​​نتائجك. لديك الآن قيمة لكل نقطة بيانات ، مرتبطة (وليس بشكل مباشر) بمدى بُعد نقطة البيانات هذه عن المتوسط. متوسط ​​بجمعهم معًا والقسمة على عدد القيم التي لديك.
    • فمثلا:
      الفرق العام = 24,25
  7. وصفة الاتصال. إذا لم تكن متأكدًا من مدى ملاءمة ذلك للصيغة الموضحة في بداية الطريقة ، فاكتب المشكلة بأكملها يدويًا ولا تختصر:
    • بعد إيجاد الاختلاف عن المتوسط ​​والتربيع ، تحصل على (- μ) ، (- μ) وهكذا حتى (- μ) ، حيث تكون آخر نقطة بيانات. في مجموعة البيانات.
    • للعثور على متوسط ​​هذه القيم ، اجمعها معًا وقسمها على n: ((- μ) + (- μ) + ... + (- μ)) / n
    • بعد إعادة كتابة البسط باستخدام التدوين السيني ، يكون لديك /ن، صيغة التباين.
    الإعلانات

النصيحة

  • نظرًا لصعوبة تفسير التباين ، غالبًا ما يتم حساب هذه القيمة كنقطة بداية لإيجاد الانحراف المعياري.
  • استخدام "n-1" بدلاً من "n" في المقام هي تقنية تسمى تصحيح Bessel. العينة ليست سوى تقدير لمجموعة كاملة من السكان ، ومتوسط ​​العينة لديه تحيز معين لمطابقة هذا التقدير. هذا التصحيح يزيل التحيز أعلاه. يتعلق الأمر بحقيقة أنه بمجرد تعداد نقاط البيانات n - 1 ، تكون النقطة الأخيرة ن كان ثابتًا ، لأنه تم استخدام قيم معينة فقط لحساب متوسط ​​العينة (x̅) في صيغة التباين.