مؤلف:
Robert Simon
تاريخ الخلق:
21 يونيو 2021
تاريخ التحديث:
1 تموز 2024
المحتوى
يقيس التباين تشتت مجموعة البيانات. إنه مفيد جدًا في بناء النماذج الإحصائية: يمكن أن يكون التباين المنخفض مؤشرًا على أنك تصف خطأ عشوائيًا أو ضوضاء بدلاً من العلاقة الأساسية في البيانات. مع هذا المقال ، تعلمك wikiHow كيفية حساب التباين.
خطوات
طريقة 1 من 2: حساب التباين في عينة
- اكتب مجموعة بياناتك النموذجية. في معظم الحالات ، لا يمتلك الإحصائيون سوى معلومات عن عينة أو مجموعة فرعية من السكان الذين يدرسونها. على سبيل المثال ، بدلاً من إجراء تحليل عام لـ "تكلفة كل سيارة في ألمانيا" ، قد يجد الإحصائي تكلفة عينة عشوائية من بضعة آلاف من السيارات. يمكن للإحصائي استخدام هذه العينة للحصول على تقدير جيد لتكلفة السيارات في ألمانيا. ومع ذلك ، فمن الأرجح أنه لن يتطابق تمامًا مع الأرقام الفعلية.
- فمثلا: عند تحليل عدد الفطائر المباعة يوميًا في المقهى ، أخذت عينة عشوائية مدتها ستة أيام وحصلت على النتائج التالية: 38 ، 37 ، 36 ، 28 ، 18 ، 14 ، 12 ، 11 ، 10.7 ، 9.9. هذه عينة وليست مجموعة سكانية ، لأنه ليس لديك بيانات عن كل يوم يفتح فيه المتجر.
- إذا كل نقاط البيانات في البرنامج الرئيسي ، يرجى الانتقال إلى الطريقة أدناه.
اكتب معادلة تباين العينة. يشير تباين مجموعة البيانات إلى درجة تشتت نقاط البيانات. كلما اقترب التباين من الصفر ، كلما اقترب تجميع نقاط البيانات. عند العمل باستخدام مجموعات البيانات النموذجية ، استخدم الصيغة التالية لحساب التباين:- = /(ن - 1)
- هو التباين. يُحسب التباين دائمًا بوحدات مربعة.
- يمثل قيمة في مجموعة البيانات الخاصة بك.
- ∑ ، التي تعني "المجموع" ، تخبرك بحساب المعلمات التالية لكل قيمة ، ثم جمعها معًا.
- x̅ هو متوسط العينة.
- n هو عدد نقاط البيانات.
احسب متوسط العينة. يستخدم الرمز x̅ أو "x -orizontal" للإشارة إلى متوسط العينة. احسب كما تفعل مع أي متوسط: اجمع كل نقاط البيانات واقسمها على عدد النقاط.- فمثلا: أولاً ، اجمع نقاط البيانات: 17 + 15 + 23 + 7 + 9 + 13 = 84
بعد ذلك ، اقسم الناتج على عدد نقاط البيانات ، في هذه الحالة ستة: 84 ÷ 6 = 14.
متوسط العينة = x̅ = 14. - يمكنك التفكير في المتوسط على أنه "نقطة مركزية" للبيانات. إذا كانت البيانات تتمحور حول المتوسط ، يكون التباين منخفضًا. إذا كانت مشتتة بعيدًا عن المتوسط ، يكون التباين مرتفعًا.
- فمثلا: أولاً ، اجمع نقاط البيانات: 17 + 15 + 23 + 7 + 9 + 13 = 84
اطرح المتوسط من كل نقطة بيانات. حان الوقت الآن لحساب - x̅ ، حيث توجد كل نقطة في مجموعة البيانات الخاصة بك. ستشير كل نتيجة إلى الانحراف عن متوسط كل نقطة مقابلة ، أو ببساطة ، المسافة من المتوسط إلى المتوسط.- فمثلا:
- س̅ = 17-14 = 3
- س̅ = 15-14 = 1
- س̅ = 23-14 = 9
- س̅ = 7-14 = -7
- س̅ = 9-14 = -5
- س̅ = 13-14 = -1 - من السهل جدًا التحقق من حساباتك ، لأن مجموع النتائج يجب أن يكون صفرًا ، وذلك بسبب متوسط النتائج السلبية (المسافة من المتوسط إلى الأرقام الصغيرة) النتائج الإيجابية (المسافة من المتوسط إلى الأعداد الأكبر) يتم التخلص منها تمامًا.
- فمثلا:
- مربّع جميع النتائج. كما لوحظ أعلاه ، فإن قائمة الانحراف الحالي (- x̅) لها مجموع صفر ، وهذا يعني أن "متوسط الانحراف" سيكون دائمًا صفرًا ولا يمكن قول أي شيء عن تشتت البيانات. لحل هذه المسألة ، نجد مربع كل انحراف. نتيجة لذلك ، كلها أرقام موجبة ، والقيم السالبة والقيم الموجبة لم تعد تلغي بعضها البعض وتعطي المجموع صفر.
- فمثلا:
(- x̅)
- x̅)
9 = 81
(-7) = 49
(-5) = 25
(-1) = 1 - لديك الآن (- x̅) لكل نقطة بيانات في العينة.
- فمثلا:
- أوجد مجموع القيم التربيعية. حان الوقت الآن لحساب البسط الكامل للصيغة: ∑. يتطلب cyclo الكبير ، ∑ ، أن تضيف قيمة العنصر التالية لكل قيمة. لقد قمت بحساب (- x̅) لكل قيمة في العينة ، لذلك كل ما عليك فعله هو مجرد إضافة النتائج معًا.
- فمثلا: 9 + 1 + 81 + 49 + 25 + 1 = 166.
- اقسم على n - 1 ، حيث n هو عدد نقاط البيانات. منذ زمن بعيد ، عند حساب تباين العينة ، كان الإحصائيون مقسومًا على n فقط. ستمنحك هذه القسمة متوسط الانحراف التربيعي ، والذي يتطابق تمامًا مع تباين تلك العينة. ومع ذلك ، ضع في اعتبارك أن العينة ليست سوى تقدير لعدد أكبر من السكان. إذا أخذت عينة عشوائية أخرى وقمت بنفس الحساب ، فستحصل على نتيجة مختلفة. كما اتضح ، فإن القسمة على n -1 بدلاً من n تمنحك تقديرًا أفضل للتباين في عدد أكبر من السكان - وهو ما يهمك حقًا. هذا التصحيح شائع جدًا لدرجة أنه أصبح الآن التعريف المقبول لتباين العينة.
- فمثلا: هناك ست نقاط بيانات في العينة ، لذا ن = 6.
تباين العينة = 33,2
- فمثلا: هناك ست نقاط بيانات في العينة ، لذا ن = 6.
- افهم التباين والانحراف المعياري. لاحظ أنه نظرًا لوجود قوى في الصيغة ، يقاس التباين في مربع وحدات البيانات الأصلية. هذا محير بصريا. بدلاً من ذلك ، غالبًا ما يكون الانحراف المعياري مفيدًا جدًا. لكن لا فائدة من إهدار أي جهد ، حيث يتم تحديد الانحراف المعياري بواسطة الجذر التربيعي للتباين. هذا هو السبب في كتابة تباين العينة من حيث ، والانحراف المعياري للعينة هو.
- على سبيل المثال ، الانحراف المعياري للعينة أعلاه = s = √33.2 = 5.76.
طريقة 2 من 2: حساب التباين لمحتوى
- بدءا من مجموعة البيانات الرئيسية. يستخدم مصطلح "السكان" للإشارة إلى جميع الملاحظات ذات الصلة. على سبيل المثال ، إذا كنت تبحث عن عمر سكان هانوي ، فسيشمل إجمالي عدد سكانك أعمار جميع الأفراد الذين يعيشون في هانوي. عادةً ما تقوم بإنشاء جدول بيانات لمجموعة كبيرة من البيانات مثل هذه ، ولكن إليك مجموعة بيانات أصغر كمثال:
- فمثلا: في غرفة حوض السمك ، يوجد بالضبط ستة أحواض مائية. تحتوي هذه الخزانات الستة على الأعداد التالية من الأسماك:
- فمثلا: في غرفة حوض السمك ، يوجد بالضبط ستة أحواض مائية. تحتوي هذه الخزانات الستة على الأعداد التالية من الأسماك:
- اكتب معادلة التباين الكلي. نظرًا لأن المحتوى يحتوي على جميع البيانات التي نحتاجها ، فإن هذه الصيغة تعطينا التباين الدقيق للسكان. لتمييزه عن تباين العينة (وهو مجرد تقدير) ، يستخدم الإحصائيون متغيرات أخرى:
- σ = /ن
- σ = عينة التباين. هذا هو عادة نقانق مربعة. يقاس الفرق بوحدات مربعة.
- يمثل عنصرًا في مجموعة البيانات الخاصة بك.
- يتم حساب العنصر الموجود في ∑ لكل قيمة ، ثم يتم إضافته.
- μ هو المتوسط العام.
- n هو عدد نقاط البيانات في المجتمع.
- أوجد متوسط عدد السكان. عند تحليل مجتمع ما ، يمثل الرمز μ ("mu") الوسط الحسابي. للعثور على المتوسط ، اجمع كل نقاط البيانات ، ثم اقسم على عدد النقاط.
- يمكنك التفكير في المتوسط على أنه "متوسط" ، ولكن كن حذرًا ، لأن هذه الكلمة لها العديد من التعريفات الرياضية.
- فمثلا: متوسط القيمة = μ = = 10,5
- اطرح المتوسط من كل نقطة بيانات. نقاط البيانات الأقرب إلى المتوسط لها فرق أقرب إلى الصفر. كرر مشكلة الطرح لجميع نقاط البيانات ، ومن المحتمل أن تبدأ في الشعور بتشتت البيانات.
- فمثلا:
- μ = 5 – 10,5 = -5,5
- μ = 5 – 10,5 = -5,5
- μ = 8 – 10,5 = -2,5
- μ = 12 - 10., = 1,5
- μ = 15 – 10,5 = 4,5
- μ = 18 – 10,5 = 7,5
- فمثلا:
- ربّع كل علامة. في هذه المرحلة ، ستكون بعض النتائج التي تم الحصول عليها من الخطوة السابقة سلبية وبعضها ستكون إيجابية.إذا قمت بتصور البيانات على خط متماثل ، فإن هذين العنصرين يمثلان الأرقام الموجودة على يسار ويمين الوسط. لن يكون هذا مفيدًا في حساب التباين ، لأن هاتين المجموعتين ستلغيان بعضهما البعض. بدلاً من ذلك ، قم بترتيبها جميعًا بحيث تكون جميعها إيجابية.
- فمثلا:
(- μ) لكل قيمة أنا يمتد من 1 إلى 6:
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
- فمثلا:
- ابحث عن متوسط نتائجك. لديك الآن قيمة لكل نقطة بيانات ، مرتبطة (وليس بشكل مباشر) بمدى بُعد نقطة البيانات هذه عن المتوسط. متوسط بجمعهم معًا والقسمة على عدد القيم التي لديك.
- فمثلا:
الفرق العام = 24,25
- فمثلا:
- وصفة الاتصال. إذا لم تكن متأكدًا من مدى ملاءمة ذلك للصيغة الموضحة في بداية الطريقة ، فاكتب المشكلة بأكملها يدويًا ولا تختصر:
- بعد إيجاد الاختلاف عن المتوسط والتربيع ، تحصل على (- μ) ، (- μ) وهكذا حتى (- μ) ، حيث تكون آخر نقطة بيانات. في مجموعة البيانات.
- للعثور على متوسط هذه القيم ، اجمعها معًا وقسمها على n: ((- μ) + (- μ) + ... + (- μ)) / n
- بعد إعادة كتابة البسط باستخدام التدوين السيني ، يكون لديك /ن، صيغة التباين.
النصيحة
- نظرًا لصعوبة تفسير التباين ، غالبًا ما يتم حساب هذه القيمة كنقطة بداية لإيجاد الانحراف المعياري.
- استخدام "n-1" بدلاً من "n" في المقام هي تقنية تسمى تصحيح Bessel. العينة ليست سوى تقدير لمجموعة كاملة من السكان ، ومتوسط العينة لديه تحيز معين لمطابقة هذا التقدير. هذا التصحيح يزيل التحيز أعلاه. يتعلق الأمر بحقيقة أنه بمجرد تعداد نقاط البيانات n - 1 ، تكون النقطة الأخيرة ن كان ثابتًا ، لأنه تم استخدام قيم معينة فقط لحساب متوسط العينة (x̅) في صيغة التباين.