عناصر پردازش داده های آماری. پردازش داده های آماری و ویژگی های آن داده هایی برای پردازش داده های آماری

کار آزمایشگاهی شماره 3. پردازش داده های آماری در سیستم MatLab

بیان مشکل کلی

هدف اصلی از اجرا کار آزمایشگاهیمقدمه ای بر اصول کار با پردازش داده های آماری در محیط MatLAB است.

بخش تئوری

پردازش داده های آماری اولیه

پردازش داده های آماری بر اساس روش های کمی اولیه و ثانویه است. هدف از پردازش اولیه داده های آماری، ساختار دادن به اطلاعات به دست آمده است که به معنای گروه بندی داده ها به جداول محوریتوسط پارامترهای مختلف داده‌های اولیه باید به گونه‌ای ارائه شوند که فرد بتواند ارزیابی تقریبی از مجموعه داده‌های به‌دست‌آمده را انجام دهد و اطلاعاتی را در مورد توزیع داده‌های نمونه داده‌های به‌دست‌آمده، به عنوان مثال، همگنی یا فشرده بودن داده‌ها نشان دهد. پس از تجزیه و تحلیل داده های اولیه، روش های پردازش داده های آماری ثانویه اعمال می شود که بر اساس آن الگوهای آماری در مجموعه داده های موجود تعیین می شود.

انجام تجزیه و تحلیل آماری اولیه بر روی یک آرایه داده به شما امکان می دهد در مورد موارد زیر دانش کسب کنید:

نماینده ترین مقدار برای نمونه چیست؟ برای پاسخ به این سوالمعیارهای گرایش مرکزی تعیین می شود.

آیا پراکندگی در داده ها نسبت به این مقدار مشخصه زیاد است، یعنی «تار» داده ها چقدر است؟ V در این موردمعیارهای تغییرپذیری تعیین می شود.

شایان ذکر است که شاخص های آماری سنجش گرایش و تنوع مرکزی تنها بر اساس داده های کمی تعیین می شوند.

اندازه گیری روند مرکزی- گروهی از مقادیر که بقیه داده ها حول آن گروه بندی می شوند. بنابراین، معیارهای گرایش مرکزی مجموعه داده ها را خلاصه می کند، که امکان استنتاج هم در مورد نمونه به عنوان یک کل و هم انجام یک مقایسه را فراهم می کند. تجزیه و تحلیل نمونه های مختلف با یکدیگر

فرض کنید نمونه ای از داده ها وجود دارد، سپس اندازه گیری های روند مرکزی با شاخص های زیر برآورد می شود:

1. میانگین نمونهحاصل تقسیم مجموع مقادیر نمونه بر تعداد آنها است که با فرمول (3.1) تعیین می شود.

(3.1)

جایی که - منعنصر ام نمونه؛

n- تعداد عناصر در نمونه.

میانگین نمونه بیشترین دقت را در ارزیابی روند مرکزی ارائه می دهد.

2. میانه- مقداری را تشکیل می دهد که در بالا و پایین آن تعداد مقادیر متفاوت یکسان است، یعنی مقدار مرکزی در یک سری داده های متوالی است. بسته به برابری / عجیب بودن تعداد عناصر در نمونه با فرمول (3.2) یا (3.3) تعیین می شود. الگوریتم تخمین میانه برای نمونه ای از داده ها:

اول از همه، داده ها به ترتیب نزولی / صعودی رتبه بندی می شوند.

اگر نمونه مرتب شده دارای تعداد فرد عنصر باشد، میانه با مقدار مرکزی منطبق است.

(3.2)

جایی که n

در مورد تعداد زوج از عناصر، میانه به عنوان میانگین حسابی دو مقدار مرکزی تعریف می شود.

(3.3)

میانگین عنصر نمونه سفارش داده شده کجاست.

- عنصر انتخاب مرتب شده زیر؛

تعداد عناصر موجود در نمونه

اگر همه عناصر نمونه متفاوت باشند، دقیقاً نیمی از عناصر نمونه بزرگتر از میانه هستند و نیمی دیگر کمتر است. به عنوان مثال، برای نمونه (1، 5، 9، 15، 16)، میانه مانند مورد 9 است.

در تجزیه و تحلیل آماری داده ها، میانه به شما امکان می دهد تا عناصر نمونه را تعیین کنید که به شدت بر مقدار میانگین نمونه تأثیر می گذارد.

فرض کنید شما یک نمونه 20 نفری دارید. نمونه ها اطلاعاتی در مورد میانگین درآمد ماهانه هر فرد است. فرض کنید 19 نفر میانگین درآمد ماهانه 20 ترون دارند. و 1 نفر با درآمد 300 تر. کل درآمد ماهانه کل نمونه 680 روبل است. میانه پس از سفارش نمونه، به عنوان میانگین حسابی عناصر دهم و یازدهم نمونه تعیین می شود) و برابر Me = 20 tr است. این نتیجه به شرح زیر تفسیر می شود: میانه نمونه را به دو گروه تقسیم می کند، به طوری که می توان نتیجه گرفت که در گروه اول، هر فرد میانگین درآمد ماهانه بیش از 20 هزار روبل ندارد و در گروه دوم، در حداقل 20 تن R. در این مثال، می‌توان گفت که میانگین با میزان درآمد فرد «متوسط» مشخص می‌شود. در عین حال، مقدار میانگین نمونه به طور قابل توجهی از S = 34 فراتر رفته است که نشان دهنده غیرقابل قبول بودن این ویژگی در ارزیابی میانگین درآمد است.

بنابراین، هرچه تفاوت بین میانگین و میانگین نمونه بیشتر باشد، پراکندگی داده‌های نمونه بیشتر است (در مثال مورد بررسی، فردی با درآمد 300 هزار روبل به وضوح با افراد متوسط در یک نمونه خاص متفاوت است و دارای یک تأثیر قابل توجهی بر برآورد درآمد متوسط). اینکه با چنین عناصری چه باید کرد در هر مورد جداگانه تصمیم گیری می شود. اما در حالت کلی، برای اطمینان از قابلیت اطمینان نمونه، آنها حذف می شوند، زیرا آنها تأثیر زیادی بر ارزیابی شاخص های آماری دارند.

3. مد (Moe)- مقداری را که اغلب در نمونه با آن مواجه می‌شوید، یعنی مقداری با بیشترین فراوانی تشکیل می‌دهد. الگوریتم تخمین حالت:

در صورتی که یک نمونه حاوی عناصری باشد که به طور مساوی رخ می دهند، گفته می شود که در چنین نمونه ای مد وجود ندارد.

اگر دو عناصر مجاوراز آنجایی که نمونه ها فرکانس یکسانی دارند که از فرکانس بقیه نمونه بیشتر است، پس حالت به عنوان میانگین این دو مقدار تعیین می شود.

اگر دو نمونه فرکانس یکسانی داشته باشند که از فرکانس نمونه های دیگر بیشتر است و این عناصر مجاور هم نباشند، می گویند در این نمونه دو حالت وجود دارد.

حالت در تجزیه و تحلیل آماری در شرایطی استفاده می شود که ارزیابی سریع اندازه گیری روند مرکزی مورد نیاز است و به دقت بالایی نیاز نیست. به عنوان مثال، مد (از نظر اندازه یا برند) برای تعیین لباس و کفشی که بیشترین تقاضا را در بین مشتریان دارند، مناسب است.

اندازه گیری پراکندگی (تغییرپذیری).- گروهی از شاخص های آماری که تفاوت بین مقادیر فردی نمونه را مشخص می کند. بر اساس شاخص های اندازه گیری پراکندگی، می توان درجه همگنی و فشردگی عناصر نمونه را تخمین زد. معیارهای پراکندگی با مجموعه ای از شاخص های زیر مشخص می شوند:

1. کشیدن انگشت -این فاصله بین حداکثر و حداقل مقادیر نتایج مشاهدات (واحدهای نمونه) است. اندازه گیری نوسانی نشان دهنده گسترش مقادیر در یک جمعیت داده است. اگر محدوده بزرگ باشد، مقادیر در مجموع بسیار پراکنده هستند، در غیر این صورت (محدوده کوچک است) گفته می شود که مقادیر موجود در مجموع نزدیک به یکدیگر قرار دارند. محدوده با فرمول (3.4) تعیین می شود.

(3.4)

جایی که - حداکثر عنصر نمونه؛

حداقل عنصر نمونه است.

2.انحراف متوسط- اختلاف میانگین حسابی (در قدر مطلق) بین هر مقدار در نمونه و میانگین نمونه آن. میانگین انحراف با فرمول (3.5) تعیین می شود.

(3.5)

جایی که - منعنصر ام نمونه؛

مقدار میانگین نمونه، با فرمول (3.1) محاسبه می شود.

تعداد عناصر موجود در نمونه

مدول با توجه به اینکه انحراف از میانگین برای هر عنصر خاص می تواند مثبت و منفی باشد ضروری است. بنابراین، اگر ماژول را نگیرید، مجموع همه انحرافات نزدیک به صفر خواهد بود و قضاوت در مورد درجه تغییرپذیری داده ها غیرممکن خواهد بود (تراکم داده ها حول میانگین نمونه). هنگام انجام تجزیه و تحلیل آماری، می توان به جای میانگین نمونه، حالت و میانه را در نظر گرفت.

3. پراکندگی- اندازه گیری پراکندگی که انحراف مقایسه ای بین مقادیر داده ها و میانگین را توصیف می کند. به عنوان مجموع مجذور انحرافات هر عنصر نمونه از میانگین محاسبه می شود. بسته به حجم نمونه، واریانس تخمین زده می شود روش های مختلف:

برای نمونه های بزرگ (n> 30) با فرمول (3.6)

(3.6)

برای نمونه های کوچک (n<30) по формуле (3.7)

(3.7)

که در آن X i عنصر i-ام نمونه است.

S مقدار متوسط نمونه است.

تعداد عناصر در نمونه؛

(X i - S) انحراف از میانگین برای هر مقدار در مجموعه داده است.

4. انحراف معیار-معیار میزان پراکندگی نقاط داده در رابطه با میانگین آنها.

فرآیند تربیع انحرافات فردی در محاسبه واریانس، درجه انحراف انحراف حاصل از انحرافات اصلی را افزایش می دهد که به نوبه خود باعث ایجاد خطاهای اضافی می شود. بنابراین، به منظور تقریب تخمین پراکندگی نقاط داده نسبت به میانگین آنها به مقدار انحراف میانگین، ریشه دوم از واریانس استخراج می شود. ریشه استخراج شده از واریانس معیاری از تغییرپذیری به نام ریشه میانگین مربع یا انحراف استاندارد را مشخص می کند (3.8).

(3.8)

فرض کنید شما یک مدیر پروژه توسعه نرم افزار هستید. شما پنج برنامه نویس زیر مجموعه خود دارید. با مدیریت فرآیند اجرای پروژه، وظایف را بین برنامه نویسان توزیع می کنید. برای سادگی مثال، از این واقعیت که وظایف از نظر پیچیدگی و زمان اجرا معادل هستند، عمل می کنیم. شما تصمیم گرفتید کار هر برنامه نویس (تعداد وظایف تکمیل شده در طول هفته) را برای 10 هفته گذشته تجزیه و تحلیل کنید که در نتیجه نمونه های زیر را دریافت کردید:

نام هفته

پس از تخمین میانگین تعداد کارهای انجام شده، نتیجه زیر را دریافت کردید:

نام هفته											اس
											22,3
											22,4
											22,2
											22,1
											22,5

بر اساس شاخص S، همه برنامه نویسان به طور متوسط با کارایی یکسان (حدود 22 کار در هفته) کار می کنند. با این حال، شاخص تغییرپذیری (محدوده) بسیار بالا است (از 5 وظیفه برنامه نویس چهارم تا 24 وظیفه برای پنجم).

نام هفته	اس	پ
	22,3
	22,4
	22,2
	22,1
	22,5

اجازه دهید انحراف استاندارد را تخمین بزنیم، که نشان می‌دهد که مقادیر موجود در نمونه‌ها چگونه نسبت به میانگین توزیع می‌شوند، یعنی در مورد ما، تخمین بزنیم که گسترش وظایف از هفته به هفته چقدر است.

نام هفته	اس	پ	بنابراین
	22,3		1,56
	22,4		1,8
	22,2		2,84
	22,1		1,3
	22,5		5,3

تخمین حاصل از انحراف استاندارد موارد زیر را می گوید (بیایید دو برنامه نویس 4 و 5 حالت شدید را تخمین بزنیم):

هر مقدار در یک نمونه از 4 برنامه نویس به طور متوسط 1.3 کار از مقدار متوسط انحراف دارد.

هر مقدار در نمونه برنامه نویس 5 به طور متوسط 5.3 کار از مقدار متوسط انحراف دارد.

هر چه انحراف استاندارد به 0 نزدیکتر باشد، میانگین قابل اعتمادتر است، زیرا این نشان می دهد که هر مقدار نمونه تقریباً برابر با میانگین است (در مثال ما، این 22.5 مورد است). در نتیجه، برنامه نویس چهارم در مقایسه با برنامه نویس 5، سازگارترین است. تنوع در انجام وظایف از هفته به هفته برنامه نویس پنجم 5.3 وظیفه است که نشان دهنده پراکندگی قابل توجه است. در مورد برنامه نویس پنجم نمی توان به میانگین اعتماد کرد و بنابراین پیش بینی تعداد کارهای انجام شده برای هفته آینده دشوار است که به نوبه خود برنامه ریزی و رعایت برنامه های کاری را دشوار می کند. اینکه چه تصمیمی مدیریتی در این دوره می گیرید بی ربط است. مهم است که شما ارزیابی دریافت کنید که بر اساس آن تصمیمات مدیریتی مناسب اتخاذ شود.

بنابراین، می توان یک نتیجه کلی گرفت که میانگین همیشه داده ها را به درستی تخمین نمی زند. صحت برآورد میانگین را می توان با مقدار انحراف معیار قضاوت کرد.

1. ابزار برای پردازش داده های آماری در اکسل

2. استفاده از توابع خاص

3. استفاده از ابزار ANALYSIS PACKAGE

ادبیات:

اصلی:

1. برک. تجزیه و تحلیل داده ها با استفاده از مایکروسافت اکسل. : مطابق. از انگلیسی / برک، کنت، کری، پاتریک. - M.: انتشارات "ویلیامز"، 2005. - S. 216 - 256.

2. Mishin A.V. فناوری اطلاعات در فعالیت حقوقی: کارگاه / A.V. میشین. - M .: RAP، 2013 .-- S. 2-11.

اضافی:

3. انفورماتیک برای حقوقدانان و اقتصاددانان: کتاب درسی برای دانشگاه ها / ویرایش. S.V. سیمونوویچ - SPb.: پیتر، 2004.-- S. 498-516.

درس عملی شماره 30

مبحث شماره 11.1. نگهداری پایگاه داده در Access DBMS

درس به روش پروژه انجام می شود.

هدف پروژه: ایجاد پایگاه داده در مورد کار دادگاه.

وظیفه فنی:

1. یک پایگاه داده "دادگاه" از دو جدول "قضات" و "ادعای" به ترتیب با ساختار زیر ایجاد کنید:

جدول "داوران"

نام زمینه	کد داوری	نام و نام خانوادگی	روزهای پذیرایی	ساعات کاری	تجربه کاری
نوع داده	عددی	متن	متن	متن	عددی

اندازه میدان	عدد صحیح بلند				عدد صحیح بلند
فرمت فیلد	پایه ای				پایه ای
مکان های اعشاری
مقدار پیش فرض			"چهارشنبه"	"15:00-17:00"
شرط بر ارزش	> 36200 و<36299		دوشنبه یا سه شنبه یا چهارشنبه یا پنجشنبه یا جمعه		> 0 و<40
پیغام خطا			مقادیر معتبر Mon، Tue، Wed، Thu یا Friday هستند. لطفا دوباره وارد شوید!	!	مقادیر معتبر از 1 تا 39 هستند. دوباره وارد کنید!
فیلد الزامی	آره	آره	خیر	خیر	خیر
فیلد نمایه شده		خیر	خیر	خیر	خیر

توجه داشته باشید. فیلد کلید را «کد داور» اعلام کنید.

جدول مطالبات

نام زمینه	تعداد مورد	شاکی	جواب جوجه	کد داوری	تاریخ ملاقات
نوع داده	عددی	متن	متن	عددی	زمان قرار
ویژگی های فیلد: برگه عمومی
اندازه میدان	عدد صحیح بلند			عدد صحیح بلند	فرمت تاریخ کامل
فرمت فیلد	پایه ای
مکان های اعشاری
مقدار پیش فرض
شرط بر ارزش	> 0 و<99999			> 36200 و<36299
پیغام خطا	ورودی اشتباه - تکرار کنید!			مقادیر معتبر از 36201 تا 36298 هستند. لطفاً دوباره وارد کنید!
فیلد الزامی	آره	خیر	خیر	خیر	خیر
فیلد نمایه شده	بله (هیچ مسابقه مجاز نیست)	خیر	خیر	بله (مطابقت مجاز است)	خیر

2. رکوردهای داده زیر را در جدول داوران وارد کنید:

سوابق داده های زیر را در جدول ادعاها وارد کنید:

3. در قسمت "کد داور" یک رابطه یک به چند بین جداول برقرار کنید قضاتو دعاوی حقوقی... هنگام انجام این کار، «اطمینان از یکپارچگی داده» و «به روز رسانی آبشاری فیلدهای مرتبط» را تنظیم کنید.

ادبیات:

اصلی:

1. Mishin A.V. فناوری اطلاعات در فعالیت حرفه ای: کتاب درسی / A.V. میشین، ال.ای. میستروف، دی.و. کارتاوتسف. - M .: RAP، 2011 .-- S. 259-264.

اضافی:

درس عملی شماره 31

مبحث شماره 11.2. اصول ایجاد فرم ها و پرس و جوها در Access DBMS

1. توسعه فرم های ورودی برای ورود داده ها.

2. روش محاسبه و تجزیه و تحلیل داده های وارد شده.

ادبیات:

اصلی:

1. Mishin A.V. فناوری اطلاعات در فعالیت حرفه ای: کتاب درسی / A.V. میشین، ال.ای. میستروف، دی.و. کارتاوتسف. - M .: RAP, 2011 .-- S. 265-271.

اضافی:

2. انفورماتیک و فناوری اطلاعات: کتاب درسی برای دانشجویان دانشگاه / I.G. Lesnichaya، I.V. گم شده، یو.د. رومانوف، V.I. شستاکوف - ویرایش دوم - M .: Eksmo, 2006 .-- 544 p.

3. Mikheeva E.V. فناوری اطلاعات در فعالیت حرفه ای: کتاب درسی برای دانش آموزان مدارس متوسطه حرفه ای / E.V. میخیوا - چاپ دوم، پاک شده. - م .: آکادمی، 2005 .-- 384 ص.

ارسال کار خوب خود را در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

ارسال شده در http://www.allbest.ru/

پردازش داده های آماری

معرفی

همبستگی نمونه واریانس آماری

روش های پردازش آماری نتایج یک آزمایش، تکنیک های ریاضی، فرمول ها، روش های محاسبات کمی است که با کمک آنها می توان شاخص های به دست آمده در طول آزمایش را تعمیم داد، به یک سیستم آورد و قوانین پنهان در آنها را آشکار کرد. ما در مورد چنین قانونمندی هایی با ماهیت آماری صحبت می کنیم که بین متغیرهای مورد مطالعه در آزمایش وجود دارد.

برخی از روش های تجزیه و تحلیل ریاضی و آماری امکان محاسبه به اصطلاح آمار ریاضی ابتدایی را که توزیع نمونه داده ها را مشخص می کند، می دهد، به عنوان مثال، میانگین نمونه، واریانس نمونه، حالت، میانه و تعدادی دیگر. روش های دیگر آمار ریاضی، به عنوان مثال، تجزیه و تحلیل واریانس، تجزیه و تحلیل رگرسیون، امکان قضاوت در مورد پویایی تغییرات در آمارهای فردی نمونه را فراهم می کند. با کمک روش های گروه سوم، مثلاً تحلیل همبستگی، تحلیل عاملی، روش های مقایسه داده های نمونه، می توان به طور قابل اعتمادی در مورد روابط آماری موجود بین متغیرهای مورد بررسی در این آزمایش قضاوت کرد.

1. روش های پردازش آماری اولیه نتایج تجربی

تمام روش های تحلیل ریاضی و آماری به طور معمول به اولیه و ثانویه تقسیم می شوند. روش هایی که می توان برای به دست آوردن شاخص هایی که مستقیماً نتایج اندازه گیری های انجام شده در یک آزمایش را منعکس می کنند استفاده کرد، روش های اولیه نامیده می شوند. بر این اساس، شاخص‌های آماری اولیه به معنای شاخص‌هایی است که در خود روش‌های تشخیصی روان‌شناختی به کار می‌روند و حاصل پردازش آماری اولیه نتایج تشخیص روان‌شناختی هستند. روشهای ثانویه پردازش آماری نامیده می شود که با کمک آنها بر اساس داده های اولیه، الگوهای آماری نهفته در آنها آشکار می شود.

روشهای اولیه پردازش آماری شامل تعیین میانگین نمونه، واریانس نمونه، حالت نمونه و میانه نمونه می باشد. روش‌های ثانویه معمولاً شامل تحلیل همبستگی، تحلیل رگرسیون، روش‌هایی برای مقایسه آمار اولیه در دو یا چند نمونه است.

روش هایی را برای محاسبه آمار ریاضی ابتدایی در نظر بگیرید.

1.1 مد

ویژگی عددی یک نمونه، که به عنوان یک قاعده، نیازی به محاسبات ندارد، به اصطلاح حالت است. مد مقدار کمی صفت مورد مطالعه است که اغلب در نمونه یافت می شود. برای توزیع ویژگی متقارن، از جمله توزیع نرمال، مقدار حالت با مقادیر میانگین و میانه منطبق است. برای انواع دیگر توزیع، نامتقارن، این معمول نیست. به عنوان مثال، در توالی مقادیر ویژگی 1، 2، 5، 2، 4، 2، 6، 7، 2، حالت مقدار 2 است، زیرا بیشتر از مقادیر دیگر رخ می دهد - چهار بار.

مد طبق قوانین زیر یافت می شود:

1) در مواردی که همه مقادیر در نمونه اغلب به یک اندازه اتفاق می افتد، به طور کلی پذیرفته شده است که این سری نمونه حالت ندارد. به عنوان مثال: 5، 5، 6، 6، 7، 7 - هیچ مدی در این نمونه وجود ندارد.

2) زمانی که دو مقدار مجاور (مجاور) فرکانس یکسانی داشته باشند و فرکانس آنها بیشتر از فرکانس هر مقدار دیگری باشد، حالت به عنوان میانگین حسابی این دو مقدار محاسبه می شود. به عنوان مثال، در نمونه 1، 2، 2، 2، 5، 5، 5، 6، فرکانس مقادیر مجاور 2 و 5 منطبق و برابر با 3 است. این فرکانس از بسامد مقادیر دیگر 1 و 1 بیشتر است. 6 (که برابر با 1 است). بنابراین، حالت این سری مقدار = 3.5 خواهد بود

3) اگر دو مقدار غیر مجاور (نه مجاور) در نمونه دارای فرکانس های مساوی و بالاتر از فرکانس های هر مقدار دیگری باشند، دو حالت متمایز می شوند. به عنوان مثال در ردیف 10، 11، 11، 11، 12، 13، 14، 14، 14، 17 حالت های 11 و 14 هستند که در این حالت گفته می شود که نمونه دووجهی است.

همچنین می‌تواند به اصطلاح توزیع‌های چندوجهی با بیش از دو راس (حالت) وجود داشته باشد.

4) اگر حالت با مجموعه داده های گروه بندی شده تخمین زده می شود، برای یافتن حالت باید گروهی را با بیشترین فراوانی ویژگی تعیین کرد. این گروه را گروه مدال می گویند.

1.2 میانه

میانه مقدار صفت مورد مطالعه است که نمونه را به ترتیب ارزش این صفت به نصف تقسیم می کند. در سمت راست و سمت چپ میانه، همان تعداد ویژگی در سری سفارش داده شده باقی می ماند. به عنوان مثال، برای نمونه 2، 3، 4، 4، 5، 6، 8، 7، 9، میانه 5 خواهد بود، زیرا چهار نشانگر در سمت چپ و راست آن وجود دارد. اگر این سری شامل تعداد زوجی از ویژگی ها باشد، آنگاه میانه میانگین در نظر گرفته شده به عنوان نیمی از مقادیر دو مقدار مرکزی سری خواهد بود. برای ردیف بعدی 0، 1، 1، 2، 3، 4، 5، 5، 6، 7، میانه 3.5 خواهد بود.

دانستن میانه در تعیین اینکه آیا توزیع مقادیر خاص صفت مورد مطالعه متقارن و نزدیک به توزیع به اصطلاح نرمال است مفید است. میانگین و میانه برای توزیع نرمال معمولاً منطبق هستند یا بسیار کمی با یکدیگر تفاوت دارند. اگر توزیع نمونه مشخصه ها نرمال باشد، می توان از روش های محاسبات آماری ثانویه بر اساس توزیع نرمال داده ها برای آن استفاده کرد. در غیر این صورت، این کار نمی تواند انجام شود، زیرا اشتباهات جدی می توانند در محاسبات رخنه کنند.

1.3 میانگین نمونه

میانگین نمونه (میانگین حسابی) مقدار به عنوان یک شاخص آماری، میانگین برآورد کیفیت روانشناختی مورد مطالعه در آزمایش است. این ارزیابی درجه رشد آن را به عنوان یک کل در آن گروه از افراد که تحت معاینه روانشناختی قرار گرفتند مشخص می کند. با مقایسه مستقیم مقادیر میانگین دو یا چند نمونه، می‌توان میزان نسبی توسعه را در افرادی که این نمونه‌ها را تشکیل می‌دهند، با کیفیت ارزیابی شده قضاوت کرد.

1.4 پخش نمونه

گسترش (گاهی اوقات این مقدار محدوده نامیده می شود) نمونه با حرف R نشان داده می شود. این ساده ترین شاخصی است که می توان برای یک نمونه به دست آورد - تفاوت بین حداکثر و حداقل مقادیر یک سری تغییرات معین. یعنی

R = xmax - xmin

واضح است که هر چه مشخصه اندازه گیری شده بیشتر تغییر کند، مقدار R بیشتر است و بالعکس. با این حال، ممکن است اتفاق بیفتد که برای دو سری نمونه، میانگین و برد یکسان باشد، اما ماهیت تنوع این سری‌ها متفاوت باشد. به عنوان مثال، دو نمونه آورده شده است:

X = 10 15 20 25 30 35 40 45 50 X = 30 R = 40

Y = 10 28 28 30 30 30 32 32 50 Y = 30 R = 40

با برابری میانگین ها و اسپردها برای این دو سری نمونه، ماهیت تنوع آنها متفاوت است. برای درک واضح تر ماهیت تنوع نمونه ها، باید به توزیع آنها مراجعه کرد.

1.5 پراکندگی

واریانس میانگین حسابی مجذور انحراف مقادیر یک متغیر از میانگین آن است.

واریانس به عنوان یک آمار مشخص می کند که مقادیر خاص چقدر از میانگین در یک نمونه معین انحراف دارند. هر چه واریانس بیشتر باشد، انحراف یا پراکندگی در داده ها بیشتر است.

ریشه دوم از مجموع مجذورات تقسیم بر تعداد عبارت های سری استخراج می شود.

گاهی اوقات تعداد زیادی داده اولیه خصوصی اولیه وجود دارد که در معرض پردازش آماری هستند و به تعداد زیادی عملیات حسابی ابتدایی نیاز دارند. به منظور کاهش تعداد آنها و در عین حال حفظ دقت مورد نیاز محاسبات، گاهی اوقات آنها به جایگزینی نمونه اصلی داده های تجربی خاص با فواصل زمانی متوسل می شوند. بازه گروهی از مقادیر مشخصه مرتب شده بر اساس مقدار است که با مقدار متوسط در فرآیند محاسبه جایگزین می شود.

2. روش های پردازش آماری ثانویه نتایج تجربی

با کمک روش های ثانویه پردازش آماری داده های تجربی، فرضیه های مرتبط با آزمایش مستقیماً تأیید، اثبات یا رد می شوند. این روش‌ها معمولاً پیچیده‌تر از روش‌های پردازش آماری اولیه هستند و نیاز به آمادگی خوب محقق در زمینه ریاضیات و آمار ابتدایی دارند. (7).

گروه روش های مورد بحث را می توان به چندین زیر گروه تقسیم کرد:

1. حساب رگرسیون.

2. روش های مقایسه دو یا چند آمار ابتدایی (میانگین، واریانس و ...) مربوط به نمونه های مختلف.

3. روشهای برقراری روابط آماری بین متغیرها مثلاً همبستگی آنها با یکدیگر.

4. روش های شناسایی ساختار آماری داخلی داده های تجربی (مثلاً تحلیل عاملی). بیایید هر یک از زیر گروه های انتخاب شده از روش های پردازش آماری ثانویه را با مثال در نظر بگیریم.

2.1 حساب رگرسیون

حساب رگرسیون روشی از آمار ریاضی است که به شما امکان می‌دهد داده‌های خصوصی و متفاوت را به یک نمودار خطی خاص کاهش دهید، تقریباً ارتباط داخلی آنها را منعکس کنید، و توانایی تخمین تقریبی مقدار احتمالی متغیر دیگری را با مقدار یکی از آنها به دست آورید. متغیرها (7).

به بیان گرافیکی معادله رگرسیون خط رگرسیون می گویند. خط رگرسیون بهترین پیش بینی های متغیر وابسته (Y) را برای متغیرهای مستقل (X) بیان می کند.

رگرسیون با استفاده از دو معادله رگرسیون بیان می شود که در مستقیم ترین حالت شبیه معادلات خط مستقیم هستند.

Y = a 0 + a 1 * X

X = b 0 + b 1 * Y

در رابطه (1)، Y متغیر وابسته، X متغیر مستقل، a 0 یک مقطع، a 1 ضریب رگرسیون یا شیب است که شیب خط رگرسیون را نسبت به محورهای مختصات تعیین می کند.

در رابطه (2) X متغیر وابسته، Y متغیر مستقل، b 0 نقطه قطع، b 1 ضریب رگرسیون یا شیب است که شیب خط رگرسیون را نسبت به محورهای مختصات تعیین می کند.

کمی کردن رابطه (رابطه) بین X و Y (بین Y و X) تحلیل رگرسیون نامیده می شود. وظیفه اصلی تحلیل رگرسیون، یافتن ضرایب a 0، b 0، a1 و b 1 و تعیین سطح اهمیت عبارات تحلیلی به دست آمده است که متغیرهای X و Y را به هم متصل می کند.

برای اعمال روش تحلیل رگرسیون خطی، شرایط زیر باید رعایت شود:

1. متغیرهای X و Y مقایسه شده باید بر اساس مقیاس فواصل یا نسبت اندازه گیری شوند.

2. فرض بر این است که متغیرهای X و Y دارای توزیع نرمال هستند.

3. تعداد ویژگی های متغیر در متغیرهای مقایسه شده باید یکسان باشد. (5).

2.2 همبستگی

روش بعدی پردازش آماری ثانویه که از طریق آن رابطه یا رابطه مستقیم بین دو سری داده های تجربی روشن می شود، روش همبستگی نامیده می شود. این نشان می دهد که چگونه یک پدیده بر دیگری تأثیر می گذارد یا در پویایی آن با آن مرتبط است. این نوع رابطه مثلاً بین کمیت هایی که در روابط علی با یکدیگر هستند وجود دارد. اگر معلوم شود که دو پدیده از نظر آماری به طور قابل اعتمادی با یکدیگر همبستگی دارند و در عین حال اطمینان وجود داشته باشد که یکی از آنها می تواند به عنوان عامل پدیده دیگر عمل کند، قطعاً به این نتیجه می رسد که بین آنها رابطه علّی وجود دارد. . (7)

زمانی که افزایش سطح یک متغیر با افزایش سطح متغیر دیگر همراه باشد، در این صورت ما در مورد یک همبستگی مثبت صحبت می کنیم. اگر رشد یک متغیر با کاهش سطح متغیر دیگر رخ دهد، آنگاه از یک همبستگی منفی صحبت می‌کنیم. در صورت عدم وجود ارتباط بین متغیرها، با همبستگی صفر روبرو هستیم. (1)

انواع مختلفی از این روش وجود دارد: خطی، رتبه بندی شده، زوجی و چندگانه. تجزیه و تحلیل همبستگی خطی به شما امکان می دهد تا روابط مستقیم بین متغیرها را با مقادیر مطلق آنها برقرار کنید. این اتصالات به صورت گرافیکی به صورت یک خط مستقیم بیان می شوند، از این رو به آن "خطی" می گویند. همبستگی رتبه وابستگی را نه بین مقادیر مطلق متغیرها، بلکه بین مکان های ترتیبی یا رتبه های اشغال شده توسط آنها به ترتیب بزرگی تعیین می کند. تجزیه و تحلیل همبستگی زوجی شامل مطالعه وابستگی های همبستگی فقط بین جفت متغیرها و چند متغیره یا چند متغیره - بین بسیاری از متغیرها در همان زمان است. تحلیل عاملی شکل گسترده ای از تحلیل همبستگی چند متغیره در آمار کاربردی است. (5)

ضریب همبستگی رتبه در تحقیقات روانشناختی و آموزشی در مواردی مورد توجه قرار می گیرد که علائمی که بین آنها وابستگی ایجاد می شود از نظر کیفی متفاوت است و نمی توان با استفاده از مقیاس اندازه گیری فاصله ای به طور دقیق ارزیابی کرد. مقیاس فاصله ای به مقیاسی گفته می شود که به فرد اجازه می دهد فاصله بین مقادیر آن را ارزیابی کند و قضاوت کند که کدام یک از آنها بزرگتر و چقدر از دیگری بزرگتر است. به عنوان مثال، خط کشی که برای ارزیابی و مقایسه طول اجسام استفاده می شود، یک مقیاس فاصله ای است، زیرا با استفاده از آن می توان استدلال کرد که فاصله بین دو تا شش سانتی متر دو برابر فاصله بین شش تا هشت سانتی متر است. اگر با استفاده از ابزار اندازه گیری فقط بتوانیم ادعا کنیم که برخی از شاخص ها بیشتر از سایرین هستند، اما قادر به بیان تعداد آنها نباشند، چنین ابزار اندازه گیری را نه فاصله، بلکه ترتیبی می نامند.

بیشتر شاخص‌هایی که در تحقیقات روان‌شناختی و تربیتی به‌دست می‌آیند، به مقیاس‌های ترتیبی و نه فاصله‌ای (مثلاً ارزیابی‌هایی مانند «بله»، «نه»، «به جای نه به جای بله» و موارد دیگر که می‌توانند به امتیاز تبدیل شوند، اشاره دارد. ، ضریب همبستگی خطی برای آنها قابل اعمال نیست.

روش همبستگی های چندگانه، برخلاف روش همبستگی های زوجی، این امکان را فراهم می کند که ساختار کلی وابستگی های همبستگی موجود در یک ماده آزمایشی چند بعدی، شامل بیش از دو متغیر، آشکار شود و این وابستگی های همبستگی در قالب یک نشان داده شود. سیستم معین

برای اعمال یک ضریب همبستگی خاص، شرایط زیر باید رعایت شود:

1. متغیرهای مقایسه شده باید در مقیاس فواصل یا نسبت اندازه گیری شوند.

2. فرض بر این است که همه متغیرها دارای توزیع نرمال هستند.

3. تعداد ویژگی های متغیر در متغیرهای مقایسه شده باید یکسان باشد.

4. برای ارزیابی سطح پایایی نسبت همبستگی پیرسون، از فرمول (11.9) و جدول مقادیر بحرانی برای آزمون t Student در k = n - 2 استفاده کنید. (5)

2.3 تحلیل عاملی

تحلیل عاملی یک روش آماری است که هنگام پردازش آرایه های بزرگ از داده های تجربی استفاده می شود. وظایف تحلیل عاملی عبارتند از: کاهش تعداد متغیرها (کاهش داده ها) و تعیین ساختار روابط بین متغیرها، یعنی. طبقه بندی متغیرها، بنابراین از تحلیل عاملی به عنوان روشی برای کاهش داده ها یا به عنوان روشی برای طبقه بندی ساختاری استفاده می شود.

یک تفاوت مهم بین تجزیه و تحلیل عاملی و همه روش‌هایی که در بالا توضیح داده شد این است که نمی‌توان از آن برای پردازش داده‌های تجربی اولیه یا، به قول آنها، "خام" استفاده کرد. مستقیماً از امتحان موضوعات به دست می آید. ماده برای تحلیل عاملی پیوندهای همبستگی یا بهتر است بگوییم ضرایب همبستگی پیرسون است که بین متغیرها (یعنی ویژگی های روانشناختی) موجود در نظرسنجی محاسبه می شود. به عبارت دیگر، ماتریس های همبستگی یا به اصطلاح ماتریس های همبستگی در معرض تحلیل عاملی قرار می گیرند. نام ستون‌ها و ردیف‌ها در این ماتریس‌ها یکسان است، زیرا فهرستی از متغیرهای موجود در تحلیل را نشان می‌دهند. به همین دلیل، ماتریس های همبستگی همیشه مربع هستند، یعنی. تعداد سطرها در آنها برابر است با تعداد ستون ها و متقارن، یعنی. در مکان های متقارن نسبت به قطر اصلی، ضرایب همبستگی یکسانی وجود دارد.

مفهوم اصلی تحلیل عاملی یک عامل است. این یک شاخص آماری مصنوعی است که در نتیجه تبدیل های ویژه جدول ضرایب همبستگی بین ویژگی های روانشناختی مورد مطالعه یا ماتریس همبستگی ایجاد می شود. روش استخراج عوامل از ماتریس همبستگی را فاکتورسازی ماتریسی می گویند. در نتیجه فاکتورسازی، تعداد متفاوتی از عوامل را می توان از ماتریس همبستگی استخراج کرد، تا عددی برابر با تعداد متغیرهای اولیه. با این حال، عوامل شناسایی شده در نتیجه فاکتورگیری، به عنوان یک قاعده، از نظر اهمیت نابرابر هستند. (5)

عوامل شناسایی شده، وابستگی متقابل پدیده های روانی را توضیح می دهند. (7)

اغلب در نتیجه تحلیل عاملی نه یک، بلکه چندین عامل تعیین می شود که به طرق مختلف ماتریس همبستگی متغیرها را توضیح می دهد. در این حالت عوامل به عوامل کلی، کلی و فردی تقسیم می شوند. عوامل عمومی به عواملی گفته می شود که تمام بارهای فاکتوریل آنها با صفر تفاوت معنی داری دارند (بار صفر نشان می دهد که این متغیر به هیچ وجه با بقیه ارتباط ندارد و تأثیری بر آنها در زندگی ندارد). عوامل رایج عواملی هستند که برخی از بارهای عاملی برای آنها غیر صفر است. فاکتورهای منفرد عواملی هستند که در آنها تنها یکی از بارها به طور قابل توجهی با صفر تفاوت دارد. (7)

تحلیل عاملی ممکن است در صورت رعایت معیارهای زیر مناسب باشد.

1. فاکتورسازی داده های کیفی به دست آمده با مقیاس نام ها، به عنوان مثال، مانند رنگ مو (سیاه / قهوه ای / قرمز) غیر ممکن است.

2. همه متغیرها باید مستقل بوده و توزیع آنها نزدیک به نرمال باشد.

3. روابط بین متغیرها باید تقریباً خطی باشد یا حداقل دارای یک خصلت منحنی واضح نباشد.

4. ماتریس همبستگی اصلی باید چندین همبستگی در مقدار مطلق بالای 0.3 داشته باشد. در غیر این صورت، استخراج هر عاملی از ماتریس نسبتاً دشوار است.

5. نمونه آزمودنی ها باید به اندازه کافی بزرگ باشد. توصیه های تخصصی متفاوت است. سخت‌ترین دیدگاه توصیه می‌کند در صورتی که تعداد آزمودنی‌ها کمتر از 100 باشد، از تحلیل عاملی استفاده نکنید، زیرا خطاهای استاندارد همبستگی در این مورد بسیار زیاد خواهد بود.

با این حال، اگر عوامل به خوبی تعریف شده باشند (مثلاً با بارهای 0.7 به جای 0.3)، آزمایشگر برای جداسازی آنها به نمونه کوچکتری نیاز دارد. علاوه بر این، اگر معلوم شود که داده های به دست آمده بسیار قابل اعتماد هستند (مثلاً از آزمون های معتبر استفاده می شود)، آنگاه می توان داده ها را برای تعداد کمتری از افراد مورد تجزیه و تحلیل قرار داد. (5).

2.4 وبا استفاده از تحلیل عاملی

تحلیل عاملی به طور گسترده در روانشناسی در جهات مختلف مربوط به حل مسائل نظری و عملی استفاده می شود.

از لحاظ نظری، استفاده از تحلیل عاملی با توسعه رویکرد به اصطلاح تحلیل عاملی برای مطالعه ساختار شخصیت، خلق و خو و توانایی ها همراه است. استفاده از تحلیل عاملی در این حوزه ها بر اساس این فرض پذیرفته شده است که شاخص های قابل مشاهده و قابل اندازه گیری مستقیم فقط تظاهرات خارجی غیرمستقیم و / یا جزئی از ویژگی های عمومی تر هستند. این ویژگی‌ها، برخلاف ویژگی‌های اول، متغیرهای پنهان و به اصطلاح پنهان هستند، زیرا مفاهیم یا ساختارهایی هستند که برای اندازه‌گیری مستقیم در دسترس نیستند. با این حال، آنها را می توان با فاکتورگیری همبستگی بین ویژگی های مشاهده شده و شناسایی عواملی که (به شرط خوب بودن ساختار) به عنوان بیانی آماری از متغیر پنهان مورد نظر تعبیر کرد، ایجاد کرد.

اگرچه این عوامل ماهیت کاملاً ریاضی دارند، اما فرض می‌شود که آنها متغیرهای پنهان (سازه‌ها یا مفاهیم فرضی نظری) را نشان می‌دهند، بنابراین، نام عوامل اغلب منعکس کننده ماهیت ساختار فرضی مورد مطالعه است.

در حال حاضر تحلیل عاملی به طور گسترده در روانشناسی افتراقی و تشخیص روانشناسی استفاده می شود. با کمک آن می توانید تست هایی را طراحی کنید، ساختار ارتباط بین ویژگی های روانشناختی فردی را که توسط مجموعه ای از تست ها یا آیتم های تست اندازه گیری می شود، ایجاد کنید.

همچنین از تحلیل عاملی برای استانداردسازی روش های آزمون استفاده می شود که بر روی نمونه ای نماینده از افراد انجام می شود.

نتیجه

اگر داده‌های به‌دست‌آمده در آزمایش ماهیت کیفی داشته باشند، صحت نتیجه‌گیری‌هایی که بر اساس نتیجه‌گیری‌های آنها گرفته می‌شود، کاملاً به شهود، دانش و حرفه‌ای بودن محقق و همچنین به منطق استدلال او بستگی دارد. اگر این داده ها از نوع کمی باشند، ابتدا پردازش آماری اولیه و سپس ثانویه خود را انجام می دهند. پردازش آماری اولیه شامل تعیین تعداد مورد نیاز آمار ریاضی ابتدایی است. چنین پردازشی تقریباً همیشه حداقل شامل تعیین میانگین نمونه است. در مواردی که پراکندگی داده های میانگین نسبی یک شاخص آموزنده برای تأیید آزمایشی فرضیه های پیشنهادی باشد، واریانس یا انحراف معیار محاسبه می شود. توصیه می شود زمانی که قرار است از روش های پردازش آماری ثانویه محاسبه شده بر روی یک توزیع نرمال استفاده شود، مقدار میانه محاسبه شود. به مقدار متوسط از این معیار می توان برای قضاوت تقریبی در مورد ماهیت توزیع حاصل از داده های اولیه استفاده کرد.

پردازش آماری ثانویه (مقایسه میانگین ها، واریانس ها، توزیع داده ها، تحلیل رگرسیون، تحلیل همبستگی، تحلیل عاملی و غیره) در صورتی انجام می شود که برای حل مسائل یا اثبات فرضیه های پیشنهادی، نیاز به تعیین الگوهای آماری پنهان باشد. در داده های تجربی اولیه هنگام شروع پردازش آماری ثانویه، محقق ابتدا باید تصمیم بگیرد که از کدام یک از آمارهای ثانویه مختلف برای پردازش داده های تجربی اولیه استفاده کند. این تصمیم بر اساس در نظر گرفتن ماهیت فرضیه مورد آزمایش و ماهیت ماده اولیه به دست آمده در نتیجه آزمایش گرفته می شود. در اینجا چند توصیه در این زمینه وجود دارد.

توصیه 1. اگر فرضیه تجربی حاوی این فرض باشد که در نتیجه تحقیقات روانشناختی و تربیتی، شاخص‌های هر کیفیتی افزایش یا کاهش می‌یابد، توصیه می‌شود از معیار Student یا معیار ch2 برای مقایسه قبل استفاده شود. - و داده های پس از آزمایش اگر داده‌های تجربی اولیه نسبی باشند و مثلاً به صورت درصد بیان شوند، به دومی اشاره می‌شود.

توصیه 2. اگر یک فرضیه آزمایش شده تجربی شامل عبارتی در مورد رابطه علی بین برخی از متغیرها باشد، توصیه می شود آن را با مراجعه به ضرایب همبستگی خطی یا رتبه ای آزمایش کنید. از همبستگی خطی زمانی استفاده می شود که متغیرهای مستقل و وابسته با استفاده از مقیاس فاصله ای اندازه گیری شوند و تغییرات این متغیرها قبل و بعد از آزمایش اندک باشد. همبستگی رتبه زمانی به آن اطلاق می شود که برای ارزیابی تغییرات در ترتیب توالی بر حسب بزرگی متغیرهای مستقل و وابسته کافی باشد، یا زمانی که تغییرات آنها به اندازه کافی بزرگ باشد، یا زمانی که ابزار اندازه گیری به جای فاصله ای، ترتیبی بود.

توصیه 3. گاهی اوقات یک فرضیه شامل این فرض می شود که در نتیجه آزمایش، تفاوت های فردی بین آزمودنی ها افزایش یا کاهش می یابد. این فرض با استفاده از آزمون فیشر به خوبی تأیید می‌شود، که به فرد اجازه می‌دهد واریانس‌ها را قبل و بعد از آزمایش مقایسه کند. توجه داشته باشید که با استفاده از معیار فیشر، می توان فقط با مقادیر مطلق شاخص ها کار کرد، اما نه با رتبه آنها.

ارسال شده در Allbest.ru

...

اسناد مشابه

تکنیک ها و روش های اساسی پردازش و تجزیه و تحلیل داده های آماری. محاسبه مقادیر متوسط حسابی، هارمونیک و هندسی. سری های توزیع، ویژگی های اصلی آنها. تکنیک های هم ترازی نزدیک به دینامیک سیستم حساب های ملی

مقاله ترم اضافه شده در 2014/10/24

مفهوم تحلیل اقتصادی به عنوان یک علم، ماهیت، موضوع، ویژگی‌های کلی روش‌ها و کارایی اجتماعی-اقتصادی. گروه های اصلی روش های اقتصادسنجی تحلیل و پردازش داده ها. تحلیل عاملی داده های اقتصادی شرکت.

چکیده، اضافه شده در 03/04/2010

میانگین حسابی نمونه، واریانس، انحراف معیار. رد بر اساس معیار شوونه. قانون سه سیگما ارزیابی اهمیت تفاوت بین مقادیر میانگین دو نمونه. تجزیه و تحلیل رگرسیون زوجی، چندگانه. تحلیل عاملی کامل

مقاله ترم اضافه شده در 12/05/2012

استفاده از روش های مختلف ارائه و پردازش داده های آماری. نمونه های آماری مکانی رگرسیون و همبستگی زوجی. سری زمانی. ایجاد یک روند. مثال های کاربردی و روش های حل آنها، فرمول ها و معنای آنها.

دوره سخنرانی، اضافه شده در 2009/02/26

پردازش آماری نتایج اندازه گیری؛ میانگین حسابی، درجه دوم، واریانس. تعیین پارامترهای نمونه برداری: قانون سه سیگما، هیستوگرام، نمودارهای کنترل، نمودار ایشیکاوا. استفاده از ابزار با کیفیت در ساخت مبل.

مقاله ترم اضافه شده 10/17/2014

میانگین ارزش در آمار، ماهیت آن و شرایط استفاده. انواع و اشکال میانگین ها: با وجود ویژگی-وزن، بر اساس شکل محاسبه، با پوشش جمعیت. مد، میانه بررسی آماری پویایی سود و سودآوری به عنوان مثال OJSC "باشمبل".

تست، اضافه شده در 2008/06/14

اصول پردازش داده های آماری، روش ها و تکنیک های مورد استفاده در این فرآیند. روش شناسی و مراحل اصلی ساخت نمودارهای کنترلی، طبقه بندی و انواع آنها، ویژگی های عملکردی، شناسایی مزایا و معایب استفاده.

مقاله ترم، اضافه شده در 2014/08/23

محاسبه مشخصات عددی و پردازش نتایج مشاهدات نمونه. محاسبه و تحلیل شاخص های آماری در اقتصاد. ثروت ملی: عناصر، ارزیابی; مانده دارایی ها و بدهی ها؛ دارایی های ثابت، شاخص های سرمایه در گردش.

مقاله ترم، اضافه شده در 2012/12/25

آمار توصیفی و استنتاج آماری. روش های انتخاب برای اطمینان از نماینده بودن نمونه. تأثیر نوع نمونه بر بزرگی خطا. وظایف هنگام استفاده از روش نمونه گیری. انتشار داده های مشاهدات به عموم مردم.

تست، اضافه شده در 2011/02/27

افشای مفهوم: مقیاس فاصله، میانگین حسابی، سطح اهمیت آماری. نحوه تفسیر مد، میانه و متوسط. حل مسئله با استفاده از معیار فریدمن، روزنبام. محاسبه ضریب همبستگی اسپریمن.

ما در مورد چنین قانونمندی هایی با ماهیت آماری صحبت می کنیم که بین متغیرهای مورد مطالعه در آزمایش وجود دارد.

داده ها آیا عناصر اصلی برای پردازش 26 طبقه بندی یا طبقه بندی می شوند.

برخی از روش های تجزیه و تحلیل ریاضی و آماری امکان محاسبه به اصطلاح آمار ریاضی ابتدایی را که توزیع نمونه داده ها را مشخص می کند، می دهد، به عنوان مثال:

میانگین نمونه،

واریانس نمونه،

مدیان و تعدادی دیگر.

سایر روش های آمار ریاضی قضاوت در مورد پویایی تغییرات در آمار فردی نمونه را ممکن می سازد، به عنوان مثال:

تحلیل واریانس،

تجزیه و تحلیل رگرسیون.

با کمک گروه سوم از روش های داده های نمونه، می توان به طور قابل اعتماد در مورد روابط آماری موجود بین متغیرهای مورد بررسی در این آزمایش قضاوت کرد:

تجزیه و تحلیل همبستگی؛

تحلیل عاملی؛

روش های مقایسه

تمام روش های تجزیه و تحلیل ریاضی و آماری به طور معمول به 27 اولیه و ثانویه تقسیم می شوند.

روش هایی که می توان برای به دست آوردن شاخص هایی که مستقیماً نتایج اندازه گیری های انجام شده در یک آزمایش را منعکس می کنند استفاده کرد، روش های اولیه نامیده می شوند.

روشهای ثانویه پردازش آماری نامیده می شود که با کمک آنها بر اساس داده های اولیه، الگوهای آماری نهفته در آنها آشکار می شود.

روشهای اولیه پردازش آماری به عنوان مثال عبارتند از:

تعیین میانگین نمونه؛

واریانس انتخابی؛

مد انتخابی؛

میانه نمونه

روش های ثانویه معمولاً عبارتند از:

تجزیه و تحلیل همبستگی؛

تجزیه و تحلیل رگرسیون؛

روش های مقایسه آمار اولیه برای دو یا چند نمونه.

بیایید روش هایی را برای محاسبه آمار ریاضی ابتدایی، با یک میانگین نمونه در نظر بگیریم.

میانگین حسابی - این نسبت مجموع تمام مقادیر داده به تعداد عبارت 28 است.

مقدار متوسط به عنوان یک شاخص آماری، میانگین ارزیابی کیفیت روانشناختی مورد مطالعه در آزمایش است.

این ارزیابی درجه رشد آن را به عنوان یک کل در آن گروه از افراد که تحت معاینه روانشناختی قرار گرفتند مشخص می کند. با مقایسه مستقیم مقادیر میانگین دو یا چند نمونه، می‌توان میزان نسبی توسعه را در افرادی که این نمونه‌ها را تشکیل می‌دهند، با کیفیت ارزیابی شده قضاوت کرد.

میانگین نمونه با استفاده از فرمول 29 زیر تعیین می شود:

که در آن x cf میانگین نمونه یا میانگین حسابی نمونه است.

n - تعداد آزمودنی ها در نمونه یا شاخص های تشخیص روانی خصوصی که بر اساس آن مقدار متوسط محاسبه می شود.

x k - مقادیر خاصی از شاخص ها برای موضوعات فردی. در مجموع n چنین شاخص وجود دارد، بنابراین شاخص k این متغیر مقادیری از 1 تا n را می گیرد.

∑ - پذیرفته شده در ریاضیات نشانه جمع مقادیر آن دسته از متغیرهایی که در سمت راست این علامت قرار دارند.

پراکندگی اندازه گیری پراکندگی داده ها حول میانگین 30 است.

هر چه واریانس بیشتر باشد، انحراف یا پراکندگی در داده ها بیشتر است. برای اینکه بتوان مقادیری را که دارای میانگین یکسان، اما پراکندگی متفاوت هستند، از یکدیگر متمایز کرد.

واریانس با فرمول زیر تعیین می شود:

واریانس نمونه یا به سادگی واریانس کجاست.

عبارتی که به این معنی است که برای تمام x k از اولین تا آخرین نمونه در یک نمونه معین، لازم است تفاوت بین مقادیر خاص و میانگین محاسبه شود، مجذور این تفاوت ها و مجموع.

n تعداد افراد در نمونه یا مقادیر اولیه است که واریانس برای آنها محاسبه می شود.

میانه مقدار صفت مورد مطالعه نامیده می شود که نمونه را به ترتیب بر ارزش صفت داده شده به نصف تقسیم می کند.

اگر توزیع نمونه مشخصه ها نرمال باشد، می توان از روش های محاسبات آماری ثانویه بر اساس توزیع نرمال داده ها برای آن استفاده کرد. در غیر این صورت، این کار نمی تواند انجام شود، زیرا اشتباهات جدی می توانند در محاسبات رخنه کنند.

روش یک آمار ریاضی ابتدایی و ویژگی های توزیع داده های تجربی. مد مقدار کمی صفت مورد مطالعه است که اغلب در نمونه یافت می شود.

برای توزیع ویژگی متقارن، از جمله توزیع نرمال، مقادیر حالت با مقادیر میانگین و میانه منطبق است. برای انواع دیگر توزیع ها، نامتقارن، این معمول نیست.

روش پردازش آماری ثانویه که از طریق آن ارتباط یا رابطه مستقیم بین دو سری داده های تجربی روشن می شود، نامیده می شود. روش تحلیل همبستگی این نشان می دهد که چگونه یک پدیده بر دیگری تأثیر می گذارد یا در پویایی آن با آن مرتبط است. این نوع رابطه مثلاً بین کمیت هایی که در روابط علی با یکدیگر هستند وجود دارد. اگر معلوم شود که دو پدیده از نظر آماری به طور قابل اعتمادی با یکدیگر همبستگی دارند و در عین حال اطمینان وجود داشته باشد که یکی از آنها می تواند به عنوان عامل پدیده دیگر عمل کند، قطعاً به این نتیجه می رسد که بین آنها رابطه علّی وجود دارد. .

انواع مختلفی از این روش وجود دارد:

تجزیه و تحلیل همبستگی خطی به شما امکان می دهد تا روابط مستقیم بین متغیرها را با مقادیر مطلق آنها برقرار کنید. این اتصالات به صورت گرافیکی به صورت یک خط مستقیم بیان می شوند، از این رو به آن "خطی" می گویند.

ضریب همبستگی خطی با استفاده از فرمول 31 زیر تعیین می شود:

جایی که r xy - ضریب همبستگی خطی;

x، y -مقادیر متوسط نمونه از مقادیر مقایسه شده؛

NS من ، در من - مقادیر نمونه جزئی مقادیر مقایسه شده؛

NS -تعداد کل مقادیر در سری مقایسه شده از شاخص ها؛

پراکندگی، انحراف مقادیر مقایسه شده از مقادیر میانگین.

همبستگی رتبه وابستگی را نه بین مقادیر مطلق متغیرها، بلکه بین مکان های ترتیبی یا رتبه های اشغال شده توسط آنها به ترتیب بزرگی تعیین می کند. فرمول ضریب همبستگی رتبه 32 است:

که در آن Rs ضریب همبستگی رتبه اسپیرمن است.

د من - تفاوت بین رتبه های شاخص های موضوعات مشابه در ردیف های مرتب شده؛

NS -تعداد موضوعات یا داده های دیجیتال (رتبه ها) در سری همبسته.

آتیوشوا آنا

در کار با استفاده از مثال پردازش داده ها در مورد پیشرفت دانش آموزان پایه هفتم، ویژگی های آماری اصلی در نظر گرفته شده، داده های آماری جمع آوری و گروه بندی شده، اطلاعات آماری به وضوح ارائه شده و تجزیه و تحلیل داده های به دست آمده است. انجام شد.

کار شامل یک ارائه همراه است.

دانلود:

پیش نمایش:

مؤسسه آموزشی خودمختار شهرداری "Gymnasium No. 24"

XXII کنفرانس علمی MAGNI

پردازش داده های آماری

MAOU "Gymnasium No. 24" Atyusheva Anna

مشاور: معلم ریاضی

شچتینینا ناتالیا سرگیونا

ماگادان، 2016

مقدمه………………………………………………………………………………………………………………………………………………………………………………………… 3

مفاهیم اساسی مورد استفاده در پردازش داده های آماری ……………………………
قسمت تحقیق………………………………………………………………………………………………………………………………………………………………… ..... 7

2.1. پردازش آماری داده ها در مورد پیشرفت دانش آموزان کلاس 7 "B" …………………………

2.2 ارائه بصری داده ها با استفاده از هیستوگرام …………………………………………………………………………………………………………………………………………………………………………………………………………………

2.3. ویژگی های مقایسه ای فعالیت آموزشی دانش آموزان با توجه به نتایج فصل اول و دوم ................................ ................................ 21

2.4. تجزیه و تحلیل پرسشنامه نظرسنجی دانش آموزان پایه هفتم "ب" برای کنترل والدین بر پیشرفت فرزندان ............................ ................................ 23

نتیجه گیری………………………………………………………………………………………………………………………………………………………………………………………………………………………

ادبیات………………………………………………………………………………………………………………………………………………………………………………………………… 28

معرفی

هر یک از ما، با باز کردن کتاب یا روزنامه، روشن کردن تلویزیون یا رسیدن به ایستگاه قطار، دائماً با شکل جدولی از ارائه اطلاعات روبرو هستیم. اینها جدول زمانی درس، جدول زمانی قطار، جدول ضرب و موارد دیگر هستند. تمام اطلاعات در قالب نمودار یا نمودار ارائه شده است.

شما باید بتوانید چنین اطلاعاتی را پردازش و تجزیه و تحلیل کنید. بدون پردازش داده ها، مقایسه رویدادها، ردیابی توسعه یک مشکل خاص غیرممکن است.

در درس جبر به بررسی ویژگی های آماری پرداختیم که در مطالعات مختلف کاربرد فراوانی دارند. من علاقه مند به کاربرد عملی ویژگی های مورد مطالعه و فرصتی برای پردازش داده ها بودم تا اطلاعات ارائه شده به وضوح مسیر توسعه یک مشکل خاص و در نتیجه نتیجه حل آن را تعیین کند. به همین دلیل تصمیم گرفتم عملکرد کلاس خود را در سه ماهه نیمه اول سال در نظر بگیرم.

حوزه تحقیق شی- جبر

موضوع مطالعه- مشخصات آماری

موضوع مطالعه- عملکرد تحصیلی 7 دانش آموز پایه «ب» در سه ماهه نیمه اول سال

فرضیه: ما معتقدیم که با استفاده از مثال پردازش داده ها در مورد عملکرد دانش آموزان کلاس 7B، نه تنها با ویژگی های اصلی آماری آشنا می شویم، بلکه به تنهایی یاد می گیریم:

جمع آوری و گروه بندی داده های آماری؛
ارائه بصری اطلاعات آماری؛
تجزیه و تحلیل داده های به دست آمده

هدف: پردازش، تجزیه و تحلیل و تجسم اطلاعات موجود را بیاموزید.

وظایف:

مطالعه ویژگی های آماری؛
جمع آوری اطلاعات در مورد عملکرد دانش آموزان در کلاس 7 در سه ماهه

نیمه اول سال؛

پردازش اطلاعات؛
ارائه بصری اطلاعات با استفاده از هیستوگرام.
تجزیه و تحلیل داده های به دست آمده، نتیجه گیری مناسب.

مفاهیم اساسی مورد استفاده در پردازش داده های آماری

آمار علمی است که به جمع آوری، پردازش و تجزیه و تحلیل داده های کمی در مورد پدیده های انبوه مختلف در طبیعت و جامعه می پردازد. کلمه "statistics" از کلمه لاتین "status" گرفته شده است که به معنای "وضعیت، وضعیت امور" است.

ساده ترین مشخصه های آماری میانگین حسابی، میانه، محدوده، حالت هستند.

میانگین حسابییک سری اعداد را ضریب تقسیم مجموع این اعداد بر تعداد جمله ها می گویند. معمولاً میانگین حسابی زمانی به دست می‌آید که می‌خواهند مقدار میانگین را برای یک سری داده مشخص تعیین کنند: میانگین عملکرد گندم در هکتار در منطقه، میانگین خروجی یک تیم کاری در هر شیفت، میانگین امتیاز گواهی، میانگین دمای هوا در ظهر این دهه و غیره.
میانه یک سری مرتب شده از اعداد با تعداد فرد فرد، عددی است که در وسط آن نوشته می شود و میانه یک سری اعداد مرتب شده با تعداد اعضای زوج، میانگین حسابی دو عدد نوشته شده در وسط نامیده می شود. توجه داشته باشید که کار کردن با سری اعداد در صورت سفارش راحت تر و سریعتر است. ردیفی که در آن هر عدد بعدی کمتر از عدد قبلی نباشد (یا بیشتر نباشد).
روش به یک سری از اعداد، عددی گفته می شود که اغلب در یک سری مشخص یافت می شود. تعدادی از اعداد ممکن است بیش از یک مد یا اصلاً مد نداشته باشند. حالت یک سری داده معمولاً زمانی پیدا می شود که فرد بخواهد برخی از شاخص های معمولی را شناسایی کند. توجه داشته باشید که میانگین حسابی یک سری اعداد ممکن است با هیچ یک از این اعداد منطبق نباشد و حالت، در صورت وجود، لزوما باید با دو یا چند عدد در سری منطبق باشد. علاوه بر این، بر خلاف میانگین حسابی، مفهوم "حالت" تنها به داده های عددی اشاره نمی کند.
در یک رفت و برگشت یک سری اعداد تفاوت بین بزرگترین و کوچکترین این اعداد است. محدوده یک سری زمانی پیدا می شود که آنها بخواهند میزان گسترش داده ها در یک سری را تعیین کنند.

بیایید تعریف هر یک از ویژگی ها را با استفاده از مثال یک سری اعداد نشان دهیم: 47,46,52,47,52,47,52,49,45,43,53,53,47,52.

میانگین حسابی 48,7.

به این صورت پیدا می شود: مجموع اعداد را تعیین می کنیم و آن را بر تعداد آنها تقسیم می کنیم.

(47+46+52+47+52+47+52+49+45+43+53+53+47+52):14=48,7.

میانه از این سری اعداد، عدد خواهد بود 48.

به این صورت پیدا می شود: یک سری اعداد را سفارش می دهیم و اعدادی را که در وسط است انتخاب می کنیم. اگر تعداد اعداد زوج باشد، میانگین حسابی آن دو را در وسط ردیف اعداد پیدا می کنیم.

43,45,46,47,47,47, 47,49 ,52,52,52,52,53,53

(47+49):2=48

روش از این سری اعداد، اعداد خواهند بود 47 و 52 ... این اعداد اغلب تکرار می شوند.

47 ,46, 52 , 47 , 52 , 47 , 52 ,49,45,43,53,53, 47 , 52 .

در یک رفت و برگشت از این سری اعداد خواهد بود 10.

به این صورت پیدا می شود: بزرگترین و کوچکترین عدد را در سری انتخاب کنید و تفاوت بین این اعداد را پیدا کنید.

47,46,52,47,52,47,52,49,45, 43, 53 ,53,47,52

53-43=10

بخش تحقیق

پردازش آماری داده ها در مورد عملکرد دانش آموزان کلاس 7 "B"

بیایید به پردازش اطلاعات برویم. بیایید برای هر یک از موضوعات جداول، متشکل از سه خط، بسازیم، اولی حاوی یک سری داده است. هر گونه از این سری در واقع برای تعداد معینی در نمونه مشاهده شد. این عدد را تعدد گزینه ها می گویند. پس بیایید در خط دوم تعدد گزینه مربوطه را قرار دهیم. بیایید جدول توزیع نمونه را بدست آوریم.

اگر همه ضرایب را جمع کنیم، تعداد تمام اندازه گیری های انجام شده در طول نمونه برداری - حجم نمونه (در مورد ما، این عدد 24 است که با تعداد دانش آموزان کلاس مطابقت دارد) به دست می آید.

در خط سوم، نسبت که به صورت درصد بیان می شود، فراوانی گزینه ها نامیده می شود.

گزینه های فرکانس =

به طور کلی، اگر جدولی از فرکانس های نسبی بر اساس نتایج مطالعه تهیه شود، مجموع فرکانس های نسبی برابر با 100 درصد است.

من یک چهارم

زبان روسی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،3،3،3،3،3،4،4،4،4،4،4 ,4,4 , 4.5.

میانگین نمره در موضوع:(میانگین).

جدول تخصیص فرکانس

گزینه
گزینه های چندگانگی	خیر
فرکانس٪		58.3%	37.5%	4.2%

ادبیات.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4 ,5,5,5 , 5.5.

میانگین نمره در موضوع:(میانگین).

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	41.7%	20.8%

جبر.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4 ,4,4,4 , 5.5.

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4، 3" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		45.8%	45.8%	8.3%

تاریخ.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4 ,4,4,4 , 4.5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		45.8%	4.2%

مطالعات اجتماعی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	41.7%	20.8%

جغرافیا.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,5,5,5,5 ,5,5,5.5 ,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		20.8%	41.7%	37.5%

فیزیک.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4 ,4,4,4 , 4.5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	58.3%	4.2%

زیست شناسی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4،4،5،5 ,5,5,5,5,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		45.8%	29.2%

اصول ایمنی زندگی

بیایید داده های نمونه (نمرات) را مرتب کنیم: 4,4,4,4,4,4.4.5,5,5,5,5,5,5,5,5,5,5,5,5,5 ,5,5,5,5

میانگین نمره در موضوع:(میانگین).

گزینه های ارزیابی
کثرت	خیر	خیر
فرکانس٪			29.2%	70.8%

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،4،4،4.4،4،4،4،4،4،5،5،5،5،5،5،5،5.5،5،5.5،5 ,5,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع "5" (مد) دارند.

حدود نیمی از دانش آموزان زبان روسی در 5 سال تحصیل می کنند (متوسط)

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		4.2%	37.5%	58.3%

انگلیسی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4 ,5.5,5,5 ,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	41.7%	20.8%

علوم کامپیوتر.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،4،4،4،4.4،4،4،4،4،4،4،4،5،5،5،5.5.5،5،5 ,5,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		4.2%	54.2%	41.7%

فن آوری.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,55,5 ,5,5,5,5

میانگین نمره در موضوع:(میانگین).

بیشترین تعداد دانش آموزان در این موضوع "5" (مد) دارند.

حدود نیمی از دانش آموزان در زبان روسی با 4.5 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		20.8%	54.2%

اکنون بیایید اطلاعات مشابهی را در مورد نتایج سه ماهه دوم جمع آوری کنیم.

زبان روسی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3.3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4 ,4,4,4,4

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر			خیر
فرکانس٪		41.7%	58.3%

ادبیات.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،5 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع "3" (مد) دارند.

حدود نیمی از دانش‌آموزان زبان روسی در کلاس 3 تحصیل می‌کنند (متوسط)

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		41.7%	33.3%

جبر.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4 ,4,4,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع "3" (مد) دارند.

حدود نیمی از دانش‌آموزان زبان روسی در کلاس 3 تحصیل می‌کنند (متوسط)

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	12.5%

تاریخ.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,3,3,3,3,3,3,4.4,4,4,4,4,4,4,4,4,4,4 ,4,4,4,5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		37.5%	58.3%	4.2%

جامعه.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،4،4،4،4،4،4،4،4،4،4،4،4،4،4،4،4 ,4,4,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		16.7%	70.8%	12.5%

جغرافیا.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،4،4،4،4،4،4،4،4،4،4،4،4،4،4،4،5،5 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		12.5%	58.3%	29.2%

فیزیک.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،4،4،4،4،4،4،4،4،4،4،4،4 ,44,5,5 ,5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		33.3%	16.7%	12.5%

زیست شناسی.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,4,4,4,4,4,4,4.4,4,4,4,4,4,4,4,4,5,5 ,5,5,5,5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		12.5%	62.5%

اصول ایمنی زندگی

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،4،4،5،5،5،5،5.5،5،5،5،5،5،5،5،5،5،5،5،5. ,5,5,5,5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع "5" (مد) دارند.

حدود نیمی از دانش آموزان زبان روسی در 5 سال تحصیل می کنند (متوسط)

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		4.2%	8.3%	87.5%

تاریخ و جامعه سرزمین مادری.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،4،4،4،4،4،4،4،4،4،4،4،4،5،5،5،5،5 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		12.5%	45.8%	41.7%

انگلیسی.

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		20.8%	29.2%

علوم کامپیوتر.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع دارای "4" (مد) هستند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		20.8%	29.2%

فن آوری.

بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،4،4،4،4،4،4،4،5،5،5،5،5،5،5،5،5،5،5،5 ,5,5,5 , 5.5

میانگین نمره در موضوع:(میانگین)

بیشترین تعداد دانش آموزان در این موضوع "5" (مد) دارند.

حدود نیمی از دانش آموزان در زبان روسی در 4 (متوسط) مطالعه می کنند.

گزینه های ارزیابی
کثرت	خیر
فرکانس٪		4.2%	29.2%	66.7%

تجسم داده ها با هیستوگرام

برای ارائه بصری داده های به دست آمده در نتیجه یک مطالعه آماری، روش های مختلف ارائه آنها به طور گسترده استفاده می شود.

ما از هیستوگرام برای وضوح داده ها استفاده خواهیم کرد. هیستوگرام یک شکل پلکانی است که از مستطیل های بسته تشکیل شده است. قاعده هر مستطیل برابر طول بازه و ارتفاع برابر با تعدد متغیر یا بسامد نسبی است. بنابراین، در یک هیستوگرام، بر خلاف نمودار میله‌ای معمولی، پایه‌های مستطیل خودسرانه انتخاب نمی‌شوند، بلکه به شدت با طول بازه تعیین می‌شوند.

ویژگی های مقایسه ای عملکرد دانش آموزان در دروس سه ماهه اول

ویژگی های مقایسه ای عملکرد دانش آموزان در دروس فصل دوم

نتیجه گیری

با توجه به نتایج سه ماهه اول، به وضوح مشاهده می شود که سخت ترین برای دانش آموزان برای کنار آمدن با موضوعاتی مانند: زبان روسی و جبر، دروسی که برای آنها "سه" یک ارزیابی است که نسبت به سایر نمرات در اولویت است. این بدان معناست که کیفیت در این موضوعات نسبت به سایر موضوعات پایین تر است.

همچنین مشخص است که سطح بالای سه قلو در دروسی مانند ادبیات، تاریخ، جامعه، فیزیک، انگلیسی. همچنین داشتن سه گانه در دروسی مانند فناوری، زیست شناسی، جغرافیا، غم انگیز است.

بر اساس نتایج سه ماهه دوم، تعداد سه و پنج به طور قابل توجهی کاهش یافت، یعنی دانش آموزان نقاط قوت خود را در همه دروس توزیع کردند و نه بر اساس ترجیحات جداگانه.

هیستوگرام توزیع میانگین نمره در دروس سه ماهه اول

هیستوگرام توزیع میانگین نمره در دروس فصل دوم

خروجی

برای ایجاد این نمودارها، از یک مشخصه آماری به عنوان میانگین حسابی استفاده کردیم. به وضوح مشاهده می شود که در سه ماهه دوم، دانش زبان روسی، تاریخ و جامعه سرزمین مادری، علوم کامپیوتر رو به وخامت گذاشته است. در تاریخ، جامعه، فیزیک، زیست شناسی، ایمنی زندگی، انگلیسی بهبود یافته است. اما در عین حال، نمودارها نشان می‌دهند که تغییرات مهم‌تر برای بهتر شدن فقط در فیزیک و زبان انگلیسی رخ داده است.

ویژگی های مقایسه ای فعالیت آموزشی دانش آموزان با توجه به نتایج فصل اول و دوم

هیستوگرام کیفیت دانش در موضوعات فصل اول

هیستوگرام کیفیت دانش در موضوعات فصل دوم

با ترکیب هر دو هیستوگرام در یک، دیدن تصویر عملکرد کلاس در مقایسه بسیار آسان تر است. و به صورت جداگانه آسانتر است که ببینید برای کدام موضوعات کیفیت بالاتر است. به عنوان مثال، در سه ماهه اول کیفیت کمتر از 60٪ در موضوعات - جبر، روسی، تاریخ، در دوم - روسی، ادبیات، جبر، فیزیک است. از قبل واضح است که سخت ترین مشکل برای دانش آموزان زبان روسی، جبر است. و درصد کیفیت در همه موضوعات بسیار متفاوت نیست 66٪ - سه ماهه اول، 68٪ - دوم. یعنی کیفیت پرش مانند در موضوعات، که به وضوح در نمودار مقایسه قابل مشاهده است، نشان می دهد که دانش آموزان به طور خاص در تلاش برای بهبود سطح دانش خود نیستند و موقعیت خود را در یک حوزه موضوعی حفظ نمی کنند.

نمودار مقایسه همه اقلام بر اساس کیفیت برای سه ماهه اول و دوم

در سه ماهه دوم، تعداد دانش آموزان خوب و ممتاز در زبان روسی، جامعه، زیست شناسی، انگلیسی و فناوری به طور قابل توجهی افزایش یافت. تعداد در ادبیات، جبر، ایمنی زندگی، IORK و علوم کامپیوتر اندکی کاهش یافته است. و افت شدید کیفیت فیزیک را می بینید که با عدم آمادگی دانش آموزان برای درس همراه است.

و دوباره به این نتیجه می رسیم که کودکان "در جهش و مرز" یاد می گیرند و هیچ اولویت خاصی در جهت آموزش وجود ندارد (موضوعات بشردوستانه ، فیزیک و ریاضیات ، موضوعات چرخه طبیعی).

تحلیل پرسشنامه‌ای از دانش‌آموزان پایه هفتم «ب» با موضوع کنترل والدین بر پیشرفت فرزندان.

بر اساس نتایج مطالعه فوق، ما تصمیم گرفتیم در بین دانش آموزان کلاس 7 "B" نظرسنجی برای کنترل والدین بر آموزش کودکان انجام دهیم (پرسشنامه ها، به پیوست مراجعه کنید).

حجم نمونه 22 نفر می باشد.

والدین تکالیف را بررسی می کنند

خروجی

تقریباً یک چهارم دانش آموزان بدون کنترل والدین به این موضوع می پردازند که البته بر عملکرد تحصیلی آنها تأثیر می گذارد.

تعداد بررسی تکالیف در هفته

میانه = 0,0,0,0,0,0,1,1,2,2,3,3,3,3,4,4,5,7,7,7,7,7 = (3 + 3 ): 2 = 3

میانگین حسابی = 3

خروجی

به طور متوسط، تکلیف سه بار در هفته بررسی می شود. با توجه به ناپیوستگی یادگیری، این کافی نیست.

میانه = 0,0,0,0,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,5,5,6, 7، 7.7 = (2 + 2): 2 = 2

میانگین حسابی = 3 (به طور متوسط، خاطرات روزانه 3 بار در هفته توسط والدین بررسی می شود)

مقدار زمانی که دانش آموزان برای انجام تکالیف اختصاص می دهند

انواع	کمتر از 1
فرکانس٪

چرخش R = x (حداکثر) - x (دقیقه) = 3.5 - 0.5 = 3 ساعت

(میزان پراکندگی مقادیر مشاهده شده را مشخص می کند، یعنی تفاوت بین طولانی ترین و کوتاه ترین زمان را نشان می دهد)

حالت M (0) = 2.5 ساعت ( مقداری را نشان می دهد که بیشتر از سایرین رخ می دهد، یعنی. زمانی را که دانش آموزان اغلب صرف می کنند را نشان می دهد)

هیستوگرام زمان صرف شده دانش آموزان برای تکالیف منزل

خروجی

به طور متوسط انجام تکالیف روزانه 2.5 ساعت طول می کشد. که شاخصی طبیعی برای سن دانش آموزان محسوب می شود.

نتیجه

در نتیجه کار انجام شده، یاد گرفتم که اطلاعات موجود را پردازش و تجزیه و تحلیل کنم

دانستن ویژگی‌های آماری به من کمک کرد تا معدل در موضوعات مختلف و همچنین مد و دامنه در آن شاخص‌های عملکردی را که تعیین آنها غیرممکن به نظر می‌رسد، تعیین کنم. بدون پردازش داده ها، مقایسه رویدادها، ردیابی توسعه یک مشکل خاص غیرممکن است. ما سعی کردیم نه تنها مشکل پیش آمده را ردیابی کنیم - کاهش کیفیت دانش و عملکرد تحصیلی در موضوعات، بلکه سعی کردیم دلیل آن را نیز پیدا کنیم که به نظر ما کنترل ناکافی والدین بر عملکرد تحصیلی است. از فرزندانشان بررسی پرسشنامه و نتایج عملکرد تحصیلی نشان داد که دانش‌آموزان پایه هفتم «ب» مهارت کافی در خودکنترلی بر یادگیری خود ندارند و والدین برعکس آن را باور دارند.

کار انجام شده، فکر می کنم، هم برای معلم کلاس در کار با والدین مفید خواهد بود و هم برای همکلاسی هایم که در آینده نتایج خود را در موضوعات فردی بهبود بخشند.

آمار علمی است که به مطالعه، پردازش و تجزیه و تحلیل داده های کمی در مورد طیف گسترده ای از پدیده های انبوه در زندگی می پردازد. ویژگی های آن را فقط کمی برای خودمان فاش کرده ایم و هنوز چیزهای ناشناخته و جالبی در پیش است.

کتابشناسی - فهرست کتب:

http://www.nado5.ru/e-book/naibolshii-obzchii-delitel
پیش نمایش:
برای استفاده از پیش نمایش ارائه ها، برای خود یک حساب Google (حساب) ایجاد کنید و وارد آن شوید: https://accounts.google.com

شرح اسلاید:
پردازش داده های آماری تهیه شده توسط: دانش آموز کلاس هفتم "B" MAOU "Gymnasium No. 24" Anna Atyusheva مشاور: معلم ریاضی ناتالیا سرگیونا شچتینینا
هدف: یادگیری پردازش، تجزیه و تحلیل و تجسم اطلاعات موجود. اهداف: مطالعه مشخصات آماری. جمع آوری اطلاعات در مورد پیشرفت دانش آموزان در کلاس 7 در سه ماهه نیمه اول سال. پردازش اطلاعات؛ ارائه بصری اطلاعات با استفاده از هیستوگرام. تجزیه و تحلیل داده های به دست آمده، نتیجه گیری مناسب.
فرضیه ای با استفاده از مثال پردازش داده ها در مورد عملکرد دانش آموزان، شما نه تنها می توانید با ویژگی های اصلی آماری آشنا شوید، بلکه نحوه جمع آوری و گروه بندی داده های آماری را نیز یاد بگیرید. ارائه بصری اطلاعات آماری؛ تجزیه و تحلیل داده های دریافتی
آمار علمی است که به جمع آوری، پردازش و تجزیه و تحلیل داده های کمی در مورد پدیده های انبوه مختلف در طبیعت و جامعه می پردازد. کلمه "statistics" از کلمه لاتین "status" گرفته شده است که به معنای "وضعیت، وضعیت امور" است. ساده ترین ویژگی های آماری: حالت میانگین حسابی میانگین دهانه
تعیین هر یک از ویژگی ها با استفاده از مثال یک سری اعداد: 47,46,52,47,52,47,52,49,45,43,53,53,47,52. میانگین حسابی این سری از اعداد عدد 48.7 خواهد بود. (47 + 46 + 52 + 47 + 52 + 47 + 52 + 49 + 45 + 43 + 53 + 53 + 47 + 52): 14 = 48.7. میانه این سری از اعداد عدد 48.43،45،46،47،47،47، 47، 49، 52،52،52،52،53،53 (47 + 49): 2 = 48 حالت این سری از اعداد اعداد 47 و 52 خواهند بود. 47، 46، 52، 47، 52، 47، 52، 49،45،43،53،53، 47، 52. محدوده این سری از اعداد 10 خواهد بود. 49.45، 43، 53، 53.47.52 53- 43 = 10
مشکلات عملکرد تحصیلی در کلاس 7 "B"
گزینه 2 3 4 5 نرخ فرکانس بدون گزینه 14 9 1 فرکانس% 0% 58.3% 37.5% 4.2% زبان روسی. بیایید داده های نمونه (نمرات) را مرتب کنیم: 3،3،3،3،3،3،3،3،3،3،3،3،3،3،4،4،4،4،4،4 ,4,4 , 4.5. میانگین نمره در موضوع: 14 ∙ 3 + 9 ∙ 4 + 5 ∙ 124 = 8324≈3.5 (میانگین حسابی). بیشترین تعداد دانش آموزان در این موضوع دارای "3" (مد) هستند تقریباً نیمی از دانش آموزان در زبان روسی در 3 (متوسط) مطالعه می کنند.
برای ارائه بصری داده های به دست آمده در نتیجه یک مطالعه آماری، روش های مختلف ارائه آنها به طور گسترده استفاده می شود.
ویژگی‌های مقایسه‌ای عملکرد دانش‌آموزان در دروس فصل اول
ویژگی های مقایسه ای عملکرد دانش آموزان در دروس فصل دوم
هیستوگرام توزیع میانگین نمرات دروس دوره های اول و دوم
نمودار مقایسه همه موضوعات بر اساس کیفیت برای سه ماهه اول و دوم
پرسش از دانش آموزان کلاس 7 "ب" در مورد کنترل والدین بر تحصیل فرزندان پرسشنامه 1. آیا والدین شما تکالیف شما را بررسی می کنند؟ _________________________________________________________________ 2. چند بار در هفته؟ _________________________________________________________________ 3. والدینتان چند بار در هفته به دفتر خاطرات شما نگاه می کنند؟ _________________________________________________________________ 4. به طور متوسط هر روز چقدر زمان برای انجام تکالیف اختصاص می دهید؟ _________________________________________________________________
والدین تکالیف را بررسی می کنند
تعداد بررسی تکالیف در هفته میانه = 0.0.0.0.0.0.1.1.2.2.3.3.3.3.4.4.5.7.7.7.7، 7 = (3 + 3): 2 = 3 میانگین حسابی = 3
هیستوگرام زمان صرف شده دانش آموزان برای انجام تکالیف