دانلود پایان نامه

choice
(1-PL, 2-PL, 3-PL) Logistic Models, Racsch model
IRT model
جدول 3-2: اطلاعات پیشین مربوط به توزیع پارامترهای خزانه‌ی سؤال عملیاتی حسابان-دیفرانسیل (CAT یک محتوایی)
پارامتر آماره
میانگین
انحراف معیار
توزیع
سطح معناداری
(sig)
0893/1
2745/0
28/0
039/0-
079/1
87/0
654/2
649/15
63/0
جدول 3-3: اطلاعات پیشین مربوط به توزیع پارامترهای خزانه‌ی سؤال عملیاتی سه محتوایی (حسابان-دیفرانسیل، هندسه و جبر)
پارامتر
میانگین
انحراف معیار
توزیع
سطح معناداری
(sig)
حسابان-دیفرانسیل
0893/1
2745/0

 

اینجا فقط تکه های از پایان نامه به صورت رندم (تصادفی) درج می شود که هنگام انتقال از فایل ورد ممکن است باعث به هم ریختگی شود و یا عکس ها ، نمودار ها و جداول درج نشوند.

برای دانلود متن کامل پایان نامه ، مقاله ، تحقیق ، پروژه ، پروپوزال ،سمینار مقطع کارشناسی ، ارشد و دکتری در موضوعات مختلف با فرمت ورد می توانید به سایت  77u.ir  مراجعه نمایید

رشته روانشناسی و علوم تربیتی همه موضوعات و گرایش ها :روانشناسی بالینی ، تربیتی ، صنعتی سازمانی ،آموزش‌ و پرورش‌، کودکاناستثنائی‌،روانسنجی، تکنولوژی آموزشی ، مدیریت آموزشی ، برنامه ریزی درسی ، زیست روانشناسی ، روانشناسی رشد

در این سایت مجموعه بسیار بزرگی از مقالات و پایان نامه ها با منابع و ماخذ کامل درج شده که قسمتی از آنها به صورت رایگان و بقیه برای فروش و دانلود درج شده اند

28/0
هندسه
206/1
2245/0
32/0
جبر
356/1
247/0
18/0
حسابان-دیفرانسیل
039/0-
079/1
87/0
هندسه
0482/0
094/1
73/0
جبر
0324/0
018/1

75/0
حسابان-دیفرانسیل
654/2
649/15
63/0
هندسه
889/2
547/15
66/0
جبر
456/2
635/15
62/0
جدول 3-4: اطلاعات پیشین مربوط به میزان آگاهی تست در خزانه‌ی سؤال عملیاتی یک محتوایی (حسابان-دیفرانسیل)
آماره
دامنه‌ی توانایی
088235/1 تا 6245/1-
2162/0
04673/0
4/21
5/2 تا 6245/1 & 5/2- تا 6245/1-
2331/0
05435/0
4/18
4 تا 5/2 & 4- تا 5/2-
2548/0
06493/0
4/15
جدول 3-5 : اطلاعات پیشین مربوط به میزان آگاهی تست در خزانه‌ی سؤال عملیاتی سه محتوایی (حسابان-دیفرانسیل، هندسه و جبر)
آماره
دامنه‌ی توانایی
6245/1 تا 6245/1-
1260/0
0161/0
846/61
5/2 تا 6245/1 & 5/2- تا 6245/1-
1289/0
0172/0
122/60
4 تا 5/2 & 4- تا 5/2-
133/0
0178/0
132/56
نمودار 3-1: مراحل شبیه‌سازی سنجش انطباقی کامپیوتری
نمودار 3-2: میزان آگاهی فراهم شده بوسیله‌ی یک سؤال که بر اساس مدل راش مدرج شده است.
نمودار 3-3: نمونه‌ای از تصویر ab-bin یا ab-block

نمودار 3-4: توزیع جمعیت برای نمونه 500 نفری ( در بازه 4- تا 4) با فواصل 125/0
نمودار 3-5: توزیع جمعیت برای نمونه 6000 نفری ( در بازه 4- تا 4) با فواصل 125/0
فصل چهارم
تجزیه و تحلیل یافته‌های پژوهش
تجزیه و تحلیل یافتههای پژوهش
مقدمه
در این فصل اطلاعات مربوط به شبیه‌سازی خزانه‌های سؤال بهینه و نتایج داده‌های بدست آمده از اجراهای واقعی CAT مورد بررسی قرار خواهد گرفت.
این قسمت از دو بخش عمده تشکیل شده است. در بخش اول، روش شبیه‌سازی مونت کارلو ریکیسی (2003) در مورد شبیه‌سازی خزانه‌ی سؤال بهینه بر اساس مدل راش مورد بررسی قرار می‌گیرد. این بخش به منظور مفهوم‌سازی رویکرد اکتشافی ریکیسی (بر اساس روش bin-and-union ) در طراحی خزانه‌ی سؤال بهینه، در مورد آزمون CAT که تک محتوایی است و هیچ گونه روش کنترل مواجهه‌ی بیش از حد سؤال بر آن اعمال نمی‌شود و پهنای b-bin ها برابر با 2/0 است، شبیه‌سازی می‌شود، تا از این طریق منطق و زیربنای این شبیه سازی به صورت کامل در مدل تک پارامتری راش، شرح داده شود. در قسمت دوم ویژگی‌های مربوط به خزانه‌های سؤال بهینه‌ی شبیه‌سازی شده بر اساس مدل سه پارامتری (قابل تعمیم به مدل دو پارامتری نیز می‌باشد)، شامل؛ اندازه‌ی خزانه‌ی سؤال، ویژگی‌های آماری و غیر آماری خزانه‌ها مورد بررسی قرار می‌گیرد. همچنین، عملکرد خزانه‌های سؤال شبیه‌سازی شده با عملکرد خزانه‌ی سؤال عملیاتی مقایسه می‌شود، این عملکردها از طریق ملاک‌های ارزیابی خزانه‌ی سؤال شامل، میانگین آگاهی آزمون در هر سطح ، سوگیری یا بایاس، میانگین مجذور خطا (MSE)، به منظور سنجش دقت برآورد ، میزان چولگی یا کجی توزیع نرخ مواجهه‌ی سؤال، درصد سؤالات بیش مواجهه شده، نرخ همپوشی سؤال و درصد سؤالات کم مواجهه شده، به منظور محاسبه‌ی شاخص امنیت آزمون، مورد ارزیابی قرار می‌گیرد (چانگ و یینگ، 1999 ؛ ریکیسی 2005).
در این فصل نتایج بدست آمده از اجرای شبیه‌سازی های صورت گرفته برای ساخت خزانه‌های سؤال بهینه در 18 طرح متنوع گزارش می‌شود، سپس، نتایج حاصل از هر یک از طرح‌ها با یک خزانه‌ی سؤال عملیاتی مقایسه خواهد شد.
در این فصل ذکر چندین نکته قبل از گزارش نتایج ضرورت دارد:
از این پس به خزانه‌های سؤال بهینه‌ای که بر اساس روش bin-and-union ایجاد می‌شود، بر اساس اختصار ROP (range-optimal item pool) گفته خواهد شد. این اختصار از پژوهش‌ ریکیسی و هی( b 2009) گرفته شده است.
همچنین، خزانه‌ی سؤال عملیاتی به صورت اختصار، OP (operational item pool) بیان می‌شوند، این اصطلاح از پژوهش گو و ریکیسی (2007) گرفته شده است.
با دستکاری چهار عامل: روش ایجاد سؤال بهینه (R، MRP، MTI)، پهنای b-bin (2/0 و 4/0)، کنترل و یا عدم کنترل مواجهه بیش از حد سؤال، در نظر گرفتن و یا نگرفتن تعادل محتوای در CAT، 18 خزانه‌ی سؤال بهینه یا (ROP_1, ROP_2, ROP_3, …, ROP_18) ایجاد شد. که در جدول 4-1 آورده شده است.
لازم به ذکر است که آزمون ریاضی CAT عملیاتی شامل دو بخش است، یک بخش، آزمون 20 سؤالی که در آن تعادل محتوای سؤالات ارائه شده، در نظر گرفته نشده است (این آزمون تنها به منظور اهداف پژوهشی بر روی نمونه‌ای معرف از جامعه‌ی مورد نظر اجرا شد). و بخش دوم، یک آزمون 60 سؤالی که در آن محتوای سؤالات آزمون دارای اهمیت می‌باشد. آزمون 60سؤالی دارای وزن محتوایی ثابت برای همه‌ی آزمودنی‌ها می‌باشد، یعنی شامل، 25 سؤال حسابان (arithmetic)، 15 سؤال جبر خطی (algebra) و 20 سؤال هندسه (geometry) می‌باشد. هر یک از این دو قسمت، به صورت مجزا در نمونه‌های همتایی (350 نفری) از جامعه‌ی دانش‌آموزان مقطع پیش‌دانشگاهی به صورت آنلاین اجرا شد.
همچنین، نتایج ساخت خزانه‌های سؤال سه پارامتری برای CAT ، با در نظر گرفتن تعادل محتوایی و بدون تعادل محتوایی، دارای تعداد سؤالات متفاوتی است، از این‌رو، در این پژوهش این هدف وجود ندارد که نتایج این دو قسمت با یکدیگر مقایسه شود زیرا، تعداد سؤالات متفاوتی را شامل می‌شوند. بنابراین، در این فصل، برای طراحی خزانه‌های سؤال بهینه بر اساس مدل سه پارامتری دو تقسیم بندی کلی وجود دارد، یکی از آنها تحت عنوان، خزانه‌های سؤال بدون در نظر گرفتن تعادل محتوایی و دیگری، خزانه‌های سؤال با در نظر گرفتن تعادل محتوایی می‌باشد.
تقسیم بندی دیگری که در طراحی خزانه‌های سؤال در نظر گرفته شد، عامل مواجهه‌ی سؤال است.
همچنین، از آنجا که پهنای b-bin ها، یکی از عوامل مهم در دقت اندازه‌گیری خزانه‌ی ایجاد شده، می‌باشد و بر وپژگی‌هایی همچون تعداد سؤال و توزیع پارامترهای سؤالات نیز تاثیر می‌گذارد، دو پهنای 2/0 و 4/0 که به ترتیب برابر با 96/0 . 99/0 دقت اندازه‌گیری می‌باشند، با یک میزان ثابت در دامنه‌ی تغییر پارامتر a یا تغییر در بیشینه‌ی آگاهی برابر با 4/0، وارد تحلیل می‌شوند.
جدول 4-1: طرح‌های خزانه‌ی سؤال شبیه‌سازی شده
موقعیت condition
خزانه‌ی سؤال item pool
روش ایجاد سؤال
item generation methods
پهنای b-bin
کنترل مواجهه
Exposure control
تعادل محتوایی
Content Balancing
تعداد سؤال
1
ROP_1
R
2/0
without- Exposure control

without Content Balancing
20
2
ROP_2
MRP
2/0
without – Exposure control
without Content Balancing
20
3
ROP_3
MTI
2/0
without – Exposure control
without Content Balancing
20
4
ROP_4
R
4/0
without – Exposure control
without Content Balancing
20
5
ROP_5
MRP
4/0
without – Exposure control
without Content Balancing
20
6
ROP_6
MTI
4/0
without – Exposure control
without Content Balancing
20
7
ROP_7
R
2/0
Exposure control
without Content Balancing
20
8
ROP_8
MRP
2/0
Exposure control
without Content Balancing
20
9
ROP_9
MTI
2/0
Exposure control
without Content Balancing
20
10
ROP_10
R
4/0
Exposure control
without Content Balancing
20
11
ROP_11
MRP
4/0
Exposure control
without Content Balancing
20
12
ROP_12
MTI
4/0
Exposure control
without Content Balancing
20
13
ROP_13
R
2/0
without – Exposure control
Content Balancing
60
14
ROP_14
MRP
2/0
without – Exposure control
Content Balancing
60

15
ROP_15
MTI
2/0
without – Exposure control
Content Balancing
60
16
ROP_16
R
2/0
Exposure control
Content Balancing
60
17
ROP_17
MRP
2/0
Exposure control
Content Balancing
60
18
ROP_18
MTI
2/0
Exposure control
Content Balancing
60
طراحی خزانه سؤال بهینه‌ی شبیه‌سازی شده برای آزمون انطباقی ریاضی بر اساس مدل تک پارامتری راش، بدون وارد کردن قیود تعادل محتوایی و بدون در نظر گرفتن کنترل مواجهه‌ی بیش از حد سؤال، پهنای b-bin= 0.2
در این قسمت یافته‌های مربوط به شبیه‌سازی خزانه‌ی سؤال بهینه برای آزمون CAT ریاضی 20 سؤالی در یک جمعیت 6000 نفری گزارش خواهد شد، سپس توزیع و اندازه‌ی خزانه‌ی بهینه‌ی ایجاد شده بر اساس روش bin-and-union مورد بررسی قرار خواهد گرفت. از آنجایی که هیچ یک از سؤالات در خزانه‌ی عملیاتی طراحی شده با مدل تک پارامتری برازش نداشتند، مبنایی برای مقایسه نتایج بدست آمده از این شبیه‌سازی با خزانه‌ی عملیاتی وجود نداشت. ولی به منظور تعمیم این روش به مدل دو و سه پارامتری، لازم است که در پژوهش حاضر اصول به کار رفته در شبیه سازی روش bin-and-union توسط ریکیسی ابتدا اجرا شود و سپس مبانی آن به مدل دو و سه پارامتری تعمیم داده شود.
نحوه‌ی شبیه‌سازی
ابتدا، یک آزمودنی به طور تصادفی از جمعیت موردنظر با میانگین صفر و انحراف معیار 1 انتخاب شد. در این شبیه‌سازی فرض بر این بود که توانایی واقعی آزمودنی‌ها معلوم است. این توانایی‌ها در بازه 4- تا 4 با فواصل 1/0 از توزیع نرمال نمونه‌گیری شد. از آنجا که هیچ گونه اطلاعی در مورد عملکرد این آزمودنی وجود نداشت، توانایی اولیه‌ی او برابر با قرار داده شد، بنابراین، پارامتر دشواری سؤال اولی که برای اجرا انتخاب شد برابر با بود، زیرا سؤالی بود که بیشترین میزان آگاهی را در برآورد اولیه‌ی در مدل راش ایجاد می‌کرد. در مجموع، فرآیند انتخاب سؤال در شبیه‌سازی، با انتخاب سؤالی با پارامتر شروع شد. و در واقع، برای همه‌ی آزمودنی‌ها در این شیوه‌ی CAT سؤال اول یکسان بود و با و شروع شد. اگر پاسخ اول آزمودنی صحیح بود، 70/0 به برآورد قبلی توانایی او اضافه می‌شد، و اگر پاسخ غلط بود، از برآورد قبلی توانایی او 70/0 کم می‌شد. به همین نحو، سؤالات برای این آزمودنی اجرا شد و پس از مشاهده‌ی پاسخ صحیح یا غلط در الگوی پاسخ او، روش برآورد توانایی، بر اساس بیشینه‌ی درست نمایی قرار گرفت و این فرآیند ادامه یافت تا 20 سؤال برای این آزمودنی اجرا شد. در مرحله‌ی بعد، سؤالات اجرا شده به bin های مربوطه اختصاص یافت. از آنجا که در این آزمون هدف این بود که 99% بیشینگی آگاهی یا بهینگی برقرار شود، یعنی یک خزانه‌ی سؤال p-optimal با ملاک 99% بیشینه‌ی آگاهی ایجاد ‌شود و دامنه‌ی متناظر در r-optimal برابر با 2/0 ‌باشد، بنابراین، پهنای bin برابر با 2/0 قرار داده شد و در این گام مقیاس پارامتر b به فواصلی با پهنای 2/0 تقسیم شد، و سپس تعداد سؤالاتی که برای هر فرد اجرا شد، در هر فاصله محاسبه شد.
اجرای شبیه‌سازی برای یک آزمودنی
برنامه برای نفر دوم از 6000 آزمودنی (در اینجا نفر اول گزارش نمی‌شود، چون برنامه به شکلی تعبیه شده که همیشه به صورت ثابت یک نفر از مرکز توزیع توانایی را به عنوان آزمودنی اول انتخاب کند، بنابراین ما از گزارش آزمودنی اول صرف ‌نظر خواهیم کرد)، توانایی واقعی برابر با انتخاب کرد. فرض بر این بود که این آزمون CAT دارای یک خزانه‌ی سؤال نامتناهی است که شامل هر نوع سؤالی با پارامتر ممکن b می‌باشد. از آنجا که، از نحوه‌ی عملکرد آزمودنی هیچ اطلاعی در دسترس نبود، پارامتر b سؤال اول برابر با صفر قرار داده شد. چون، () واقعی این آزمودنی در شبیه‌سازی معلوم بود، () برای سؤال اولی () که برای او اجرا شد، برای برنامه‌ی شبیه‌ساز قابل محاسبه بود. به دلیل اینکه، عدد تصادفی () که از یک توزیع یکنواخت () استخراج شد، از مقدار () بدست آمده بزرگتر بود، پاسخ برابر با صفر درنظر گرفته ‌شد. و بنابراین، چون هنوز هیچ پاسخ صحیحی در الگوی پاسخ مشاهده نشده بود، از برآورد توانایی این آزمودنی، 70/0 کم شد. پارامتر b سؤال دومی که اجرا شد، برابر با بود، سؤال دوم نیز از عدد یکنواخت تصادفی کوچکتر بود، بنابراین، پاسخ این سؤال نیز صفر شد و پارامتر b سؤال سوم برابر با شد. پس از اجرای سؤال سوم، نیز از عدد تصادفی یکنواخت کوچکتر شد و پاسخ این سؤال نیز صفر شد. بنابراین، پارامتر b سؤال چهارم برابر با شد. پس از اجرای سؤال چهارم، از عدد تصادفی یکنواخت بزرگتر شد و پاسخ این سؤال 1 شد. بنابراین، از این به بعد برای برآورد توانایی آزمودنی از روش بیشینه‌ی درست نمایی استفاده شد و پارامتر b سؤال پنجم برابر با شد. این فرآیند، تا پایان سؤال 20 ادامه یافت. تا اینکه، فرآیند اجرای CAT اتمام داده شد و نمره پایانی فرد، همان برآورد توانایی او به روش بیشینه‌ی درست نمایی قرار داده شد که برابر با شد. در جدول 4-2، برآوردهای و پارامترهای b بعد از هر پاسخ صحیح و غلط به آزمون، برای آزمودنی دومی که برنامه شبیه‌سازی کرده است، نشان داده شده است. این مجموعه از سؤالات با این پارامترهای b، مجموعه‌ای سؤال بهینه برای این آزمودنی در این طرح CAT می‌باشد. پس از این مرحله، چون، در این پژوهش قصد داشتیم که، یک خزانه‌ی p-optimal با ملاک 99% بیشینه‌ی آگاهی طراحی کنیم، که دامنه‌ی متناظر آن در تعریف r-optimal برابر با (0.2-optimal) ‌‌باشد، یعنی، پهنای bin برابر با 2/0 ‌باشد- این مقادیر در اغلب تحقیقات نتایج بهینه‌ای ایجاد کرده است (ریکیسی، 2004، 2005؛ ریکیسی و هی؛ 2004، 2009) و گو (2007)-، پس از اینکه شبیه سازی 20 سؤال برای این آزمودنی به اتمام رسید، مقیاس پارامترهای b ، که در این برنامه بازه‌ی آن از 4- تا 4 تعریف شد، به فواصل 2/0 تقسیم بندی شد، یعنی، مقیاس b به فواصلی با پهناهای 2/0 تقسیم شد. به این دامنه‌ها روی مقیاس “item bins” گفته می‌شود. یعنی، برای هر آزمودنی سؤالاتی که برایش اجرا شد بر اساس مقادیر پارامترهای b در این فواصل قرار گرفت، و تعداد سؤالات مورد نیاز برای او در هر فاصله شمرده شد. توزیع فراوانی سؤالاتی که برای آزمودنی با اجرا شد، در جدول 4-3 و نمودار 4-1 آورده شده است. نتایج نشان می‌دهند که، دو سؤال در دامنه‌ی 2- تا 81/1-، سه سؤال در دامنه‌ی 60/1- تا 41/1- ، 4 سؤال در دامنه‌ی 40/1- تا 21/1- ، هفت سؤال در دامنه‌ی


دیدگاهتان را بنویسید