دانلود پایان نامه

آزمون‌های CAT باشد؟
تعاریف نظری و عملیاتی پژوهش
خزانه‌ی سؤال
تعریف نظری: خزانه سؤال، مجموعه‌ی بزرگی از سؤالات می‌باشد که برای اندازه‌گیری حوزه‌ای از دانش، توانایی، انگیزش، شخصیت و غیره ساخته شده است، این مجموعه اغلب در سیستم ذخیره‌سازی کامپیوتری همراه با مجموعه‌ای از ویژگی‌های سؤال و مشخصات محتوایی و آماری، ذخیره می‌شود ( ریکیسی، 2010).
همچنین، خزانه سؤال اغلب با نام های ازقبیل “بانک‌های سؤال” ، “بانک‌های پرسش”، “مجموعه‌های سؤال”، “مخزن‌های سؤال” و “کتابخانه‌های سؤال” به کار می‌روند. اگرچه می‌توان میان بعضی از این اصطلاحات تمایز ایجاد کرد، امّا همه آنها به “مجموعه‌ی نسبتاً بزرگی از پرسش‌های در دسترس در آزمون” اشاره می‌کنند (میلمن و آرتر، 1984). خزانه سئوال، سیستم سنجشی است که در آن، سئوالات آزمون گردآوری، سازمان‌دهی و فهرست‌بندی می‌شوند. سپس محتوای هر سئوال آزمون و ویژگی‌های روان‌سنجی آن، بررسی و در یک سیستم پایگاه داده ثبت می‌شوند (چاپین، 1981).
تعریف عملیاتی: در این پژوهش از دو خزانه‌ی سؤال استفاده می‌کنیم:
خزانه‌ی سؤال عملیاتی واقعی آزمون ریاضی: این خزانه به منظور سنجش میزان پیشرفت ریاضی دانش‌آموزان مقطع پیش دانشگاهی که خود را برای کنکور سراسری آماده می‌کنند، ساخته می‌شود. این خزانه شامل 921 سؤال می‌باشد که توسط 15 طراح که از متخصصان موضوعی قوی در این حوزه هستند، طراحی می‌شود. ویژگی‌های روان‌سنجی غیر آماری این سؤالات توسط 3 متخصص روان‌سنجی که به حوزه ریاضی نیز آشنایی دارند، مورد بررسی قرار می‌گیرد. در پایان برای بررسی ویژگی‌های روان‌سنجی و آماری سؤالات از نمونه‌ای 500 نفری استفاده می‌شود و در پایگاه داده‌ی MYSQL ذخیره می‌شود.

خزانه‌ی سؤال بهینه‌ی شبیه‌سازی شده: این خزانه بر اساس ویژگی‌های جامعه‌ی مورد نظر، و استفاده از رویکردهای اکتشافی و برنامه‌نویسی ریاضی، به صورت مجازی و از طریق شبیه سازی کامپیوتری ساخته می‌شود. این خزانه به همراه تمام ویژگی‌های سؤالاتش در پایگاه داده MATLAB ایجاد و ذخیره سازی می‌شود.
سنجش انطباقی کامپیوتری (CAT)
تعریف نظری: شیوه‌ای از اجرای آزمون است که با سطح توانایی آزمودنی انطباق دارد، آزمودنی‌های متفاوت، سؤالات متفاوتی را دریافت می‌کنند. هدف عمده ی آن، برازش سطح توانایی هر آزمودنی با سطح دشواری سؤالات اجرایی از طریق انتخاب بهینه‌ی سؤالات از یک خزانه سؤال به صورت سلسله مراتبی می‌باشد (ون‌در‌لیندن، 1996). همچنین CAT شیوه‌ای از سنجش می‌باشد که می‌تواند دقت بیشتری برای تعیین طول آزمون ایجاد کند و یا بدون از دست دادن دقت آزمون، طول آن را کاهش دهد (ریکیسی، 2010).
تعریف عملیاتی: در پژوهش حاضر از دو شیوه‌ی سنجش انطباقی کامپیوتری (CAT) استفاده می‌شود:
سنجش انطباقی کامپیوتری (CAT) عملیاتی واقعی: در این پژوهش برنامه‌ی عملیاتی آزمون ریاضی CAT به زبان PHP نوشته می‌شود و مخزن سؤالات در پایگاه داده‌ی MYSQL ذخیره‌سازی می‌شود.
سنجش انطباقی کامپیوتری (CAT) شبیه‌سازی شده: برنامه‌ی شبیه‌سازی شده‌ی CAT با تمام مولفه‌های اجرایی که در آزمون عملیاتی وارد شده است، در نرم افزار MATLAB ایجاد و شبیه‌سازی می‌شود.
خزانه‌ی سؤال بهینه
تعریف نظری: خزانه سؤال هنگامی بهینه است که الگوریتم انتخاب سؤال به گونه‌ای باشد که استفاده از سؤال را بیشینه کند، به طوری‌که همه سؤالات در خزانه استفاده شوند. و بدین ترتیب، مطمئن می‌شویم که از لحاظ اقتصادی صرفه‌جویی مناسبی برای طراحی سؤال صورت گرفته‌ است (استوکینگ و سوآن‌سون، 1998). همچنین، خزانه سؤال بهینه خزانه‌ای است که، هر وقت الگوریتم انتخاب سؤال CAT، سؤالی را برای اجرا جستجو می‌کند، دقیقاً همان سؤالی که مورد نظر و مطلوب ما می‌باشد، در خزانه سؤال موجود باشد. حال اگر هر زمانی‌که الگوریتم انتخاب سؤال، سؤالی را انتخاب می‌کند، سؤال مطلوبی دردسترس باشد، خزانه سؤال بهینه خواهد بود (ریکیسی، 2010).
تعریف عملیاتی: در پژوهش حاضر خزانه سؤال بهینه از طریق رویکرد اکتشافی (“bin-and-union”) و مدل حداقل مجذورات (WDM) در برنامه‌ی MATLAB شبیه‌سازی می‌شود و ویژگی‌ها و پارامترهای سؤالات در پایگاه اطلاعات آن ذخیره می‌شود. همچنین، کلیه مولفه‌های تأثیر‌گذار بر نحوه‌ی عملکرد خزانه نیز در همین برنامه بررسی و وارد می‌شود.
نرخ مواجهه سؤال
تعریف نظری: نرخ مواجهه برای یک سؤال عبارت است از: تعداد دفعات اجرای یک سؤال تقسیم بر تعداد آزمودنی‌ها (گو و ریکیسی، 2007).
به‌عبارت دیگر، نرخ ارائه‌ی یک سؤال می‌تواند، به‌عنوان نسبت تعداد مشاهده ‌شده‌ی اجراهای یک سؤال بر تعداد کل آزمودنی‌ها تعریف شود. سطح متعادل ارائه‌ی یک سؤال به‌طور کلی مطلوب در‌نظر‌گرفته‌ می‌شود. نرخ بالای ارائه‌ی یک سؤال باعث افزایش خطر آشنایی آزمودنی‌های آینده با سؤال می‌شود. و بدین وسیله هم امنیت آزمون و هم اعتبار آن را با تهدید مواجهه می‌کند. بنابراین درصد سؤالات بیش ارائه شده به عنوان ملاک با اهمیتی برای ارزیابی موفقیت یک برنامه‌ی CAT باید محاسبه شود. ارزش بحرانی که به‌طور معمول برای ارزیابی ارائه‌ی بیش از حد سؤال، استفاده می‌شود، مقدار 2/0 می‌باشد (هاو و چانک، 2001)، البته در بسیاری از پژوهش‌ها در مورد سؤالاتی با درجه‌ی دشواری بالا، برابر با 33/0 است (گو و ریکیسی، 2007).
تعریف عملیاتی: در پژوهش حاضر مواجهه سؤال به روش سیمپسون- هتر با “نرخ مواجهه هدف” برابر با کنترل می‌شود.

 

مطلب مرتبط :   تحقیق رایگان درمورد روابط اجتماعی

اینجا فقط تکه های از پایان نامه به صورت رندم (تصادفی) درج می شود که هنگام انتقال از فایل ورد ممکن است باعث به هم ریختگی شود و یا عکس ها ، نمودار ها و جداول درج نشوند.

برای دانلود متن کامل پایان نامه ، مقاله ، تحقیق ، پروژه ، پروپوزال ،سمینار مقطع کارشناسی ، ارشد و دکتری در موضوعات مختلف با فرمت ورد می توانید به سایت  77u.ir  مراجعه نمایید

رشته روانشناسی و علوم تربیتی همه موضوعات و گرایش ها :روانشناسی بالینی ، تربیتی ، صنعتی سازمانی ،آموزش‌ و پرورش‌، کودکاناستثنائی‌،روانسنجی، تکنولوژی آموزشی ، مدیریت آموزشی ، برنامه ریزی درسی ، زیست روانشناسی ، روانشناسی رشد

در این سایت مجموعه بسیار بزرگی از مقالات و پایان نامه ها با منابع و ماخذ کامل درج شده که قسمتی از آنها به صورت رایگان و بقیه برای فروش و دانلود درج شده اند

نرخ همپوشی سؤال
نرخ همپوشی سؤال که گاهی اوقات نرخ همپوشی آزمون نیز نامیده می‌شود، به عنوان تعداد سؤالات مشترکی که توسط دو آزمودنی‌ – که به‌طور تصادفی انتخاب شده‌اند- پاسخ داده ‌می‌شوند، تقسیم بر طول آزمون، تعریف می‌شود. معادله (1-1) نحوه‌ی محاسبه‌ی میانگین همپوشی سؤال را نشان می‌دهد:
(1-1)
مقدار T ، تعداد کل سؤالاتی است که توسط جفت از N آزمودنی در آزمون، مشترک است. ، تعداد جفت‌هایی از آزمون میان N آزمودنی است. تعداد کل سؤالات اجرا شده برای N آزمودنی است (ریکیسی، 2009).
درصد ارائه‌ی کمتر از حد سؤالات

نرخ پایین ارائه‌ی سؤال به این معناست که یک سؤال بندرت استفاده شود. خزانه‌ی سؤالی با تعداد بسیار زیادی سؤالی که با نرخ پایینی مواجهه می‌شود ، نشانه‌ای از استفاده کم از خزانه می‌باشد. از این‌رو هم به‌صرفه بودن طراحی سؤال و هم مناسب بودن روش انتخاب سؤال، با نرخ پایین مواجهه به چالش کشیده می‌شود. در اکثر مطالعات، سؤالی با نرخ مواجهه‌ی پایین‌تر از 02/0 به عنوان سؤالی با ارائه‌ی کمتر از حد، درنظر گرفته‌می‌شود (ریکیسی، 2009).
تعریف عملیاتی: در پژوهش حاضر نیز نرخ مواجهه‌ی پایین‌تر از 02/0 به عنوان سؤالی با ارائه‌ی کمتر از حد، درنظر گرفته‌می‌شود.
روش r-optimal در طراحی خزانه‌ی سؤال در روش اکتشافی برای تعیین اندازه‌ی خزانه
از آنجا که، فرض بر این است که سؤالات در سنجش انطباقی باید به گونه‌ای طراحی ‌شوند که با برآورد توانایی آزمودنی مطابقت کامل داشته باشند، بنابراین، ویژگی‌های CAT تنها در صورتی مطابق انتظار عمل می‌کند که دارای خزانه‌ی سؤال بزرگی باشد که حاوی تعداد کافی سؤالات برای دامنه مورد نظر توانایی باشد، در کاربردهای عملی ساخت این‌گونه خزانه‌ها غیر ممکن می‌شود. از ‌این‌رو روش p-optimal برای رفع این مشکل توسط ریکیسی به وجود آمد. ایده‌ی این روش این است که، همیشه نیاز نیست که سؤال ویژه‌ای که کاملاً با برآورد اخیر توانایی آزمودنی مطابقت دارد، در خزانه وجود داشته باشد، بلکه اگر تنها دارای حداقل نسبت- p (p-Proportion) باشد نیز برای بدست آوردن بیشینه درست نمایی برآورد توانایی کافی است. این روش این امکان را به محقق می دهد که خزانه‌ی سؤالی با اندازه معقول ایجاد کند تا ویژگی‌های CAT را محقق سازد ( ریکیسی، 2007).
روش r-optimal در طراحی خزانه‌ی سؤال در روش اکتشافی برای تعیین اندازه‌ی خزانه
از آنجا که مقیاس متریک و مقیاس پارامتر- b یکسان می‌باشد، پس تبدیل حداقل نسبت P به پهنای دامنه (Range) روی مقیاس متریک کاربرد این روش را آسان‌تر می کند (ریکیسی، 2010).
تعریف عملیاتی: در این پژوهش برای تعیین تعداد سؤالات مورد نیاز برای خزانه‌ی سؤال، از این شیوه استفاده می‌شود. به این صورت که حداقل مقدار p-optimal برابر با 96% و دامنه‌ی مربوط به آن برابر با 4/0 می‌باشد، که به آن پهنای bin گفته می‌شود. البته به منظور اهداف مقایسه‌ای، انتخاب مقادیر دیگری از p و r نیز در این پژوهش انجام می‌گیرد.
فصل دوم
مبانی نظری پژوهش
مبانی نظری پژوهش
این فصل از سه قسمت تشکیل شده ‌است. در قسمت اول سنجش انطباقی کامپیوتری (CAT) و اجزای تشکیل دهنده‌ی و نحوه‌ی کارکرد آن توصیف می‌شود. در قسمت دوم مولفه‌های تعیین‌کننده و مهم در طراحی الگوریتم اجرایی CAT که بر طراحی خزانه‌ی سؤال نیز تأثیرگذارند، به صورت مجزا مورد بررسی قرار می‌گیرد. در قسمت سوم خزانه‌ی سؤال، مدل‌های مختلف طراحی خزانه‌ی سؤال بهینه و ملاک‌های ارزیابی خزانه‌ی سؤال شرح داده ‌می‌شود.
مقدمه
خزانه‌ی سؤال نقش مهمی در سنجش انطباقی (CAT) بازی می‌کند. سؤالات در خزانه فهرست‌بندی و ساختار‌بندی می‌شوند، یا به‌عبارت دیگر، به هر یک از سؤالات اطلاعاتی نسبت داده می‌شود که انتخاب آنها را برای آزمون آسان می‌کند. خزانه‌های سؤال به “مجموعه‌ی نسبتاً بزرگی از پرسش‌های در دسترس در آزمون” اشاره می‌کند (میلمن و آرتر، 1984).
دو نوع خزانه‌ی سؤال در برنامه‌های سنجش انطباقی از هم متمایز می‌شوند. یکی از آنها خزانه‌ی اصلی نامیده می‌شود، که شامل سؤالاتی است که ممکن است برای آزمون مورد استفاده قرار گیرد. نوع دیگر خزانه‌ی سؤال عملیاتی می باشد که زیر مجموعه‌ی کوچکتری از خزانه‌ی اصلی است، و طوری طراحی می‌شود که به اندازه کافی کوچک باشد، به شکلی که کامپیوتر به آسانی بتواند سؤالات را بازیابی کند و هر زمان که لازم است مواجهه سؤال را به حداقل برساند، و در عین حال به اندازه کافی بزرگ باشد، به طوری‌که سؤالاتی با ویژگی‌های مورد نیاز را فراهم کند. به دلیل ماهیت پیوسته‌ای که بسیاری از آزمون‌های سنجش انطباقی در اجرا دارند، دوره‌ی مفید یک خزانه‌ی سؤال عملیاتی می تواند محدود باشد. و بعد از تعداد مشخصی استفاده باید کنار گذاشته شوند و به خزانه‌ی اصلی برگردانده شوند. البته تعدادی از سؤالات می توانند بعد از گذشت دوره‌ی زمانی معقولانه‌ای دوباره استفاده‌‌شوند(گو و ریکیسی، 2007).
ویژگی انطباقی CAT استفاده از فرم‌های از پیش طراحی شده‌ی آزمون (مانند آزمون‌های مداد-کاغذی) را غیرضروری می‌کند. این درصورتی است که، CAT به خزانه‌ی سؤالی نیاز دارد که از آن همه‌ی آزمون‌ها استخراج شود. یک خزانه‌ی سؤال نه تنها مخزنی از سؤالات می‌باشد، بلکه مجموعه‌ی سازمان‌یافته‌ای از سؤالات با صفاتی که برای هر یک مشخص شده می‌باشد. به عبارت دیگر، سنجش انطباقی کامپیوتری به خزانه‌ی سؤالی نیاز دارد که به‌خوبی طراحی شده باشد و شامل تعداد مناسبی از سؤالات برای ساخت آزمون‌های مجزایی که با سطوح توانایی آزمودنی‌ها مطابقت دارد، باشد. یک خزانه‌ی سؤال بهینه باید شامل سؤالاتی باشد که از لحاظ محتوایی تعادل داشته ‌باشند و هزینه‌ی ساخت سؤال را کاهش دهد ( گو و ریکیسی، 2007؛ ریکیسی، 2010).
سؤالی که اغلب در طول طراحی خزانه‌ی سؤال پرسیده می‌شود این است که، “چه تعداد سؤال باید در خزانه وجود داشته باشد؟”. به‌طور ایده آل هر چه سؤالات بیشتر باشد، بهتر است، زیرا به ما این اجازه را می‌دهد که انتخاب بیشتری در سرهم کردن آزمون‌ها داشته باشیم و بندرت سؤالات یکسانی در آزمون‌ها تکرار شود و امنیت آزمون حفظ شود. در مواقعی که آزمون‌دهندگان به خزانه‌ی سؤال دست پیدا می‌کنند، اگر خزانه‌ بزرگ باشد، برای آزمودنی‌ها دشوار است که پاسخ سؤالات را حفظ کنند. همچنین، خزانه‌های بزرگتر دارای سؤالاتی می‌باشند که از لحاظ محتوا، فورمت سؤال و ملاحظات آماری با آزمون مورد نظر تطابق بیشتری دارند (میلمن و آرتر، 1984). البته خزانه‌های بزرگ خطرهایی دارند که عبارتند از اینکه، سؤالاتی که به خزانه اضافه می‌شوند باید خوب نوشته ‌شوند، از لحاظ محتوایی معتبر باشند، و از لحاط آماری نیز مناسب باشند (لیناکر، 1987). همچنین تعداد سؤالات نباید خیلی زیاد باشد بلکه باید به اندازه‌ای باشد که قابل کنترل باشد و به‌راحتی بازیافتنی باشد (گو و ریکیسی، 2007).
سنجش انطباقی کامپیوتری
سنجش انطباقی چیست؟
سنجش انطباق کامپیوتری (CAT)، جایگزین قدرتمندتری برای مجموعه‌ای از کاربردهای سنجش انطباقی موفقیت‌آمیزی است که با کار بینه در سال 1905 شروع شد. سنجش انطباقی در تعریف ساده، شامل سؤالاتی است که از یک مجموعه سؤال، که اصولاً به این مجموعه بانک یا خزانه‌ی سؤال می‌گویند، انتخاب می‌شوند، به‌طوری‌که با سطح توانایی برآورد‌شده‌ی (یا سطح استعداد برآورد‌شده‌ی) آزمودنی مورد نظر مطابقت داشته ‌باشند. اگر آزمودنی در پاسخ به سؤالی موفق شود و به آن پاسخ صحیح دهد، سؤالی که در مرحله‌ی بعدی به او ارائه می‌شود، اندکی دشوارتر خواهد ‌بود و بالعکس. به‌طور کلی، در سنجش انطباقی کامپیوتری (CAT)، سؤالات به طور مجزایی برای هر یک از آزمودنی‌ها انتخاب می‌شوند، به‌طوری‌که، هر سؤال بر اساس پاسخ به سؤال قبلی انتخاب می‌شود. هدف این نوع از سنجش این است که، برآورد صحیح و دقیقی از مهارت آزمودنی روی مقیاس زیربنایی مهارت بدست آید. تعداد سؤالات، نوع سؤالات و ترتیب ارائه‌ی آن‌ها از آزمودنی به آزمودنی دیگر متفاوت است (پارشال، اسپری، کالن و دیوی، 2002). معمولاً در این تکنیک به‌سرعت مجموعه‌ای از سؤالات تنظیم می‌شود، به‌طوری‌که با سطح توانایی آزمودنی همگرا باشد. زمانی‌که برآورد توانایی آزمودنی به دقت مورد نظر برسد، آزمون متوقف می‌شود. در این شیوه، در صورتی‌که آزمودنی بخواهد، می‌تواند فوراً از نتایج آزمون مطلع شود. همچنین، سنجش مقدماتی سؤالات جدید بانک سؤال و اعتباریابی کیفیت سؤالات جدید، می‌تواند به‌طور‌ همزمان با اجرای آزمون انجام ‌گیرد، البته مسئله‌ی اضافه کردن سؤالات جدید به خزانه و مدرج کردن دوباره‌ی آنها امری مهم است که در پژوهش لیناکر(1987) بررسی شده است. مزایای CAT به‌طور‌خلاصه شامل موارد زیر است؛ سنجش سریعتر، طرح‌های سنجشی انعطاف‌پذیر، افزایش امنیت آزمون، کنترل بهتر مواجهه سؤال، تعادل بهتر سطوح محتوایی آزمون برای همه‌ی سطوح توانایی، بروز رسانی سریعتر سؤالات آزمون، گزارش سریعتر، تجربه‌ی بهتر یک آزمون برای آزمودنی‌ها. همچنین مشکلات CAT، عبارتند از؛ تجهیزات و امکانات پرهزینه، محدودیت‌های نرم‌افزار‌های رایج اجرای CAT، ناآشنایی بسیاری از آزمودنی‌ها با محیط کامپیوتر، عدم برابری مشهود


دیدگاهتان را بنویسید