منابع پایان نامه درمورد در

CAT، که مطالب محدودی در مورد آن وجود دارد، مولفه‌ی خزانه سؤال می‌باشد. با ‌این‌وجود، ویژگی‌های جذاب روان سنجی CAT، در صورتی تحقق می‌یابد که سؤالات آزمونی که برای اجرا به کار می‌روند مناسب باشند. این مجموعه از سؤالات معمولاً خزانه‌ی سؤال نامیده می‌شود (ریکیسی، 2010). یک خزانه‌ی سؤال بهینه باید براساس مولفه‌های دیگر CATیعنی، طول آزمون، توزیع مورد انتظار جامعه‌ی آزمودنی، برآورد توانایی و شیوه‌ی انتخاب سؤال، نرخ‌های همپوشی و مواجهه هدف سؤال تعیین شود (برگستروم و لانز، 1999).
طراحی خزانه‌ی سؤال و ارتباط آن با مولفه‌های CAT
پارشال، دیوی و نرینگ (1998) نشان دادند که سه هدف اغلب متضاد انتخاب سؤال در سنجش انطباقی کامپیوتری وجود دارد. ابتدا، انتخاب سؤال باید دقت اندازه‌گیری را از طریق انتخاب سؤالی که آگاهی را بیشینه کند یا دقت پسین را برای سطح توانایی آزمودنی بیشینه کند، افزایش دهد. دوم، انتخاب سؤال باید از امنیت خزانه‌ی سؤال از طریق محدود کردن میزان مواجهه سؤالات محافظت کند. سوم، انتخاب سؤال باید تضمین کند که آزمودنی‌ها، آزمونی با تعادل محتوایی مناسب دریافت خواهند کرد. استوکینگ و سوآنسون (1998)، هدف چهارمی را به این لیست اضافه کردند؛ هدف چهارم بیان می‌کند که انتخاب سؤال باید همچنین استفاده از سؤال را به حداکثر برساند، تا جایی که همه‌ی سؤالات در خزانه استفاده شوند، بدین وسیله این اطمینان ایجاد می‌شود که صرفه‌جویی مناسبی برای ساخت سؤال صورت گرفته‌است. استوکینگ و لوئیس (2000)، بیان کردند که مسئله‌ی انتخاب سؤال به صورت بادبادکی می‌باشد که به هر طرف آن فشار وارد شود، طرف دیگر آن متورم شود.

خزانه‌ی سؤالی که به‌طور بهینه طراحی شده ‌باشد، به دنبال بهترین سازش بین اهداف متعارض است. خزانه‌ی سؤال باید دارای تعداد کافی از سؤالات با کیفیت بالا باشد تا بتواند چندین هزار خرده آزمون همپوش از سؤالات ایجاد کند. البته این قضیه تا حدودی بر اساس توزیع آزمودنی‌ها و تعداد آزمودنی‌هایی که خزانه‌ی سؤال برای آنها به کار می‌رود، تعیین می‌شود. زمانی که در سنجش انطباقی امنیت سؤال مهم باشد، چنانچه تعداد آزمودنی‌هایی که آزمون روی آنها اجرا می‌شود، زیاد باشد، باید سؤالات بیشتری در خزانه قرار گیرند. شیوه‌ی انتخاب سؤال در سنجش انطباقی به این صورت است که سؤالاتی انتخاب می‌شود که سطح دشواری‌شان تقریباً با برآورد توانایی آزمودنی‌ها مطابقت داشته باشند، بنابراین، این انتظار وجود دارد که سؤالات خزانه داری توزیع دشواری مشابه با توزیع توانایی آزمودنی‌ها باشند. با این ‌وجود بهتر است که خزانه‌ی سؤال، سؤالاتی با دامنه‌ی گسترده‌ای از سطوح دشواری برای جمعیت مورد نظر باشد تا به CAT اجازه دهد سطوح توانایی را برای دامنه‌ی گسترده‌ای از آزمودنی‌ها برآورد کند (یوری ، 1977).
طول آزمون وابستگی بسیار نزدیکی به قاعده‌ی اتمام آزمون در CAT دارد، همچنین نقش مهمی در تعیین تعداد سؤالات مورد نیاز در خزانه‌ی سؤال بازی می‌کند. برای آزمونی با طول ثابت، اگر آزمون‌ها برای افراد طوری تهیه شوند که سؤالات همپوش نداشته باشند، تعداد سؤالات در خزانه باید دقیقاً برابر با تعداد سؤالات در هر فرم ضرب در تعداد آزمودنی‌ها باشد. ولی در واقع، سؤالات می‌توانند با درنظر گرفتن محدودیت‌های امنیتی معین، به‌طور تکراری نیز مورد استفاده قرار گیرند. حتی با سؤالات همپوش، این انتظار وجود دارد که سؤالات بیشتری برای طراحی آزمون CAT وجود دارد، بنابراین سؤالات بیشتری در یک خزانه مورد نیاز است. استوکینگ (1994)، پیشنهاد می‌کند که تعداد سؤالات در خزانه‌ی سؤال باید 12 برابر طول آزمون باشد (استوکینگ، 1994). وایپیشنهاد می‌کند که، برای آزمون‌هایی مانند کسب گواهی‌نامه، اندازه‌ی خزانه‌ی سؤال 6 تا 8 برابر طول آزمون انطباقی باشد (وای، 1998). در صورتی که، طول آزمون در CAT متغیر باشد، معمولاً به سؤالات کمتری برای آزمون‌های مجزا نیاز داریم. در این مورد، تعداد سؤالات مورد نیاز برای یک خزانه‌ی سؤال با توزیع تعداد آزمودنی‌ها در هر سطح توانایی همبستگی دارد (استوکینگ، 1994).
با توجه به الگوهاییکسان سؤال-پاسخ، روش‌های متفاوت برآورد، برآوردهای توانایی اندکی متفاوت ایجاد می‌کند، و به نوبه‌ی خود روی انتخاب بهترین سؤال مناسب تاثیر می‌گذارد. همچنین قواعد متفاوت انتخاب سؤال، از قبیل انتخاب سؤالی که آگاهی را بیشینه کند یا واریانس پسین در برآورد توانایی را کمینه کند، ممکن است سؤالات متفاوتی به‌عنوان مناسب‌ترین سؤال برای آزمودنی انتخاب کند. هر دو موقعیت باعث می‌شود که سؤال متفاوتی استفاده شود و بنابراین سؤالات متفاوتی در خزانه‌ی سؤال بهینه مورد نیاز خواهد داشت (گو و ریکیسی، 2007).
شرایط تعادل محتوایی نیز ترکیب‌های متفاوتی از سؤالات را در یک خزانه‌ی سؤال ایجاد می‌کند. برای مثال، اگر برای طراحی یک آزمون CAT به یک آزمون 40 سؤالی ریاضی نیاز داشته ‌باشیم، یعنی به 20 سؤال استدلال عددی و 20 سؤال حلّ مسئله نیاز باشد. به همین دلیل خزانه‌ی سؤال بهینه باید شامل تعداد مشابهی از سؤالات برای هر دو حوزه‌ی محتوایی باشد. هدف طراح خزانه‌ی سؤال باید این باشد که تعداد کافی سؤال در هر حوزه‌ی محتوایی موردنظر ایجاد کند، تا هر یک از آزمون‌ها را با پوشش محتوایی متعادل شده‌ای را بسازد (گو و ریکیسی، 2007؛ پارشال، اسپری، کالن و دیوی، 2002).
بعلاوه، مراقبت از خزانه‌ی سؤال باید ادامه یابد، تا جایی که مطمئن شویم که خزانه شامل سؤالات مناسبی است که نرخ بیش مواجهه و کم مواجهه را در صورتی‌که دقت آزمون برقرار است، کاهش دهد. سؤالی که زیادتر مورد استفاده قرار می‌گیرد، از نظر امنیتی مشکل ایجاد می‌کند، زیرا بیشتر آزمودنی‌ها سؤال یکسانی را دریافت می‌کنند، و به احتمال زیادی سؤال برای عموم فاش می‌شود. در مقابل سؤالی که کم استفاده می‌شود، به‌طور بالقوه، هزینه‌های طراحی سؤال را افزایش می‌دهد. بنابراین باید تعادلی بین کارایی آزمون و کنترل مواجهه سؤال برقرار شود. به عبارت دیگر سؤالی باید انتخاب شود که دقت و کارایی آزمون را با رعایت محدودیت‌های امنیتی به حداکثر برساند، این کار رمز بهینه‌سازی موفق می‌باشد. خزانه‌ی سؤالی که به‌طور بهینه طراحی شده ‌است باید بتواند همزمان که کنترل مواجهه را برقرار می‌کند، کاهش خیلی کمی در کارایی و دقت برآورد توانایی ایجاد کند(گو و ریکیسی، 2007).
رویکردهای موجود در طراحی خزانه‌ی سؤال
رویکرد اول: رویکرد برنامه‌نویسی ریاضی یا برنامه‌نویسی اعداد صحیح
این رویکرد توسط ولدکمپ و وندر لیندن (2000) برای طراحی خزانه‌ی سؤال ایجاد شده است، این رویکرد از روش برنامه‌نویسی ریاضی برای طراحی خزانه‌ی سؤال استفاده می‌کند. از این رویکرد برای سرهم کردن هم آزمون‌های انطباقی و هم آزمون‌های غیر انطباقی، امّا بهینه استفاده می‌گردد (وندرلیندن، a 2005). این روش جزء روش‌های سرهم کردن بهینه‌ی تست است که تعمیمی از رویکرد برن‌بام می‌باشد. این روش‌ها به طراحان تست اجازه می‌دهد تا مجموعه‌ای از تست‌ها را با توجه به لیستی از ویژگی‌ها و اهداف، از مجموعه‌ی بزرگتر خزانه‌ی سؤال، سرهم کنند. تلاش‌های اولیه این روش به برن‌بام (1968) برمی‌گردد. در اواسط دهه‌ی 1980، روش برن‌بام به عنوان یک مسئله‌ی بهینه‌سازی ترکیبی یا برنامه‎‌نویسی خطی 0-1، تعریف شد. ولی از آنجا که عملیاتی کردن این روش‌ها در آن سال‌ها به دلیل دردسترس نبودن الگوریتم‌ها و نرم‌افزارهای مورد نیاز امکان پذیر نبود، پیشرفت زیادی نکرد. امروزه با پیشرفت نرم افزارهای مخصوص جبر خطی امکان عملیاتی کردن این روش برقرار شده است (وندرلیندن، b 2005). در این رویکرد، CAT از طریق رویکرد تست سایه (STA)، اجرا می‌شود (وندرلیندن، ریس، 1988) یعنی تست از طریق برنامه‌نویسی عدد صحیح خطی دو ارزشی یا برنامه‌نویسی 1-0 سرهم می‌شود. در این رویکرد ویژگی‌های تست بر اساس یک تابع هدف که در ارتباط با مجموعه‌ای از قیود خاص بیشینه می‌شود، محقق می‌گردد (وندرلیندن، b 2005). مزیت این روش این است که ما را قادر می‌کند تا ویژگی‌های پیچیده‌ی آزمون را مدل‌یابی کنیم. برای یک بار قیود آزمون تعیین می‌شود و به قیود عددی تبدیل می‌شود. در این رویکرد ابتدا مسئله‌ی سرهم کردن تست، به عنوان یک مسئله‌ی بهینه‌سازی ریاضی با استفاده از متغیرهای تصمیم فرمول‌بندی می‌شوند. بنابراین در این رویکرد، ویژگی‌ها یا صفات تست، مهمترین اصل در فرمول‌بندی تست است. سپس، بر اساس قیود و اهداف معینی، تست سرهم می‌شود (وندرلیندن b 2005).
استفاده از روش برنامه‌نویسی خطی با کار بوکویی-تمینگا(1987) آغاز شد. بوکویی-تیمینگا (1991)، از روش برنامه‌نویسی اعداد صحیح برای محاسبه‌ی تعداد سؤالات مورد نیاز برای فرم‌هایی از آزمون که می‌خواهد در آینده مورد استفاده قرار گیرد، استفاده کرد. و از یک رویکرد متوالی که تابع آگاهی آزمون (TIF) را بر اساس مدل لوجستیک یک پارامتری (مدل راش) به‌ حداکثر می‌رساند، استفاده ‌کرد. نتایج او برای اصلاح ترکیب یک بانک سؤال موجود به‌کار رفت. سپس، به طور دقیق‌تری آریل، ولدکمپ و وندر لیندن (1998)، روش‌های ساخت خزانه‌ی سؤال چرخشی که بعضی از آنها بر مبنای هدف طراحی با روش برنامه‌نویسی قرار گرفتند را توسعه دادند. ولدکمپ و وندرلیندن (1999)، پنچ گام برای طراحی یک طرح بهینه برای خزانه‌ی سؤال CAT با روش برنامه‌نویسی ریاضی یا خطی توصیف کردند:
مجموعه‌ای از ویژگی‌های آزمون CAT تحلیل می‌شود و همه‌ی صفات سؤال به همراه ویژگی‌های محتوایی و آماری شان تعیین می‌شود.
با در نظرگرفتن ویژگی‌های سؤالات، مدل برنامه‌نویسی اعداد صحیح برای سرهم کردن تست‌های سایه در شبیه‌سازی CAT فرمول‌بندی می‌شوند.
جامعه‌ی آزمودنی‌ها تعیین می‌شود و برای مثال بر اساس داده‌های گذشته، برآورد توزیع توانایی‌شان مشخص می‌شود.
شبیه‌سازی CAT با استفاده از مدل برنامه‌نویسی اعداد صحیح برای تست‌های سایه و محرک‌های نمونه‌گیری شده از توزیع توانایی، انجام ‌می‌گیرد. فراوانی سؤالات از تعداد دفعاتی که سؤالات از خانه‌های جدول طبقه‌بندی شده استفاده می‌شوند، بدست می‌آید.
طرح نهایی از این فراوانی‌ها بدست می‌آید. تنظیم این فراوانی‌ها، الگوی بهینه‌ی نرخ مواجهه‌ی سؤال را ایجاد می‌کند.
وندرلیندن، b 2005، مجموعه‌ی این صفات، قیود و اهداف را طبقه‌بندی و معرفی کرد.
طبقه‌‌بندی صفات
در طبقه‌بندی صفات سؤال یا آزمون، دو طبقه ارائه می‌شود. نوع صفات و سطح صفات. تشخیص و تعیین درست نوع و سطح یک صفت با اهمیت است، زیرا به طراح کمک می‌کند تا تست را به دقت مدل‌یابی کند.
الف).نوع صفت یا خصیصه
انواع صفات عبارتند از:
صفات کمّی: نمونه‌هایی از صفات کمّی عبارتند از؛ تعداد کلمات، زمان‌های مورد انتظار پاسخ، فراوانی استفاده از محرک‌ها یا سؤالات قبلی، اعتبار، آماره‌هایی از قبیل مقادیر p سؤال، آگاهی سؤال و شاخص‌های DIF سؤالات. ویژگی مشترک همه‌ی صفات کمّی این است که، این صفات مقادیر عددی به خود اختصاص می‌دهند. این مقادیر می‌توانند عدد حقیقی (برای مثال، زمان پاسخ و آگاهی سؤال) یا عدد صحیح (تعداد کلمات) باشند. نوع اعداد، نقش زیادی در فرمول‌بندی یک صفت کمّی ندارد.
صفات طبقه‌ای: نمونه‎هایی از صفات طبقه‌ای عبارتند از؛ طبقه یا حوزه‌ی محتوایی، چهارچوب و فورمت پاسخ، سطح شناختی (دانش، به‌کاربستن و …)، استفاده از اطلاعات کمکی برای پاسخ به سؤال (نمودار، جدول)، عملیات ذهنی مورد نیاز برای حلّ یک سؤال و نویسنده یا طراح سؤال. ویژگی مشترک همه‌ی صفات طبقه‌ای این است که، این صفات خزانه‌ی سؤال را به زیرمجموعه‌هایی از سؤالات با صفات یکسان تقسیم‌بندی می‌کنند. برای مثال، مجموعه‌ی سؤالات در زمینه‌ی زیست شناختی، یا مجموعه‌ای که در بردارنده‌ی سؤالات چهارگزینه‎ای است.

 

اینجا فقط تکه های از پایان نامه به صورت رندم (تصادفی) درج می شود که هنگام انتقال از فایل ورد ممکن است باعث به هم ریختگی شود و یا عکس ها ، نمودار ها و جداول درج نشوند.

برای دانلود متن کامل پایان نامه ، مقاله ، تحقیق ، پروژه ، پروپوزال ،سمینار مقطع کارشناسی ، ارشد و دکتری در موضوعات مختلف با فرمت ورد می توانید به سایت  77u.ir  مراجعه نمایید

رشته روانشناسی و علوم تربیتی همه موضوعات و گرایش ها :روانشناسی بالینی ، تربیتی ، صنعتی سازمانی ،آموزش‌ و پرورش‌، کودکاناستثنائی‌،روانسنجی، تکنولوژی آموزشی ، مدیریت آموزشی ، برنامه ریزی درسی ، زیست روانشناسی ، روانشناسی رشد

در این سایت مجموعه بسیار بزرگی از مقالات و پایان نامه ها با منابع و ماخذ کامل درج شده که قسمتی از آنها به صورت رایگان و بقیه برای فروش و دانلود درج شده اند

صفت منطقی: این صفات از صفات کمّی و طبقه‌ای متفاوت هستند. زیرا آنها صفات یک سؤال را نشان نمی‌دهند، بلکه خصیصه‌های جفتی، سه‌تایی و غیره‌ی سؤالات می‌باشند. خصایص منطقی شامل روابط ورود و خروج بین سؤالات می‌باشند. نمونه‌هایی از روابط خروج مواقعی پیش می‌آید که دو یا سه سؤال نتوانند همزمان با یکدیگر در یک آزمون قرار گیرند، به دلیل اینکه، یک سؤال راهنمای حلّ سؤال یا سؤالات دیگر می‌باشد، به این سؤالات دشمن یا متضاد می‌گویند. روابط ورود زمانی مطرح می‌شود که سؤالات به مجموعه‌ای یکسانی از محرک‌ها تعلق داشته باشند، به طوری‌که انتخاب یک سؤال، انتخاب سؤال دیگری را نیز در پی داشته‌باشد.
ب). سطح صفات
مجموعه‌ی صفات در سطوح زیر قرار می‌گیرند. البته سطح صفت در ارتباط با نوع صفت، تفسیر خواهد شد.
سطح سؤال: نمونه‌های آن شامل، میزان آگاهی سؤال، تعداد کلمات و سطح شناختی سؤال و … می‌باشد. ترکیب چند صفت از سؤالات، صفات سطح بالاتر را تشکیل می‌دهند.
سطح محرک: زمانی که خزانه‌ی سؤال شامل مجموعه‌ای از سؤالاتی است که در مورد یک محرک مشترک باشند، این سطح مطرح می‌شود.
سطح مجموعه‌ای از سؤالات: صفات در این سطح، اغلب ترکیبی از صفات تک تک سؤالات می‌باشند.
سطح تست: نمونه‌هایی از صفات تست، عبارتند از؛ طول تست، TIF، ضریب اعتبار کلاسیک، توزیع محتوای سؤال، تعداد کل کلمات و غیره. صفات در این سطح همیشه کمّی هستند و ترکیبی از صفات سطوح پایین‌تر می‌باشند.
سطح تست‌ها چندگانه: زمانی‌که مسئله شامل سرهم کردن، مجموعه‌ای از تست‌ها باشد، به این سطح می‌رسیم. در این سطح به صفات اضافی برای نتایج کلی نیاز داریم. مانند، میزان سؤالات همپوش در تست‌ها، درجه‌ی موازی بودن تست‌ها و غیره.
قیود و اهداف
وندرلیندن، 2005 بیان کرد که، علی‌رغم این‌که هریک از صفات آزمون تفاوت‌های ظاهراً زیادی با یکدیگر دارند، امّا، هر یک شرایط یکسانی را بیان می‌کنند. در صورتی‌که این صفات به شکل ساده، مختصر و کامل نوشته شوند، چهارچوب اساسی از یک قید یا یک هدف برای آن صفت برقرار می‌شود. او بیان کرد که:
صفت در یک تست، درصورتی یک قید است که یک حدّ بالا یا پایین داشته باشد.
صفت در یک تست، درصورتی یک هدف است که مقدار بیشینه یا کمینه داشته باشد.
درصورتی‌که، قیود به صورت برابری یا نابرابری ریاضی مدل‌یابی می‌شوند، اهداف به صورت توابع ریاضی مدیابی می‌شوند. قیود و اهداف همیشه به همراه نوع و سطح صفتی که آنها را نشان می‌دهد، بیان می‌شوند. در کل، فرآیند مدل‌یابی کردن مسئله‌ی سرهم کردن تست بر اساس چهار گام صورت می‌گیرد:
گام اول: تعیین متغیرهای تصمیم
گام دوم: مدل‌یابی کردن قیود
گام سوم: مدل‌یابی کردن هدف یا اهداف

گام چهارم: حلّ کردن مدل برای یک راه حل بهینه.
در این‌گونه مطالعات گام اول بسیار چالش برانگیز است. در مسائل سرهم کردن تست‌ها، به تعداد سؤالات موجود در خزانه، متغیر تصمیم

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *