نظریه سؤال پاسخ که برای مدرج‌سازی سؤالات به‌کار‌می‌رود، خزانه سؤال مدرج شده، الگوریتم انتخاب سؤال، روش آماری برای جایابی آزمودنی بر روی صفت مکنون توانایی یا برآورد توانایی آزمودنی‌ها، و قواعدی برای اتمام آزمون (واینر، دورانز، ایگنور، فلاگر، گرین، میسلوی، استنبرگ و تیسن، 2000). اخیراً که روش‌های CAT، برای سنجش‌های سرنوشت ساز، فراوان به کار می‌رود، مولفه‌های تعادل محتوایی (چنگ و چانگ، 2009) و قواعد امنیتی مانند کنترل مواجهه سؤال (سیمپسون و هتر، 1985) از اهمیت بسزایی برخوردار ‌شدند. یکی از مولفه‌های جالب توجه مرتبط به CAT، که مطالب محدودی در مورد آن وجود دارد، مؤلفه‌ی خزانه سؤال می‌باشد. با‌ این‌وجود، ویژگی‌های جذاب روان‌سنجی CAT، در صورتی تحقق می‌یابد که سؤالات آزمونی که برای اجرا به‌کار می‌روند مناسب باشند. این مجموعه از سؤالات معمولاً خزانه‌ی سؤال نامیده می‌شود (ریکیسی، 2010).

بیان مسئله
کیفیت خزانه‌ی سؤال، به عنوان یک عامل مهم به منظور افزایش کیفیت اندازه گیری در سنجش انطباقی کامپیوتری (CAT)، در نظر گرفته ‌شده است (فلاگر، 2000؛ جنسما، 1977؛ مک‌برید و وایس، 1976؛ ریکیسی، 1976؛ 2003؛ وندر لیندن، ادلاید آریل و ولدکمپ، 2006؛ ولدکمپ و وندر لیندن، 2000؛ اکسینگ و همبلتون، 2004). حتی در همان اوایل دهه‌ی 1970 – آغاز پژوهش‌های مرتبط با CAT- محققان به‌طور ضمنی و یا به صراحت اذعان داشتند که ویژگی‌های خزانه‌ی سؤال نقش مهمی در دستیابی به بهترین نتایج ممکن در سنجش انطباقی، خواهد داشت ( مک‌برید و وایس، 1976). با این وجود، دستورالعمل‌های اندکی در مورد چگونگی ساخت خزانه‌های سؤال با کیفیت بالا، ایجاد شده است (هی، ریکیسی، 2010؛ هی و ریکیسی، 2011).
آنچه مسلم است، این است که افزایش کیفیت خزانه‌ی سؤال، نحوه‌ی عملکرد الگوریتم‌های سنجش انطباقی را بهبود می‌بخشد. بهترین و حتی جذاب‌ترین برنامه‌های سنجش انطباقی، اگر بر اساس خزانه‌ی سؤالات محدود و سؤالاتی که کیفیت ضعیفی دارند، بنا شود، مطلوب نخواهند بود (فلاگر،2000، به نقل از واینر و همکاران). برای محقق کردن بسیاری از ویژگی‌های اندازه‌گیری سنجش انطباقی، خزانه سؤالی که سؤالات از آن انتخاب می‌شوند، باید شامل سؤالاتی با کیفیت بالا برای سطوح متفاوت مهارت باشد. برخلاف آزمون‌های سنتی مداد-کاغذی، که انتخاب سؤالات به نوعی است که بهترین سنجش را برای آزمودنی‌هایی با توانایی متوسط فراهم می‌کند، سنجش انطباقی می‌تواند دامنه‌ی گسترده‌ای از توانایی را پوشش دهد، از این‌رو به سؤالاتی با کیفیت بالا برای دامنه گسترده‌ای از توانایی نیاز است. به همین دلیل برای ایجاد خزانه‌های سؤال در سنجش انطباقی باید به مفروضه‌های مدل روان سنجی‌ای که زیربنای مدرج‌سازی، اجرا و نمره‌گذاری است، توجه شود. بنابراین تلاش مورد نیاز برای نوشتن خزانه‌ی سؤالات در سنجش انطباقی بسیار بیشتر از آزمون‌های مداد-کاغذی است (میلمن و آرتر، 1984). در آزمون‌های مداد-کاغذی برای طراحی خزانه‌ی سؤال مناسب، طراحان سؤال هنوز ابزار قدرتمندی برای ساخت سؤالاتی با کیفیت بالا محسوب می‌شوند (واینر، دورانس، ایگنور، فلاگر، گرین، میسلوی، استنبرگ و تیسن، 1990). در صورتی‌که، سنجش انطباقی کامپیوتری، به خزانه‌ی سؤالی نیاز دارد که خوب طراحی شده‌ باشد، و شامل تعداد مناسبی از سؤالاتی باشد که از آن طریق بتوان آزمون‌های مجزایی برای هریک از سطوح توانایی آزمودنی‌ها ساخت. یک خزانه سؤال بهینه باید همچنین شامل سؤالاتی با تعادل محتوایی مناسب، که به استفاده بهینه‌ای از سؤال منجر شود و هزینه‌ی ایجاد سؤال را کاهش دهد، باشد (گو و ریکیسی، 2007). بنابر تعریف ریکیسی (2010)، زمانی بهترین خزانه سؤال ممکن یا خزانه سؤال بهینه را خواهیم‌داشت که هر زمان الگوریتم انتخاب سؤال CAT، سؤالی را برای اجرا جستجو می‌کند، دقیقاً همان سؤالی که مطلوب و مورد نظر است، در خزانه سؤال موجود باشد. بدین ترتیب، اگر در هر بار انتخاب سؤال، همیشه بتوان به سؤال مطلوبی دست یافت، خزانه‌ی سؤال بهینه خواهد بود (ریکیسی، 2010).

توجه به چندین عامل مهم که با طراحی خزانه سؤال و CAT مرتبط هستند ضرورت دارد. خزانه سؤال بهینه باید بر اساس مولفه‌های دیگر CAT، یعنی طول آزمون، توزیع مورد انتظار جامعه آزمودنی‌ها، شیوه‌های برآورد توانایی، شیوه‌های انتخاب سؤال و نسبت‌های مواجهه و همپوشی سؤال هدف تعیین شود، توجه به تمام مولفه‌های CAT که توسط ریکیسی (1989) تعیین شد، به طور همزمان الزامی است (برگستروم و لانز، 1999). دو شیوه‌ی رایج برآورد توانایی در CAT وجود دارد. “شیوه‌ی برآورد توانایی بیزین” که سؤالاتی را انتخاب می‌کند که مقدار مورد انتظار واریانس پسین بیزین را کاهش‌دهد (اوون، 1969). روش بیزین اوون با یک توزیع پیشین توانایی شروع می‌شود، به صورتی که فرض می‌کند که آزمودنی عضوی از یک جامعه با یک توزیع مشخص توانایی – با میانگین و واریانس شناخته شده- می‌باشد. به این روش، “بیشینه دقت پسین” (MPP) نیز می‌گویند (اوون، 1975). روش دیگری که به طور رایجی به‌کار می‌رود، روش بیشینه درست نمایی (ML) است. در این روش تا آزمودنی حداقل به یک سؤال پاسخ درست یا غلط ندهد، برآورد متناهی از توانایی آزمودنی نمی‌دهد (وندر لیندن، 2005). همچنین یکی از روش‌های رایج انتخاب سؤال در CAT “روش انتخاب سؤال بر اساس بیشینه آگاهی” است. در روش بیشینه آگاهی (MI) سؤالاتی که میزان آگاهی فیشر در برآورد توانایی جدید آزمودنی را بیشینه کند، انتخاب می‌شوند (براون و ویس،1977). در CAT، سؤالات جدید به طور انطباقی با توجه به برآورد موقتی سطح توانایی آزمودنی بر اساس پاسخ سؤالاتی که قبلاً بر او اجرا شده است، انتخاب می‌شود (دیوی و پارشال، 1995). این شیوه‌های انتخاب سؤال می‌تواند بر نسبت مواجهه‌ی سؤال تاثیر گذارد. از این‌رو عاملی باید به وجود آید تا این نسبت را کنترل کند. روش‌های متعددی برای کنترل مواجهه‌ی سؤال وجود دارد، روش کنترل مواجهه‌ی سیمپسون-هتر (S-H)، یکی از رایج‌ترین شیوه‌های انتخاب شرطی سؤال است. در این شیوه به هر سؤال مقدار پارامتر کنترل مواجهه‌ی اختصاص داده می‌شود. این پارامتر بر اساس فراوانی انتخاب سؤال که از طریق شبیه‌سازی‌های متوالی CAT تعیین می‌شود، به سؤال اختصاص داده می‌شود. سؤالاتی با فراوانی بالاتر اجرا، پارامتر کنترل مواجهه‌ی کوچکتری به آن اختصاص می‌یابد، که دامنۀ آن بین 0 و 1 است (سیمپسون و هتر، 1985). این مباحث که به صورت خلاصه بیان شد، نشان می‌دهد که چهار هدف اغلب متضاد، در انتخاب سؤال از خزانه در CAT وجود دارد. اول، انتخاب سؤال باید دقت اندازه گیری را از طریق انتخاب آگاهی بیشینه شده یا از طریق دقت پسین سطح توانایی برآورد شده آزمودنی، بیشینه کند. دوم، انتخاب سؤال باید از امنیت خزانه سؤال از طریق محدود کردن میزانی که سؤالات مواجهه خواهند شد، محافظت کند. سوم، انتخاب سؤال باید این اطمینان را ایجاد کند که آزمودنی‌ها، آزمونی با تعادل محتوایی مناسبی را دریافت کرده‌اند (پارشیال، دیوی و نرینگ، 1998). هدف چهارمی که بیشتر به بهینه شدن خزانه سؤال کمک می‌کند، اظهار می‌کند که انتخاب سؤال باید استفاده از سؤال را بیشینه کند، به طوری‌که همه سؤالات در خزانه استفاده شوند. بدین ترتیب، مطمئن می‌شویم که از لحاظ اقتصادی صرفه‌جویی مناسبی برای طراحی سؤال صورت‌گرفته‌است (استوکینگ و سوآن سون، 1998). مسائل مربوط به انتخاب سؤال مانند یک بادبادکی می‌ماند که وقتی یک طرف آن را فشار می دهیم طرف دیگر آن متورم شود، یا به عبارت دیگر زمانی که به یک مورد آن توجه می‌شود، از مورد دیگر آن غافل می‌شویم (استوکینگ و لوئیس، 2000). بنابراین، خزانه‌ی سؤالی که برای CAT ساخته می‎شود، باید بتواند به این مولفه‌ها به طور همزمان توجه کند. با این وجود، پژوهش‌های اندکی در مورد ساخت خزانه‌ی سؤالی برای CAT که بتواند همه‌ی این مولفه‌ها را وارد کند، وجود دارد.

 

مطلب مرتبط :   منابع و ماخذ مقاله الگوهای ارتباط

اینجا فقط تکه های از پایان نامه به صورت رندم (تصادفی) درج می شود که هنگام انتقال از فایل ورد ممکن است باعث به هم ریختگی شود و یا عکس ها ، نمودار ها و جداول درج نشوند.

برای دانلود متن کامل پایان نامه ، مقاله ، تحقیق ، پروژه ، پروپوزال ،سمینار مقطع کارشناسی ، ارشد و دکتری در موضوعات مختلف با فرمت ورد می توانید به سایت  77u.ir  مراجعه نمایید

رشته روانشناسی و علوم تربیتی همه موضوعات و گرایش ها :روانشناسی بالینی ، تربیتی ، صنعتی سازمانی ،آموزش‌ و پرورش‌، کودکاناستثنائی‌،روانسنجی، تکنولوژی آموزشی ، مدیریت آموزشی ، برنامه ریزی درسی ، زیست روانشناسی ، روانشناسی رشد

در این سایت مجموعه بسیار بزرگی از مقالات و پایان نامه ها با منابع و ماخذ کامل درج شده که قسمتی از آنها به صورت رایگان و بقیه برای فروش و دانلود درج شده اند

اولین بار ون‌در‌لیدن و بوکویی-تیمینگا (1989) و ون در‌لیندن (1998) در مورد اتوماتیک کردن ساخت ابزار با استفاده از تابع آگاهی ابزار هدف به مطالعه پرداختند. بوکویی – تیمینگا در سال 1991، از روش “برنامه ریزی اعداد صحیح” برای محاسبه‌ی تعداد سؤالات مورد نیاز برای فرم‌های متفاوت آزمون استفاده‌کرد. او از رویکرد متوالی که تابع آگاهی آزمون (TIF)، را تحت مدل تک پارامتری لوجستیک (راش) بیشینه می‌کرد، استفاده‌ کرد. نتایج پژوهش‌های او برای اصلاح بانک سؤال موجود استفاده ‌شد (بوکویی – تیمینگا، 1991). نخستین کارها در زمینه‌ی ساخت خزانه‌ی سؤل در CAT مربوط به رونالد فلاگر (2000) می‌باشد، وی با انجام کارهای کلاسیکی در زمینه‌ی ساخت خزانه‌های سؤال، نشان داد، برای محقق ساختن بسیاری از مزیت‌های اندازه‌گیری سنجش انطباقی، خزانه سؤالی که از آن سؤالات انتخاب می‌شوند، باید شامل سؤالاتی با کیفیت بالا برای بسیاری از سطوح متفاوت توانایی باشد. وی اولین الگوی ساخت خزانه سؤال را طراحی کرد (واینر و همکاران، 2000، ص 38).با این وجود، تنها نتیجه‌ای که از طراحی او در مورد ساخت خزانه بدست آمد، این بود که، ” باید بتوان تعدادی کافی از سؤالات در هر طبقه‌ی محتوایی ایجاد کرد، سؤالاتی که بر ویژگی‌های آزمونی که قبلاً ساخته شده، مبتنی است” (همان منبع، ص 39). متأسفانه در طرح او هیچ نوع راهنمایی وجود نداشت که نشان دهد، چگونه ویژگی‌های آزمون مشخص شود. به این دلیل‌که در مورد ویژگی‌های مورد نیاز خزانه سؤال برای CAT، راهنمایی‌های اندکی ارائه‌ شده ‌است، اغلب دیده می‌شود که برای ایجاد خزانه سؤال، از شیوه‌هایی استفاده می‌شود که فاقد اصول معینی بوده و تنها در شرایط و بافت خاصی بنا به موقعیت قابلیت کاربرد دارند. برای مثال، وایر، بجورنر و کاسینسکی (2000)، برای ایجاد یک مقیاس CAT با هدف سنجش تأثیر سردرد در افراد، سؤالاتی را از چهار مقیاسی که از قبل موجود بود، جمع‌آوری ‌کردند و برای کامل کردن آن، تعداد کمی سؤال نوشتند تا خزانه سؤال بزرگ‌تر شود. با این کار 53 سؤال به‌دست آمد که تنها مناسب دامنۀ پایین سازه‌ی مورد نظر بود، و برای سنجش دامنه‌های دیگر این صفت مناسب نبود (ریکیسی، 2010).
در کارهایی که اخیراً برروی CAT صورت گرفته، طراحی خزانه سؤال به صورت جدی مورد توجه قرار گرفته است. این مطالعات بر روی دو رویکرد عمده مبتنی هستند. رویکرد اول، توسط ولدکمپ و وندر لیندن (2000) ایجاد شده است، پژوهش‌های مرتبط با این رویکرد از روش برنامه نویسی ریاضی برای طراحی خزانه‌ی سؤال استفاده می‌کنند. در این رویکرد فرض می‌شود که مجموعه بزرگی از سؤالات که “خزانه اصلی” نامیده می‌شود، از قبل وجود دارد و تنها باید خزانه‌های قابل استفاده مورد نیاز، از آن انتخاب شود (بلو و آرمسترونگ، 2009؛ وندر لیندن، ادلاید آریل و ولدکامپ، 2006). در این رویکرد از “تست سایه”(STA) برای طراحی خزانه سؤال استفاده‌ می‌شود، و از ویژگی‌های خزانه سؤال موجود به عنوان نقطه شروع استفاده می‌شود (وندر لیندن و ولدکامپ ،2000). به عبارت دیگر، CAT از طریق رویکرد تست سایه اجرا می‌شود و تست از طریق برنامه‌نویسی عدد صحیح خطی دو ارزشی یا برنامه‌نویسی 1-0 سرهم می‌شود (وندرلیندن، ریس، 1988). بعضی از مطالعات در این رویکرد به هدف طراحی با برنامه‌ریزی اعداد صحیح رسیدند (آریل، ولدکمپ و واندر لیندن، 2004). ولدکمپ و وندر لیندن، 5 گام برای طراحی الگوی بهینه خزانه سؤال CAT با روش برنامه‌ریزی ریاضی، توصیف‌ کردند (ولدکمپ و وندر لیندن، 1999). در این رویکرد صفات و قیود سؤال مشخص می‌شوند، و سپس تست بر اساس آنها سرهم می‌شود. وندر لیندن (2005)، سه نوع از صفات سؤال را از یکدیگر متمایز کرد، کمّی ، طبقه ای و منطقی. صفات کمّی، صفاتی از سؤال هستند که به مقایر عددی سؤال مربوطند. مانند تعداد کلمات، تعداد پاسخ‌های ممکن، آماره‌هایی از قبیل مقادیر-p سؤال و پارامترهای IRT، و فراوانی استفاده‌ی قبلی از سؤال. صفات طبقه‌ای، خزانه سؤال را به خرده آزمون‌هایی از سؤالات با صفت یکسان تقسیم می‌کنند. مانند طبقه‌ی محتوایی، چارچوب پاسخ سؤالات (برای مثال، پاسخ-باز یا چند گزینه ای)، و استفاده از مواد معین (برای مثال، نمودار یا جدول). صفات منطقی از صفات کمّی و طبقه‌ای متفاوتند، صفات منطقی مشخصات سؤالات یا آزمون‌های مجزا نیستند، بلکه صفات دوتایی، سه تایی و غیره سؤالات با یکدیگر می‌باشد. صفات منطقی شامل روابط ورود و خروج بین سؤالات و آزمون‌ها می‌باشد. یکی از این روابط خروج این است که اگر سؤالی راهنمای حلّ سؤال دیگری باشد باید در آزمون یکسانی قرار نگیرد. در این رویکرد ویژگی‌ها و صفات تست بر اساس یک تابع هدف که در ارتباط با مجموعه‌ای از قیود خاص بیشینه یا کمینه می‌شود، محقق می‌گردد. وندر لیندن توانست با استفاده از این روش ویژگی‌های بهینه‌ی خزانه سؤال را شبیه‌سازی کند (وندرلیندن، 2005). مزیت این روش این بود که طراح را قادر می‌ساخت تا ویژگی‌های پیچیده آزمون را مدل‌یابی کند. یک ‌مرتبه ویژگی‌های سؤالات را تعریف کند و آنها را به عدد تبدیل کند، و سپس نرم افزار ویژه‌ای برای شبیه سازی خزانه سؤال بهینه تعبیه کند. با این وجود، خزانه سؤال طراحی شده با روش برنامه‌ریزی ریاضی به طور گسترده‌ای در انتخاب سؤال به روش تست سایه وابسته است و به دانش زیادی در مورد نرم‌افزار بهینه‌سازی ویژه نیاز دارد. همچنین، بسته به روشی که صفات سؤال پارتیشن‌بندی می‌شوند، فضای طراحی می‌تواند بسیار بزرگ شود و فرآیند شبیه‌سازی از لحاظ محاسباتی دشوار شود (گو و ریکیسی، 2007). یکی از محدودیت‌های بالقوه‌ی این رویکرد آن است که به نرم افزارهای جبر خطی از قبیل CPLEX و LINDO برای بدست آوردن راه‌حل بهینه نیاز دارد، که کاربرد این روش را اندکی دشوار می‌کند و ممکن است، کدها و معادلات آن برای اکثریت کاربران دردسترس نباشد، که در این صورت اگر برنامه نیاز به اصلاح و یا تغییر داشته باشد، کنترلی بر آن نداشته باشند و چه بسا این احتمال وجود دارد که همیشه راه ‌حل قابل اجرا و عملی دردسترس نباشد (چانگ، 2007؛ روبین و همکارانش، 2005). همچنین محدودیت دیگر این رویکرد این است که، سؤالات از قبل در خزانه موجود هستند و از روی آنها یک خزانه کوچک‌تر سرهم می‌شود (گو و ریکیسی، 2007) و در این رویکرد از ویژگی‌های یک خزانه‌ی سؤال موجود به عنوان نقطه شروع استفاده می‌شود (ریکیسی، 2010). البته استوکینگ و سوانسون (1993)، توانستند با استفاده از رویکرد برنامه‌نویسی خطی اعداد صحیح روشی را ایجاد کنند که در آن نیاز به استفاده از تست سایه در طراحی خزانه‌ی سؤال سنجش انطباقی وجود نداشته باشد. این روش برنامه‌نویسی خطی که به مدل انحرافات وزن‌دار (WDM) معروف است، به‌طور گسترده‌ای به عنوان


دیدگاهتان را بنویسید