۴۰

۷/۱۶

۳۹

۸/۲۵

۱۹

۵/۱۷

۳/۴۵

۳/۳۰

۲۰

نمودار (۲-۱) نمرات صدکی فرمهای x و y تست ورابطه نمرات همتراز شده
نمودار (۲-۲) نمرات همتراز شده فرمهایx و y که با روش همصدک به دست آمدهاند، وهمچنین یک تخمین خطی از رابطه بین نمرات x وy
Y40 35 30 25 20 15 10 5
منابع خطا در همترازسازی
برآورد روابط همتراز سازی اصولاً با دو نوع خطا روبرو است؛
۱) خطای تصادفی[۵۹] همتراز سازی
این نوع خطا مربوط به نمونه گیری از جامعه آزمودنی هاست. در همتراز سازی به دلیل عدم دسترسی کامل به پارامترهای جامعه، این پارامترها از طریق آمارهای نمونه برآورد می شوند و در استفاده از نمونه گیری برای برآوردن این پارامترها همراه مقداری خطا وجود دارد که به آن خطای استاندارد اندازه گیری برای برآورد این پارامترها همواره مقداری خطا وجود دارد که به آن خطای استاندارد اندازه گیری می گویند و می توان آن را به عنوان انحراف استاندارد نمرات همتراز شده در نمونه هایی از جامعه آزمودنی ها تعریف کرد (کولن و برنان، ۱۹۹۵) . برای مثال وقتی حجم نمونه کوچک است و با بهره گرفتن از همتراز سازی، معادل نمره خاصی از فرم X را در فرم Y بدست می آوریم، حال اگر چندین بار نمونه گیری تکرار شود و برای هر بار نمونه گیری نمره گیری نمره معادل آن نمره را با همان روش همتراز سازی در فرم Y محاسبه کنیم ملاحظه می شود که تعداد زیادی نمره معادل با آن نمره خاص برآورد می شود. انحراف استاندارد این نمرات محاسبه شده، یک برآورد از خطای استاندارد نمره معادل با آن نمره خاص از فرم X روی فرم Y می باشد و این امر نشان می دهد که خطای استاندارد همتراز سازی برای هر نمره از فرم X روی فرم Y جداگانه تعریف می شود. با افزایش حجم نمونه خطای استاندارد همتراز سازی کوچک تر می شود و هر چقدر این حجم به اندازه کل جامعه نزدیک تر شود خطای استاندارد اندازه گیری به سمت صفر میل می کند (پترسون، کولن، هوور، ۱۹۸۹). بنابراین برای این نوع خطا با انتخاب نمونه بزرگ، طرح همتراز سازی مناسب برای جمع آوری داده ها و روش آماری مناسب برای همتراز سازی نمرات می توان کاهش داد.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

۲) خطای نظام دار[۶۰] همتراز سازی
این نوع خطا به علت تخلف از نظریه ها و شرایط همتراز سازی اتفاق می افتد. نمونه هایی از مواردی که این خطا رخ می دهد به قرار زیر است؛
استفاده از روش خطی تاکر وقتی که رگرسیون x روی y در دو جامعه A وB متفاوت است، استفاده از طرح های نا مناسب برای جمع آوری داده ها مثلاً استفاده از یک روش مارپیچ نا مناسب برای اجرای آزمون روی زیر گروه ها در طرح گروه ها تصادفی، یا اینکه در طرح گروه های نابرابر با سوالات مشترک محل قرارگیری سوالات مشترک در فرم X و Y متفاوت باشد، مورد دیگر وقتی است که گروه های آزمون شونده ماهیتاً متفاوت باشند، همچنین بی توجهی در کنترل اثرات ترتیب اجرای آزمون به طور مناسب در طرح تک گروهی با موازنه، مورد دیگر وقتی است که سوالات مشترک نماینده کل تست از نظر محتوا و ویژگی های آماری نباشد و اینها نمونه ای از مواردی است که می توانند منبع تولید خطای نظام دار باشند (کولن وبرن نان، ۱۹۹۵).
مشکل اساسی در مورد خطای نظامدار این است که عموماً اطلاعات کافی برای برآورد یا تعدیل نوع خطا در دست نیست، یعنی مثل خطای تصادفی که با فرمول انحراف استاندارد و همتراز سازی قابل برآورد است، تعیین کمیت این نوع خطا دشوار است. البته از روش های هموارسازی برای کاهش این نوع خطاها و همتراز سازی همصدک استفاده می شود که اشاره خواهد شد. در برخی شرایط عملی مقدار خطای همتراز سازی ممکن است آن قدر زیاد باشد که احتمالاً همتراز سازی نمرات نسبت به زمانی که نمرات خام مستقیماً مورد مقایسه قرار گیرند، خطای بیشتری را ایجاد کند. در هر حال در تحقیقات مربوط به همتراز سازی باید تا حد ممکن سعی کرد تا هر دو نوع خطای ذکر شده کاهش یابند.
البته کولن (۱۹۸۷) به خطای نوع سومی اشاره می کند که به آن خطای گرد کردن نمرات همتراز شده می گویند.
هموارسازی (در همترازسازی همصدک)
هموار سازی[۶۱] بر اساس جدا کردن خطای تصادفی از خطای نظام دار به هنگام استفاده از روش همتراز سازی همصدک گسترش یافته است. در همتراز سازی همصدک وقتی که درصدها و رتبه های درصدی نمونه برای برآورد روابط همصدک استفاده می شود، به علت خطای نمونه گیری دقت[۶۲] همتراز سازی به اندازه قابل توجهی کاهش می یابد. بی نظمی ها و بی قاعدگی های موجود در توزیع نمرات وقتی که به صورت یک نمودار ترسیم می شوند، این ادعا را ثابت می کند. البته این احتمال وجود دارد که اگر توزیع نمرات نمونه ای بسیار بزرگ و یا کل جامعه در دسترس باشد توزیع نمرات و روابط همتراز سازی منطقی هموار باشد.
از روش های هموار سازی به منظور ارائه توزیع نمرات و روابط همصدک همواره استفاده می شود و انتظار می رود با بکارگیری این روش ها برآوردها نسبت به زمانی که این روش استفاده نمی شود از دقت بیشتری برخوردار باشند، هر چند این خطر همچنان وجود دارد که نتایج برآورد حتی اگر هموار هم باشد برآورد ضعیف تری از توزیع جامعه روابط همترازسازی باشند. کیفیت تحلیلی روش های هموارسازی موضوع تحقیقات بسیار بوده است (کولن و برن نان، ۱۹۹۵).
به طور کلی دو روش عمده هموارسازی موجود است؛
۱) پیش هموارسازی[۶۳]، که در آن توزیع نمرات هموار می شوند و بعد از همواره کردن توزیع ها، نمرات واقعی به دست می آیند و خطای نمره واقعی محاسبه می گردد.
۲) پس هموارسازی[۶۴]، که در آن معادل های درصدی هموار می شوند، در واقع پس هموار سازی فرایند عبور دادن یک خط مستقیم یا منحنی از بین نقاطی است که روابط همترازسازی همصدکی بین آنها برقرار گردیده است.
روش های همترازسازی در نظریه سوال- پاسخ
برای همترازسازی به جای مدل همصدک یا مدل خطی همترازسازی می توان روشی بکار برد که بر پایه IRT بنا شده است. این روش نسبت به روش های همترازسازی با رویکرد کلاسیک مزیت هایی را دارد.
برآورد پارامتر ها در IRT، همانطور که قبلاً اشاره شد یکی از کاربردهای نظریه سوال- پاسخ استفاده از آن در همترازسازی و مقیاس بندی آزمون هاست. چون مقادیر واقعی پارامترهای سوال در هر تست نامعلوم است، یکی از کارهای اساسی که هنگام تجزیه و تحلیل تست ها بر پایه ی تئوری سوال پاسخ باید انجام شود، برآورد کردن پارامترهاست. برآورد پارامترهای سوال می توان اطلاعاتی درباره ویژگی های فنی سوالات تست به دست دهد (هومن، ۱۳۷۵). برای این کار از برنامه های کامپیوتری مثل Logist,Bilog و Ascall و از روش های از سرگیری بیشینه احتمال و غیره می توان استفاده کرد. پارامترها را به روش های مختلفی برآورد می کنند که بعضی اوقات نتایج نامحدودی تفاوت خواهند داشت و توانایی برآورد شده را بر اساس مقیاسی با میانگین صفر و انحراف استاندارد ۱ نشان می دهند. از ویژگی های مهم این برنامه ها این است که توانایی برآورد شده برای هر فرد بستگی به الگوی پاسخ های وی به سوالات دارد تا آن که فقط بستگی به نمره کل (تعداد پاسخ های صحیح) آزمودنی ها داشته باشد. بدین معنی که آزمودنی هایی با نمره کل یکسان، ممکن است دارای توانایی هایی متفاوتی باشند و این امر به دلیل آن است که سوالاتی که هر فرد به آنها پاسخ صحیح داده است با افراد دیگر متفاوت بوده است. این عمل باعث افزایش دقت برآورد توانایی آزمودنی ها می شود.
مدل های مختلف IRT وجود دارد که تفاوت آنها در نوع تابع منحنی ویژگی های سوال است از بین آنها مدل منطقی سه پارامتری بیشترین استفاده رادارد و به خاطر اینکه تحقیق حاضر نیز بر اساس این مدل تجزیه و تحلیل شده است. به توضیح و بررسی همترازسازی بر اساس این مدل می پردازیم. روش های همترازسازی IRT نوعاً یک برنامه سه مرحله ای است:

  • برآورد کردن پارامترهای سوال با بهره گرفتن از یک برنامه کامپیوتری مثل Logist,Bilog و
  • مقیاس بندی (تبدیل) پارامترهای برآورد شده به یک مقیاس پایه با بهره گرفتن از یک تبدیل خطی
  • تبدیل نمرات خام فرم جدید به مقیاس نمرات فرم کلاسیک و سپس تبدیل آنها به نمرات مقیاس .

مدل های IRT می توانند در همترازسازی افقی و عمودی به کار برده شوند. در همترازسازی افقی تست های متفاوتی برای افرادی با توانایی های مشابه به کار می رود و در همترازسازی عمودی تست ها، برای گروه های هدف با سطح توانایی متفاوت کاربرد دارند. در روش عمودی با در نظر گرفتن سطح دشواری برای تفسیر، نمرات باید روی یک مقیاس یکسان از توانایی آورده شوند. در اینجا آزمودنی های جوان تر باید در معرض مواد تست کننده یا سوالاتی از تست های سطح بالاتر که متناسب توانایی آزمودنی های مسن تر است، قرار گیرند تا همترازسازی حاصل شود (پترسن، ۱۹۸۹، به نقل از رویتر و کمپ، ۲۰۰۳).
اصولاً سه رویکرد برای همترازسازی دو فرم X و Y دارای سوالات مشترکی هستند در IRT وجود دارد:
الف) مقیاس بندی همزمان (توام)؛ پارامترهای سوال هر دو تست به طور مشترک در یک تحلیل برآورد می شوند. برای این رویکرد ما نیازمند نرم افزاری هستیم که داده های نا تمام را به حساب آورد، این رویکرد زمانی است که هر شخص فقط به یک ریز تست از سوالات کل را پاسخ دهد.
ب) پاسخ های تست های X و Y به طور جداگانه تحلیل شود؛ در تحلیل تست دوم پارامترهای سوال برای سوالات مشترک ثابت می شوند تا مقادیرشان در تحلیل تست نخست به دست آید. مقیاس های تست های X و Y به وسیله مقادیر میانگین های سوالات مشترک می تواند به همدیگر ارتباط داشته شود.
ج) پاسخ های تست های X و Y به طور جداگانه تحلیل شوند؛ تفاوت آن با رویکرد قبلی این است که مقادیر پارامتر سوالات مشترک برای به دست آوردن مقادیرشان در تحلیل تست نخست ثابت نیستند. مقیاس های تست X و Y دوباره می توانند به وسیله مقادیر میانگین های سوالات مشترک به همدیگر ارتباط داده شوند.
در اینجا رویکرد سوم در محتوای سه مدل رایج IRT بررسی می شود؛
۱) مدل راش (مدل تک پارامتری)
با مدل راش رویکرد سوم خیلی درست به نظر می رسد. میانگین های پارامتر دشواری (b) سوالات مشترک در تست های X و Y را نیاز است . فرض کنید که k سوال مشترک با میانگین های زیر موجود است؛
(۹-۲)
اگر مقادیر میانگین های پارامتر دشواری برای سوالات مشترک برای هر دو تست برابر باشد، پارامتر دشواری (b) هر دو تست روی یک مقیاس مشترک خواهند بود. بنابراین، مقادیر b (دشواری) و مقادیر (توانایی) تست Y می تواند روی مقیاس یکسان آورده شود، مانند تست X با تبدیل زیر؛
(۱۰-۲)
مقادیر پارامترهای دشواری در دست نیست و فقط این مقادیر را برآورد می شود. مقادیر برآورد شده دقیق نیستند، بنابراین به جای میانگین غیر وزنی در (۱۰-۲) ممکن است از میانگین وزنی استفاده شود (رویتروکمپ، ۲۰۰۳).
۲) مدل دوپارامتری

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...