با همکاری مشترک دانشگاه پیام نور و انجمن روانشناسی تربیتی ایران

نویسندگان

1 دانشیار، مدیریت آموزشی، دانشگاه پیام نور

2 دانشجوی دکتری، مطالعات برنامه درسی، دانشگاه خوارزمی

3 دانشجوی دکتری، برنامه‌ریزی از دور، دانشگاه پیام نور

چکیده

مطالعة حاضر با عنوان «برآورد پارامترهای سؤال‌های چندگزینه‌ای در ارزشیابی نظام‌های آموزشی مجازی» روی آزمون‌های ریزشی برای ممانعت از تکرار آزمون انجام پذیرفت. برای برآورد پارامترهای سؤال‌ها، پاسخ‌نامه‌های 49 آزمون نهایی دانشجویان ریزشی یک نیمسال تحصیلی بررسی گردید. در مدل کلاسیک، درجه دشواری هر سؤال (p) نسبت پاسخ‌های درست به کل آزمودنی‌ها و قدرت تشخیص (Rpbis) ضریب همبستگی دو رشته‌ای نقطه‌ای با کل آزمون در نظر گرفته می‌شود، محاسبات نشان داد: 1- در 7/89% آزمون‌ها حتی یک سؤال خیلی آسان و روا مشاهده نگردید. 2- در 26/63% آزمون‌ها حتی یک سؤال خیلی سخت و روان مشاهده نگردید. 3- فقط 04/2% آزمون‌ها بدون سؤال ناروا است. پس از حذف سؤال‌های ناروا، دوباره نمرة دانشجویان تعیین و حدود 11/15% افراد از کمند ریزش جستند. به این ترتیب با حذف ماده‌های ناروا، درصد آزمون‌های ریزشی به شدت کاهش می‌یابد، از اتلاف منابع جلوگیری می‌شود، ملاک پیشرفت تحصیلی دانشجویان واقعی‌تر و مبنای تصمیم‌گیری‌های بهتر را برای دانشگاه فراهم می‌آورد.

کلیدواژه‌ها

عنوان مقاله [English]

Estimating the Parameters of Multiple - Choice Questions in the Evaluation of the Educational Systems Virtual

نویسندگان [English]

  • Mahmoud Ekrami 1
  • Negar Elhamian 2
  • Somayeh Rajabzadeh 3

چکیده [English]

Present study, titled “Estimating the parameters of multiple-choice questions in the evaluation of the educational systems virtual" was performed on failed test to prevent the repetition of tests. For parameters estimation of the questions, responses of 49 final test of failed students was investigated in an academic semester. In the classic model, the degree of difficulty of each question (p) the proportion of correct responses in all subjects, and judgment (Rpbis) double-stranded correlation with the test point considered, the calculations showed: (1) In-89.7% of tests there wasn’t even a very easy and reliable question. (2) In 63.26% of tests wasn’t observed even a very difficult and reliable question. (3) Only 2.04% of tests is without unreliable question. After deleting the unreliable questions, the students’ marks were determined again and about 15.11% of students passed the test. Thus, by deletion unreliable questions, percent of failed tests reduced remarkably, the waste of resources is prevented, the criteria of students’ academic achievement became real more and provided better basis for decision-making in university.

کلیدواژه‌ها [English]

  • Classical Model
  • Multiple-Choice Test
  • The Degree of Question Difficulty
  • The Power of Determining Answer
  • PNU Test Center
اکرامی، محمود. (1389). "ارزیابی دوره‌های آموزشی غیرحضوری ضمن خدمت کارکنان دولت در استان تهران"، طرح پژوهش با استفاده از اعتبارات استانداری نهران انجام شده است. چاپ نشده.
آلن، مری جی.؛ ین، وندی ام. (1387). مقدمه‌ای بر نظریه‌های اندازه‌گیری (روان‌سنجی) (ترجمه علی دلاور)، چاپ سوم. تهران: نشر ذره.
امیریان، سحر (1391). "تعیین پارامترهای سه‌گانه آزمون‌های چهارگزینه‌ای دانشگاه علوم پزشکی مشهد بر پایه مدل IRT"، پایان‌نامه کارشناسی ارشد مدیریت آموزشی. دانشگاه پیام نور تهران، چاپ نشده.
امین، محمد مهدی؛ شایان، شهرام؛ هاشمی، حسن؛ پورصفا، پریناز؛ ابراهیمی، افشین. (1389). "تجزیه و تحلیل آزمون دروس دانشجویان کارشناسی بهداشت با استفاده از برنامه نرم‌افزاری آنالیز سؤالات چندگزینه‌ای بر اساس نظریه تستی کلاسیک (CTT)"، مجله ایرانی آموزش در علوم پزشکی (ویژه‌نامه توسعه آموزش)، شماره 5.
ایبل، رابرت ال. فریزبی، دیوید دی. (1381). اصول اندازه‌گیری در علوم تربیتی (ترجمه حسین سپاسی). اهواز: انتشارات دانشگاه شهید چمران.
تقی زاده، تهمینه. (1390). "ارزیابی دوره‌های کوتاه‌مدت دفتر آموزش و پژوهش استانداری تهران"، پایان‌نامه کارشناسی ارشد مدیریت آموزشی، دانشگاه پیام نور تهران، چاپ نشده.
دلاور، علی؛ زهراکار، کیانوش. (1387). سنجش و اندازه‌گیری در روان‌شناسی، مشاوره و علوم تربیتی، چاپ اول. تهران: نشر ارسباران.
ربانی، علی؛ فرزیان‌پور، فرشته؛ زمانی، غلامرضا. (1385). "ارزیابی درونی در گروه بیماری‌های کودکان دانشکده پزشکی دانشگاه علوم پزشکی تهران"، مجله بیماری‌های کودکان ایران، دوره 16 شماره 3.
سام‌شریفی، اسماعیل؛ دلاور، علی؛ بلوکی، آزاده؛ شعبانی، سمیه. (1391). ارزشیابی آزمون نظری آزمون گواهینامه رانندگی بر اساس نظریه سؤال – پاسخ و مقایسه آن با نظریه کلاسیک آزمون.
سیف، علی‌اکبر. (1381). روش‌های اندازه‌گیری و ارزشیابی آموزشی، ویرایش دوم. تهران: نشر دوران.
سیف، علی‌اکبر. (1386). اندازه‌گیری، سنجش و ارزشیابی آموزشی، ویرایش چهارم. تهران: نشر دوران.
شریفی، حسن‌پاشا. (1381). اصول روان‌سنجی و روان آزمایی، چاپ هفتم. تهران: انتشارات رشد.
کرم دوست، نوروزعلی. (1383). "بررسی رابطه ارزشیابی دانشجویان دانشکده روان‌شناسی و علوم تربیتی از تدریس استادان با میانگین نمرات آنان از درس استادان در سال تحصیلی 77-78 تا 80-79"، مجله روان‌شناسی و علوم تربیتی، شماره 34، ص76-57.
کیامنش، علیرضا. (1382). روش‌های ارزشیابی آموزشی. چاپ دهم، تهران: انتشارات دانشگاه پیام نور.
مقدمی، نجمه. (1392). "برآورد پارامترهای سؤال‌های چهارگزینه‌ای در آزمون‌های نهایی دستیاری دانشگاه علوم پزشکی مشهد"، پایان‌نامه کارشناسی ارشد مدیریت آموزشی. دانشگاه پیام نور تهران، چاپ نشده.
هومن، حیدرعلی. (1370). اندازه‌گیری روانی و تربیتی و فن تهیه آزمون و پرسش‌نامه. تهران: انتشارات پیک فرهنگ.
هومن، حیدرعلی. (1373). "مقایسه مدل تک پارامتری راش و مدل دو پارامتری"، پایان‌نامه کارشناسی ارشد، دانشگاه علامه طباطبایی، چاپ نشده.
 
Brennan, R.L. (1989) Introduction to Problems, and, Practical Lssvesin Equating. Applied Psychological Measurement, VOL.17,NO 3  
Brennan, R.L. (1989). Introduction to Problems, and, Practical Lssvesin Equating. Applied
Cook, L.L. & Peterson, N.S. (1987) Problems Reacted to the use of conventional and Item
Hambletow, R.K. & Cook, L.L. (1977). Latent trait models and their use in the analysis of educational test data. Journal of Educational measurement, 14, 75-96.
Hambletow, R.K. & Cook, L.L. (1983). The robustness of item response models effects of test length and sample size owe the precisiow of ability estimates. In D Jweis (ED) New horizons in testing (pp.31-94). New York: ACADEMIC PRESS.
MacDonald. & Paun0nen, S.V. (2002). A Monte Carlo comparison of Item and person satisfies Based on Item Response theory versus classical test theory. Educational and psychological measurement vole 62 no.6, pp.921-943. University …. Wester ontazio.
Mony, H. (2006). A multilevel Bayesian item response. Theory method for scaling socioeconomic status in international studies of Education Journal Educational and Behavioral states ties,vol,31,no.1,pp.63-79.
Oshima, T.C.O. (1994). The effect of speediness on parameter estimation in item response theory. Journal of Educational measurement, 31,200-219.
Quereshe. M.Y.T.L. Fisher (1997). The effect speediness on parameter estimation in item response theory. Journal of Educational measurement .31.200-219.
Response Theory Equating Methods in Less than optimal Circumstances. Applied Psychological Measurement, VOL.17
Stage, C. (2000). A comparison between item analgim Based o w Item Response theory and classical test theory. A study of the sweat subset ERC.
Z.JR. Slater. (1992). An analysts of the utility of item response theory for the practitioner in a university departmental seething. Source: DAI-A54:03, p.872, Sep 1993.