قدمت اندازهگیری و امتحان احتمالاً کم و بیش با قدمت آموزش و یاد دادن برابر است. در گذشته بسیار دور تا کنون معلمان و سایر افرادی که با تدریس و آموزش سر وکار داشته اند برای پی بردن به میزان موفقیت فراگیران خود از مطالب آموزش داده شده به صورتهای مختلف از امتحان استفاده میکردهاند. با توجه به منابع موجود مقامات چینی قریب 4000 سال بیش برای انتخاب پرسنل اداری خود از امتحان استفاده
میکرده اند.(پاپهام، 1975)
مدارک زیادی وجود دارد که در ایران باستان، یونان و روم از امتحان استفاده می شده است. مثلاً سقراط و سایر معلمان یونانی در کلاسهای درس خود از سوالهای امتحانی استفاده می کرده اند.
بر پایه منابع تاریخی در زمان شاپور پادشاه ساسانی، در جندی شاپور، برای دانشجویان پزشکی مجالس امتحان و آزمایش برگزار می شد و به شرکت کنندگان در امتحان به شرط موفقیت اجازه نامه پزشکی داده می شد.(محمدی،1365)
همچنین در قرن هفتم هجری چون داوطلبین ورود به مدرسه مستنصریه بغداد از ظرفیت مدرسه بیشتر بوده از شاگردان هنگام ورود به مدرسه امتحان می گرفتند و از میان آنان تعداد لازم را انتخاب می کردند. در مدارس دوره قاجار معلم هر روز و هر هفته از شاگرد خود درس می پرسیده است و توانایی وی را از طریق امتحان ارزیابی می کرده است. در این مدارس معلم درس جدید را بر پایه توانایی دانش آموز ارائه می کرده است و مسئله شب امتحان یا ایام امتحان مفهومی نداشته است.
اقبال قاسمی پویا (1369) در رساله دکتری خود می نویسد که در مدارس دوره قاجاریه ارزشیابی دو مرحله داشته است: ارزشیابی مرحله ای که هر روز یا هر چند روز یک بار صورت می گرفت و ارزشیابی نهایی که در پایان یک کتاب یا یک مطلب انجام می شده است و با آئین نامه خاصی همراه بوده است. در مدارس دوره قاجار امتحان و آموزش هر دو جنبه فردی داشتند و در بیشتر موارد امتحان، شفاهی و در حضور شاگردان دیگر صورت می گرفت. امتحان کتبی فقط در موارد ضروری نظیر املا و خط به عمل می آمد. جوزف مایرریس[1](1898) در یک مطالعه عملکرد درست نوشتن حدود 3000 دانش آموز آمریکایی را مورد مطالعه قرار داد. از این مطالعه به عنوان نخستین فعالیت ارزشیابی آموزشی[2] که به صورت رسمی و نظامدار اجرا شده نام برده می شود. بیشتر فعالیتها که در قرن بیستم به آنها به عنوان ارزشیابی آموزشی داده شده با آزمون کردن[3] دانش آموزان در مدارس ارتباط پیدا می کند. در اوایل قرن بیستم آزمونهای استاندارد شده رواج پیدا کردند و تقریباً همزمان با آزمونهای استاندارد شده[4] ، جنبش اعتبار گذاری[5] بر موسسات و برنامه های آموزشی در آمریکا آغاز گردید. از آن زمان به بعد از فرایند اعتبارگذاری به عنوان یکی از روشهای اصلی در ارزشیابی موسسات آموزشی استفاده شده است.
تا سال 1930 فعالیت و عملکرد تحصیلی دانش آموز پایه و اساس ارزشیابی را تشکیل می دهد. رالف تایلر در فاصله سالهای 1930 تا 1945 ضمن فعالیتهای خویش به این نتیجه رسید که یک برنامه آموزشی باید حول هدفهای آموزشی مشخص سازمان تدوین یابد. قضاوت در مورد موفقیت یا عدم موفقیت برنامه باید با توجه به میزان موفقیت فراگیران در رسیدن به هدفهای تعیین شده برنامه انجام پذیرد.
اواخر دهه 1960 میلادی تا اوایل دهه 1970 میلادی را می توان دوره بحث و مجادله در زمینه درک و پذیرش ارزشیابی آموزشی دانست. در نیمه دوم دهه 1970 ارزشیابی آموزشی به عنوان یک حوزه تحصص جدید و مستقل مورد قبول واقع گردید.
[1] -Joseph Mayer rice
[2] - Educational Evaluation
[3]- Testing
[4]- Standardized test
[5] -Accreditation