Михайлычев Е.А. Дидактическая тестология - файл n1.doc

Михайлычев Е.А. Дидактическая тестология
скачать (1923.5 kb.)
Доступные файлы (1):
n1.doc1924kb.21.10.2012 12:15скачать

n1.doc

  1   2   3   4   5   6   7   8   9   ...   18

«ПРОФЕССИОНАЛЬНАЯ БИБЛИОТЕКА УЧИТЕЛЯ»

Е.А. МИХАЙЛЫЧЕВ

ДИДАКТИЧЕСКАЯ

ТЕСТОЛОГИЯ

научно-методическое пособие


М69 Михайлычев Е.А. Дидактическая тестология. М.: Народное обра­зование, 2001. 432 с. (Серия «Профессиональная библиотека учителя ».)

ISBN 5-87953-151-1

Предмет размышления автора — проблемы современ­ного состояния разработки дидактической тестологии как составной части педагогической диагностики.

В книге изложена научно-обоснованная авторская технология разработки и апробации дидактических тестов для многоэтапного контроля знаний на основе зарубежно­го и отечественного опыта тестирования в образовании.

Предназначена для учителей школ, преподавателей, студентов и аспирантов высших учебных заведений, руко­водителей органов образования.

ББК 74.202

ISBN 5-87953-151-1





Рецензенты: д-р пед. наук, проф. В.Т. Фоменко, канд. психол. наук, доцент Т.Н. Щербакова




ВВЕДЕНИЕ

Управление педагогическим процессом в любом учеб­ном заведении эффективно лишь при наличии оператив­ной и адекватной системы обратной связи. Современная дидактика признаёт, что «проблема создания и внедрения в широкую практику образовательных стандартов по всем учебным предметам в средней школе самым тесным обра­зом связана с другой, не менее важной — достоверности и надёжности измерения уровня (степени) обученности чело­века в соответствии с каким-либо из этих стандартов».

Использование в образовательных учреждениях раз­личных систем многоэтапного контроля знаний и умений учащихся вызывает необходимость разработки и апроба­ции разнообразных взаимосвязанных средств входного, текущего и итогового контроля.

И в общеобразовательных, и в профессиональных учебных заведениях, и в курсовых программах профобу-чения всех уровней (от инструктажа по технике безопас­ности до докторантуры) качество контроля знаний и уме­ний обучаемого чрезвычайно важно.

В то же время педагоги всех типов учебных заведений недовольны сложившейся пятибалльной, а реально — че­тырехбалльной системой отметок.


*3десь и далее в квадратных скобках указан номер работы из приложенного списка литературы.

Традиционная пятибалльная шкала субъективна, за что её часто критикуют. Были попытки её реформиро­вать — придать каждому баллу явно выраженный крите­риальный характер — по системе И.Я. Конфедератова или какой-либо ее модификации, как у В.П. Симонова и Е.Г. Черненко. Среди негативных явлений в системе об­разования отмечается «разрушение системы оценивания учебных достижений школьников без создания и внедре­ния адекватной замены» [61, с. 91]*, что вызывает, ко­нечно, затруднения педагогов-практиков, особенно, ког­да надо оценить результаты внедрения новых информа­ционных технологий, инновационных программ и мето­дик, организационных структур (или реставрируемых старых, вроде кадетских корпусов).

Причины затруднений различны.

Во-первых, это неподготовленность многих педагогов к использованию имеющихся средств и методов контроля знаний и умений, прежде всего в профессиональных и высших учебных заведениях.

Большинство педагогов вузов, особенно технических, не имеют даже базового психолого-педагогического образо­вания (кратковременные ФПК, вузовские семинары вряд ли могут это образование полноценно заменить). Специаль­ная же литература и материалы диссертационных исследо­ваний педагогов и психологов обычно малодоступны.

Во-вторых, это слабость диагностической подготовки в пединститутах, на инженерно-педагогических факультетах.

Вопросы психолого-педагогической диагностики в 80-90-х годах, несмотря на то что по этой проблематике на­чали проходить конференции, защищаться диссертации, выходить книги, по-прежнему недостаточно представлены в учебных программах психолого-педагогических курсов. (По данным исследования М.М. Ахмеджанова, проведён­ного, методом контент-анализа, — они составляют не более 2-3% учебного материала в самом общем изложении по ти­повым программам, реально же — еще меньше.) При под­готовке инженеров-педагогов только в двух из 30 вузов СНГ — в СИПИ и БухТИП, а из педвузов России только в Ростовском педагогическом университете — был специаль­ный курс по психолого-педагогической диагностике.

В-третьих, до сих пор не создан авторитетный науч­но-методический центр диагностического обеспечения, который мог бы руководить разработкой проблем педаго­гической диагностики, а также внедрением новых мето­дик, процедур, организацией информационных банков данных и методик.

Кроме создания новых методик, необходимо и ис­пользование возможностей «старых», традиционных ме­тодов и средств контроля.

В-четвёртых, в современных условиях необходимо качественное изменение сложившегося подхода к контро­лю результатов обучения. Усложнение программ и учеб­ных планов, нарастание потоков научно- технической ин­формации требуют энергичного внедрения новых инфор­мационных технологий в обучение, особенно связанных с компьютеризацией обучения. К сожалению, сегодня ком­пьютерные тесты создаются по примитивной технологии.

Английский психодиагност П. Клайн не случайно анализирует качество компьютерных версий тестов. По его мнению, следует идти дальше простого переложения бланкового теста на дисплей: «компьютеризированная версия стандартного теста напоминает, вероятно, пре­красно оформленное издание книги, но сафьяновый пере­плёт не улучшает её содержание» [145].

Сегодня теоретики педагогической диагностики (тра­диционной — «бланковая», с методиками «карандаш-бу­мага» либо тренажёрная — и компьютерной) работают над созданием диагностике-коррекционных программ, или, как их ещё называют, синтетических методик.

Этот процесс отнюдь не прост — требуется большая исследовательская, теоретическая, практическая и экс­периментальная работа. При этом необходимо учитывать концепцию федеральных государственных стандартов об­разования, в которой, в частности, утверждается, что си­стема измерителей «должна обладать как минимум тремя функциями: диагностической, воспитывающей и инфор­мационной» [61, с. 107].

Но в любом случае обязательным составным элемен­том системы измерителей результатов обучения будут ди­дактические тесты. Однако в нашей стране только в начале 90-х годов тесты были официально признаны как достой­ное средство измерения (наряду с другими, традиционны­ми), которое может быть использовано не только при теку­щем контроле знаний, но и при итоговой аттестации уча­щихся всех типов школ [112, с. 55], что особенно важно для объективного (насколько это возможно при правильной ор­ганизации и методобеспечении) контроля результатов об­разовательной деятельности как на заключительном, так и на промежуточных этапах обучения школьников и студен­тов, рабочих и повышающих свою квалификацию специа­листов, а также в системе дополнительного образования.

Отечественные тестологи справедливо отмечают, что «по результатам тестового контроля знаний учащихся можно сопоставлять качество разных учебников, методи­ческих систем обучения. Систематический объективный контроль даёт сведения об эволюции качества образова­ния молодёжи и при внесении различных изменений в школьную систему. Появляется возможность сравнивать качество образования в разных странах на основе единых критериев» [13, с. 28].

При всей общеупотребительности понятия «тест» под ним понимаются нередко совершенно разные диагности­ческие методики или существенно различающиеся зада­ния. Терминология дидактического тестирования, по на­шим подсчётам, включает до 200 достаточно автономных терминов, характеризующих разные подходы, типологи-зации, виды деятельности.

Обозначим терминологически следующие понятия:

  1. ДИДАКТИЧЕСКИЙ ТЕСТ — система взаимосвя­занных заданий для контроля усвоения знаний, сформи-рованности умений, навыков учащихся по определённо­му учебному материалу или практических знаний.

  2. ТЕСТОВОЕ ЗАДАНИЕ (тест-задание) — один из со­ставляющих элементов структуры дидактического теста, включающий в себя краткую инструкцию для обследуемо­го, тестовую задачу, эталон ответа (или описание чёткого алгоритма выполняемых обследуемым действий). В наибо­лее распространённых тестах закрытого типа в структуру тестового задания входят варианты ответа (как правиль­ные, эталонные, так и отвлекающие, «дистракторы»).

  3. СУБТЕСТ — группа тестовых заданий, предназна­ченных для выявления одного из элементов структуры умений, навыков, значимого психического качества, ли­бо относительно самостоятельного раздела знаний (по те­ме, по разделу, по предмету).

4. БАТАРЕЯ ТЕСТОВ — серия специально подобран­ных для диагностики тестов, каждый из которых являет­ся самостоятельной методикой со своими диагностичес­кими характеристиками и возможностями. Обычно бата­реи тестов в дидактическом тестировании применяются при входном и итоговом контроле уровней подготовки по­ступающих или выпускников, а также при переходе уча­щихся с одной ступени обучения на другую. Возможно ис­пользование батареи тестов и в рубежном контроле для диагностики усвоения межпредметных связей.

Батарея — это не просто набор тестов. Их обычно объ­единяет не только общая диагностическая цель (напри­мер, отбор абитуриентов в вуз или распределение перво­классников по учебным группам на основе определения исходного уровня подготовленности к школе), но и общая система оценивания результатов. «Планка приёма» или «планка отсева» определяются по итогам тестирования по всей батарее, но с учётом минимально необходимого уров­ня достижений обследуемого по каждому из составляю­щих батарею тестов.

В системе многоэтапного контроля знаний дидакти­ческое тестирование (как компьютерное, так и традици­онное) является только одним из многих средств контро­ля из-за ограниченных возможностей современных ди­дактических тестов — выявления в основном репродук­тивного уровня знаний.

Творческие способности личности, ее психологичес­кий потенциал в обучении диагностируются другими ме­тодиками — психодиагностическими тестами, контроль­ными работами, исследовательскими заданиями, специ­ально разработанными лабораторно-практическими рабо­тами, углублённым индивидуальным и групповым собе­седованием или же профессионально разработанными ин-тегративными тестами обучаемости.

В определённой степени все дидактические тесты ди­агностируют психологические качества личности, кото­рые необходимы для выполнения интеллектуальных и сенсомоторных действий тестовых заданий. Этот «сопро­вождающий эффект» не является основной целью дидак­тического диагностирования (он связан с психологичес­кой валидностью тестов).

К сожалению, долгое время требования к диагности­ческим методикам в педагогике не разрабатывались. Од­нако психологи опередили педагогов на несколько лет, хотя их методология чаще всего вызывает нарекания.

Полупризнание дидактических тестов со стороны официальной педагогики уже состоялось. В последние го­ды даже в официальной документации, распространяе­мой Министерством образования Российской Федерации, приводятся конкретные примеры измерителей, в том чис­ле — дидактические тесты.

В этой книге мы пытаемся на основе своего и опубли­кованного исследовательского и диагностического опыта сформулировать и рассмотреть систему требований и про­цедуры создания и апробации эффективного дидактичес­кого теста. С нашей точки зрения любой дидактический тест, применяемый как диагностическое средство в учеб­ном заведении, должен быть прежде всего действенным. Эффективный диагностический тест — это стандартизи­рованная методика, тщательно научно-методически раз­работанная и проверенная на репрезентативной выборке с достаточно высокой надёжностью и валидностью.

Этот тест должен содержать как минимум назначение (диагностические цели и задачи в операциональных тер­минах конкретных действий); точные сведения об авто­рах-разработчиках; данные об особенностях и репрезен­тативности выборки контингента обследуемых, на кото­ром апробировался тест; краткое описание основных нор­мативов, критериальных оценок или получаемых при ап­робации результатов (по разным выборкам, если их было несколько); сведения о надёжности теста, о его валиднос-ти; инструкции диагносту по проведению процедуры тес­тирования, обработке данных и обследуемому.

Только такая характеристика теста может дать поль­зователю элементарные представления о диагностичес­кой ценности теста, о целесообразности и возможностях применения для ограниченных целей составляющих его субтестов или включения всего теста в состав каких-либо батарей.

При максимальной, полной, оптимальной стандартиза­ции в тест необходимо ввести данные об истории создания и модернизации теста, о корреляции между субтестами или их заданиями, о психологической валидности теста, его пе­дагогической валидности, результативности применяющих­ся на его основе коррекционных мер, а также информацию об очевидной валидности теста и типичных затруднениях, проблемах, с которыми встречаются диагносты-педагоги.

В современных диагностико-коррекционных про­граммах, куда в качестве составляющих элементов вхо­дят дидактические тесты углублённой диагностики, при­водятся обычно ещё и перечни типичных ошибок обследу­емых с указанием их причин и наиболее рациональных апробированных коррекционных мер. Инструкция педа­гогам-диагностам может быть дополнена рекомендация­ми по технике действий в типичных случаях несанкцио­нированного поведения обследуемых.

Компьютерный дидактический тест до сих пор не имеет своей научно обоснованной и общепризнанной ме­тодологии и технологии стандартизации. Она пока что яв­ляется предметом исследований. В этой книге мы рассмо­трим основные требования к их созданию (в том числе — с помощью ПЭВМ) и апробации.

В своей работе мы использовали анализ опыта тести­рования, описанный в научной и методической психоло­го-педагогической литературе, переработанного в соот­ветствии с методологией педагогической диагностики и ключевыми идеями современной дидактики; опытно-экс­периментальные данные, полученные в процессе созда­ния и стандартизации предметных (в основном бланко­вых) дидактических тестов в Ростовской области учите­лями — участниками творческих групп по разработке и апробации стандартов образования; обобщённый опыт со­здания компьютерных дидактических тестов в Бухарской лаборатории компьютеризации процесса обучения. При­водимые данные носят предварительный характер, про­должают уточняться и углубляться.

ЧАСТЬ ПЕРВАЯ
МЕТОДИКА РАЗРАБОТКИ ДИДАКТИЧЕСКИХ ТЕСТОВ


1. Основные направления разработки дидактических тестов
1,1. ПЕДАГОГИЧЕСКИЕ ТЕСТЫ КАК СРЕДСТВО ПОЛУЧЕНИЯ НАУЧНОЙ И МЕТОДОЛОГИЧЕСКОЙ ИНФОРМАЦИИ

Современное дидактическое тестирование имеет свою историю.

В 1896 г. американский психолог Дж.М. Кеттел при­менил тесты для изучения интеллектуальной подготов­ленности поступающих в учебное заведение [120], хотя для психодиагностики тесты начали использоваться анг­лийским психологом Ф. Гальтоном ещё раньше.

По мнению К. Ингенкамп, первыми тестами можно считать появившиеся в 1864 г. «scale books» (шкалиро­ванные книги) англичанина Джорджа Фамера и опубли­кованные в 1894 г. таблицы по проверке орфографичес­ких знаний учащихся американца Дж.М. Раиса [53, с. 13].

Последовавшее за открытием тестов как метода изме­рения в психологии и педагогике быстрое развитие психо­техники, педологии, экспериментальной педагогики вы­звало настоящий ажиотаж. Массовое использование тес­тов в практикее психодиагностики и школы происходило одновременно с интенсивным развитием не столько тео­рии, сколько технологии тестирования.

На Западе и в СССР в 20-30-х гг. главным стал праг­матический подход, основанный не на психолого-педаго-

гической теории, а на математической статистике, что имело свои плачевные последствия.

Если в США и несколько меньше — в Европе совер­шенствовались технологии создания тестов и математи­ческих методов их эмпирической проверки на надёж­ность, валидность, то в СССР во время режима сталиниз­ма тестология и педология рассматривались как буржуаз­ные извращения, что привело к свёртыванию исследова­ний [114] и как результат — к застою в эксперименталь­ной педагогике и психологии. Так, в 1935 г. в работе Б.Г. Ананьева «Психология педагогической оценки» в духе борьбы с педологией утверждалось, что «тестовый учёт успеваемости вреден и враждебен в связи с тем, что он притязает на научную достоверность и объективность; определение уровня успешности, отождествляемого часто с уровнем общего развития и одарённости; нивелирова­ние социальных, типологических и индивидуальных раз­личий; биологизаторское объяснение результатов как данных природного развития» [6, с. 66].

Однако в 60-е гг. в дидактику проникают тесты, хотя и через систему программированного обучения. Следует отметить, что тесты в общем-то использовались и во вре­мена сталинизма, но в виде «контрольных заданий», «са­мостоятельных работ», упражнений и т.п.

На Западе, особенно в США, по мнению исследовате­лей, тестирование глубоко пустило корни в американ­скую жизнь. Никто не может продолжать последователь­ное обучение в американских школах, не подвергаясь ча­стым испытаниям по стандартизированным тестам разно­го рода» [119]. Практически каждый второй выпускник средней школы за несколько месяцев до её окончания (ес­ли он желает дальше продолжить учёбу в каком-либо кол­ледже или университете) выполняет стандартизирован­ный общенациональный тест CAT, который даёт возмож­ность определить и самому учащемуся, и учившим его пе­дагогам уровень учебных достижений по сравнению со средними результатами по стране, по штату (а зачастую и по школьному округу, а также по сравнению с достиже­ниями предшествующих поколений учащихся этой же школы).

Сопоставление определённого тестом уровня этих до­стижений с требованиями колледжей, институтов и уни­верситетов позволяет каждому, прошедшему тест, реаль­но знать о своих возможностях получения той или иной высококвалифицированной профессии и выбрать то, что посильно (но юридически можно попытаться попасть и в самые престижные из них).

Диагностика учебных достижений, выявление спо­собностей и склонностей учащихся являются важнейши­ми задачами системы образования. В США в 1981 г. со­здан Национальный совет по стандартам образования и тестированию.

Традиционная система контроля знаний в 1970-1980 гг. резко критиковалась. В бывшем Советском Союзе развитие дидактической тестологии связано с работами Н.Ф. Талы­зиной по программированному обучению [148] и В.П. Бес­пал ько по проблемам педагогической технологии [22].

Отмечая, что учебные методы контроля пригодны для непосредственного общения учителя со школьниками на уроке по конкретным изучаемым на занятии вопросам, при проведении беседы, семинара, коллоквиума (как средство получения некоторой информации о текущем ус­воении материала), В.П. Беспалъко пишет, что «для оцен­ки качества знаний эти методы контроля не годятся, так как необходимые диагностичность, точность и воспроиз­водимость результатов в них не заложены». Аналогичны­ми недостатками страдают и обычные письменные кон­трольные работы. Поэтому необходима специальная раз­работка материалов тестов, ориентированных на уровни, решения тех или иных учебных задач [22, с. 58]. Сейчас такой подход разделяют многие педагоги. Однако боль­шинство исследований в этой области имеет прикладной характер. Именно поэтому данные интересных тестов оказываются трудносопоставимы из-за разнобоя в терми­нологии заданий, в подходах к построению тестов, в каче­стве их обоснования и эмпирической проверки.

Методологически слабая обеспеченность дидактичес­кого тестирования во многом определяется недостаточ­ной разработанностью и определённостью понятийного аппарата — постоянно смешиваются даже такие ключе­вые понятия, как «тест» и «тестовое задание», не конкре­тизирована терминология видов тестов и тестовых зада­ний. Кроме того, большинство педагогов-практиков не имеет представления о таких важных элементах обеспе­чения качества экспериментальной работы, как репре­зентативность выборки, надёжность, валидность.

Почти сорок терминов характеризуют различные ас­пекты валидизации методик, используются в научных публикациях весьма некорректно — то как параллель­ные, то как взаимоисключающие.

Подобная ситуация характерна не только для педаго­гики, но и других социальных наук.

Педагоги об одном и том же нередко говорят на раз­ных языках, вкладывая в понятия свои толкования или изобретая термины, которые никто, кроме автора, не по­нимает и не желает принимать. Это хорошо прослежива­ется по научным и научно-методическим публикациям.

Нарастает взаимонепонимание ученого-методиста и учителя-практика, в котором виноваты они оба — ученый в том, что, необоснованно, плохо раскрывая суть, вводит «заумную», с точки зрения практика, терминологию, а практик — в том, что даже и не пытается вникнуть в суть теории и понять значимость применения строгой терми­нологии, без которой трудно оценить результативность его работы.

Подобная ситуация весьма болезненно сказывается на любых инновациях и, естественно, — на внедрении в мас­совую школьную практику методологически обоснованно­го, профессионального дидактического тестирования.

В. современную педагогическую литературу, особен­но посвященную вопросам методологии педагогического исследования, тестирование «пробирается» с трудом — как будто такого метода вообще нет или о нём всем всё известно.

В учебниках педагогики уже почти шестьдесят лет о тестах ничего не говорится. В учебниках психологии о них вспоминают лишь мельком. Не лучше и научно-мето­дическая литература. В брошюре «Методика педагогичес­ких исследований» (под ред. д.п.н. Н.Р. Гайбуллаева. Ташкент, 1987) дидактические тесты как метод педагоги­ческого исследования (педагогической диагностики) не упоминаются [86]. Соответственно нет речи ни о валидно­сти, ни о надёжности методик. В качестве подобного при­мера можно привести брошюру Ю.В. Варданяна «Разра­ботка программы и методики педагогического исследова­ния» (Методические рекомендации. М-.: МГПИ им. В.И. Ленина, 1989). В ней также не нашлось места ни те­стам, ни проблемам проверки их надёжности и валиднос-ти [124].

Вероятно, сказывается многолетний негативизм офи­циальной советской педагогики по отношению к тестам, сочетающийся с традиционным невниманием к коррект­ности понятийного аппарата. Одним из типичнейших симптомов некорректности в использовании понятий яв­ляются эпизодически вспыхивающие на страницах жур­налов споры о том, что такое педагогика — наука или ис­кусство, аналогичные дискуссии о том, что старше — ку­рица или яйцо. И столь же плодотворные.

Под термином «тест» в советской психологопедагоги-ческой литературе до 1980-х гг. имелось в виду задание, с чётким и однозначным вариантом правильного ответа, ориентированным на определённые нормативы.

Классик советской психологии СЛ. Рубинштейн в 1938 г. дал следующее определение теста: «Тест — это ис­пытание, которое ставит своей целью градуирование, оп­ределение рангового места личности в группе или коллек­тиве, установление её уровня. Тест направлен на лич­ность, он должен служить средством диагноза и прогно­за» [130, с.27]. Его современник, один из основоположни­ков советской психотехники С.Г. Геллерштейн, писал: «Тест — это испытательный эксперимент, носящий ха­рактер определённого задания, которое стимулирует оп­ределённую форму активности и выполнение которого, поддаваясь количественной и качественной оценке, слу­жит симптомом совершенствования определённых функ­ций» [33, с.З].

Появление «критериально-ориентированных» тестов (по распространенной психологической терминологии) привело к значительному расширению объёма понятия «тест» (равно как и внедрение аппаратурных методик в профессиональную психологию и педагогику). То, что в технических науках и специальных отраслях медицины называется тестированием, при интеграции этих наук с педагогическими расширяет круг явлений, охватывае­мых устоявшимся понятием.

В значительной мере такая тенденция закономерна.

Исследователь педагогической терминологии И.М. Кантор отмечает, что «междисциплинарные внут­риотраслевые связи и отношения (в рамках обществен­ных или естественных наук) имеют своей основой объект­ную общность, что создает почву для содержательного об­мена понятиями. Существование объектной общности мо­жет послужить основанием и для межотраслевых отно­шений и.обменов, если эта общность имеет реальный на­учный смысл» [58, с. 128].

Далеко не однозначен и термин «дидактический тест»: как синонимы используются термины «педагоги­ческие (»учительские», «преподавательские») тесты», «тесты достижений», «тесты контроля знаний», «тесты умений и навыков», «учебные тесты», «контрольные тес­ты».

При этом разные авторы вкладывают своё (не всегда чётко определённое) понимание в эти термины. Напри­мер, у Ч. Куписевича «преподавательский тест» — это не-стандартизированные тесты, которые «могут быть состав­лены лицами, исследующими результаты учёбы, достиг­нутые на проведённых ими учебных занятиях» [68, с. 37]. В отечественной и переводной литературе, изданной до начала 90-х гг., автору удалось обнаружить около 20 ос­нований для типологизации тестов и тестовых заданий и более 30 терминов, характеризующих различные аспекты валидизации тестов. Таким образом, терминологическая анархия негативно сказывается на формирующуюся в на­ши дни педагогическую тестологию.

Такая ситуация для педагогики (как и других гума­нитарных наук) не нова, поскольку к некорректности по­нятийного аппарата сами педагоги давно привыкли (не­редко мотивируя это на «теоретическом» уровне тем, что педагогика не столько наука, сколько искусство), что во многом справедливо, однако это не должно мешать науч­ной части педагогики (и, в частности, диагностической гестологии) операционализировать свои понятия. Веро­ятно, надо создавать специальные терминологические словари.

Вопрос о необходимости тестов в педагогике давно уже позитивно решила практика — «да, нужны, но на своём месте, если они будут решать чётко определённый круг дидактико-диагностических задач». Особо нужны надёжные и валидные стандартизированные тесты, а не любительские самоделки.

От других способов контроля и оценки результатов учебного процесса тесты отличаются большей точностью и доступностью для измерения разнообразными количе­ственными методами. Но это возможно только в тех слу­чаях, когда тесты построены методологически и методи­чески грамотно, что на практике встречается далеко не всегда.

Тесты являются только одним из видов учебных заданий, используемых для контроля и диагностики знаний учащихся. Независимо от содержания и формы построения тестом можно считать только такую систему специально составленных заданий, решение которых имеет однозначные правильные ответы ли­бо чёткое описание (как минимум — на уровне ранго­вой шкалы) критериев интерпретации и оценки отве­тов (хотя бы как правильные — неправильные). Дале­ко не всякая задача может быть представлена в фор­ме теста.

В зарубежной педагогической и психологической ли­тературе тестами нередко называют то, что в бывшем СССР именовалось письменными контрольными работа­ми по общим для всех учащихся вопросам ранее изучен­ного материала.

Польский дидакт Ч. Куписевич считает, что отличие дидактического теста от письменной проверки в конце уррка знаний и умений всех учеников класса с помощью одних и тех же вопросов заключается в следующем: «включённые в дидактический тест вопросы являются вопросами замкнутыми, ограничивающими свободу отве­та ученика и состоящими или в дополнении имеющихся в тексте пробелов, или в выборе правильного ответа среди нескольких неполных или даже ошибочных» [68, с. 31].

Такое понимание дидактических тестов нам кажется ограниченным, ибо их виды и формы намного разнообраз­нее. Кажущаяся простота тестов — их построения, при­менения и анализа— во многом обманчива.

Тесты, при профессиональном конструировании и применении, экономят время педагога при проведении однообразных операций контроля знаний. Но ни в одной современной дидактической системе они не являются единственно верным средством контроля.

Следует, отметить, что тестирование и как метод ис­следования, и как метод диагностики имеет не только сто­ронников, но и противников. Противники тестирования считают, что тесты часто необъективны и неточно опреде­ляют то, что должны измерять; не могут фиксировать сложные знания и умения; требуют больших затрат вре­мени на их разработку и проверку, т.е. неэкономичны при контроле.

Недостатки используемых тестов вызвали критику тестирования как метода диагностики — критику не все­гда объективную, верную лишь в частных случаях.

Согласно сравнительной педагогике, «начиная с 1950-х гг. психологические основы тестирования и трех-типная шкала стали объектом жёсткой критики со сторо­ны многих педагогов и психологов. Английские педагоги­марксисты Б. Саймон, М. Левитас, К. Бенн и другие, ана­лизируя содержание тестов и практику их применения, приходят к следующим выводам:

  1. тесты не измеряют природный интеллект;

  1. в любом случае они являются тестами знаний и умений, полученных в школе, родительском доме;

  1. возможно «натаскивание» на выполнение тестов;

  1. отбор на основе тестирования ставит в невыгодное положение детей трудящихся.

Поскольку в зависимости от места расположения шко­лы (рабочий или привилегированный район) число учащих­ся, претендовавших на обучение в грамматической школе, могло быть разным, иногда один балл в оценке выполнения теста решал судьбу ребёнка в школе, в жизни. Эти выводы подтвердил известный английский психолог Ф. Верной, за* нимающийся вопросами одарённости» [133, с. 139].

Современная дидактическая тестология считает, что необъективность тестов зависит в основном от низкого ка­чества их разработки — если они сделаны наскоро, не проверены на надёжность и валидность.

Методология современного тестирования позволяет создавать надёжные и валидные дидактические тесты, ис­пользуя опыт психологов и социологов.

Сложные знания и умения отдельные тестовые зада­ния действительно не могут измерять. Но любое сложное задание можно, при определённой переработке, предста­вить в виде суммы более простых (например, в виде блоч­ных тестов).

Конечно, качественные потери бывают, однако луч­ше иметь неидеальные инструменты диагностики, чем не иметь их совсем.

Значительные затраты времени на разработку и стан­дартизацию тестов впоследствии окупаются их долговре­менным использованием эффективного и надёжного ин­струментария.

Диагностический потенциал тестов (в том числе ди­дактических), несмотря на столетие тестологии, до сих пор полностью не раскрыт. A.M. Арсеньев и Ф.Ф. Коро­лев, ведущие д ид акты послевоенного СССР, писали: «Сейчас важно не столько обогащение арсенала методов педагогических исследований, сколько выявление их на­учных возможностей» [66, с. 50].

По мнению болгарского дидакта И. Марева, с кото­рым мы согласны, «разработка и применение тестов для целей учебного процесса и дидактических исследований позволит не только устанавливать эмпирические соответ­ствия между условиями обучения и его результатами, но и открывать закономерности, которые после определён­ной модификации могут использоваться для широкого круга учебных дисциплин» [82, с. 94].

Существенные организационно-технологические трудности создания хороших тестов связаны с тем, что в настоящее время слишком мало публикаций по техноло­гии применения диагностических методик. Но они всё-таки есть. Так, в «Методике социально-педагогического исследования деятельности учителя» приводится бук­вально операционное описание технологии разработки, и проведения анкетного опроса, интервью с педагогами, контент-анализа, методики понятийного словаря [87]. Аналогичный опыт представления методик приводится и в других учебных пособиях [95; 34; 124]. Правда, это, ско­рее, исключение, чем правило.

Методологическая и технологическая разработка проблем дидактического тестирования — это потребность практики, её шанс стать технологичной и эффективной, уйти от субъективизма и непрофессионализма. Извест­ный теоретик дидактики И.Я. Лернер подчёркивает, что только при наличии диагностического инструментария возможна сверка цели и результата в образовании. «Сред­ства диагностики должны быть в распоряжении учителя и доступны для него» [82, с. 12].

Два основных, почти не пересекающихся подхода сложились в дидактической тестологии (ранее они были характерны и для психодиагностики).

Первый — эмпирический подход, когда тест создаёт­ся под конкретную диагностическую задачу без предвари­тельной концептуальной проработки. В СССР он был ха­рактерен для практики педологии (за что она справедли­во критиковалась своими же теоретиками — П.П. Блон-ским, СЛ. Выготским) и для прикладной социологии [11], а в 60-70-х гг. — для программированного контроля.

Эмпиризм долго господствовал и в западной гумани­тарной науке — не только в педагогике, но и в психоло­гии, социологии. «Ползучий эмпиризм», как его называ­ли ведущие советские и зарубежные методологи, про­явился и в бесконечном переборе заданий тестов с исполь­зованием развёрнутого (в основном факторного) матема­тического анализа и в терминологическом бессилии. Со­циологи отмечают, что «некоторые исследователи пред­лагают исходить из так называемой наличной обоснован­ности, т.е. обоснованности в понятиях использованной процедуры. Например, считают, что удовлетворённость работой — это то свойство, которое содержится в ответах на вопрос «Удовлетворены Ли вы работой?». В серьёзном социологическом исследовании, имеющем целью провер­ку некоторых теоретических гипотез, такой.сугубо эмпи­рический подход неприемлем» [123, с. 247].

Нечто подобное часто происходит при составлении те­стов. Естественно, это вызывало резкую негативную реак­цию, особенно в Советском Союзе с его исторически сло­жившимися (ещё с дореволюционных времён) философ-ско-психологическими традициями уважения к теории как основе методологии эксперимента.

Нельзя, однако, считать эмпирический подход бес­смысленным и бесплодным. При определённой ограни­ченности он стимулировал внедрение в психологию и пе­дагогику математических методов, проверку и анализ их возможностей. Кроме того, было найдено большинство (более полусотни) коэффициентов и индексов критери­альной валидизации, разработаны приёмы статистичес­кой обработки. Практика эмпиризма тесто логов убедила большинство (но далеко не всех) разработчиков и пользо­вателей в том, что математизация педагогического зна­ния и, в частности, дидактического тестирования должна иметь разумные пределы. Не случайно же А. Эйнштейн говорил: «С тех пор, как моей теорией относительности занялись математики, я перестал её понимать».

Другой подход в дидактической тестологии — теоре­тический — связан с философско-педагогическим анали­зом. В соответствии с этим подходом, методологическим по своей сути, дидактическое тестирование рассматрива­ется лишь как одно из средств контроля знаний и умений с ограниченной сферой применения.

Дидактическая тестология имеет право на самостоя­тельное существование как теория среднего ранга, сопод­чинённая:

а) теории дидактической диагностики (которая, в
свою очередь, является структурным компонентом тео-
рии педагогической диагностики);

б) теории дидактического контроля (в структуре об-
щей дидактики как отрасли педагогики);

в) теории измерений (общенаучной, в гуманитарных
науках, в педагогике и психологии).

Поэтому именно в такой системе иерархических на-уковедческих связей должна разрабатываться дидакти­ческая тестология в своём концептуальном аспекте (с по­стоянно пополняемым опытом диагностирования, обоб­щаемым в процессе концептуальных поисков).

Один из ведущих теоретиков социологии США Р. Мертон считает, что связь между рабочими гипотезами и всевключающими спекуляциями, охватывающими главную понятийную схему, происходит при посредстве теории среднего ранга. Примерами таких теорий в социо­логии являются теории социальной динамики, внутри-группового давления в малых группах с конфликтующи­ми интересами и т.п.

Методология — слабое место многих педагогических исследований и педагогической диагностики, особенно —-в решении вопросов репрезентативности выборок иссле­дований и обследований, в проверке надёжности и обеспе­чении валидности. Пока что оптимального взаимодейст­вия теоретиков и эмпириков в дидактической тестологии не сложилось. Хотя имеются интересные для теории ди­дактической тестологии высказывания лидеров педагоги­ки и педагогической психологии, а также огромный фак­тический материал, разнокачественный и слабо обобщён­ный на уровне эмпирических заключений.

Среди важнейших проблем теории дидактического тестирования следует выделить следующие:

а) цели тестирования (и соответствующая им типоло-
гизация тестов и тестовых заданий);

б) направления разработки дидактических тестов;

в) общеметодологические и общедидактические тре-
бования к тестам как методу дидактики и средству изме-
рения;

г) взаимосвязь диагностируемого содержания (знание
учебного материала, учебных действий, обучаемость) и
видов, форм тестов и тестовых заданий;

д) взаимосвязь дидактических тестов с другими диа-
гностическими методиками, их корреляция с традицион-
ными педагогическими средствами контроля знаний и
умений;

е) специфика бланкового и компьютерного тестирова-
ния при различных педагогических технологиях обуче-
ния (особенно — инновационных).

Рассмотрим некоторые основные положения теории дидактического тестирования.

Цели дидактического тестирования. Цель должна быть поставлена «настолько точно и определённо, чтобы можно было однозначно сделать заключение о степени ее реализации и построить вполне определённый дидактиче­ский процесс, гарантирующий её достижение за заданное время» [22, с. 30].

Как отмечает В.П. Беспалько, педагогическая цель поставлена диагностично, если соблюдены такие условия: точно описано формируемое личностное качество (чтобы его можно было безошибочно выделить среди других ка­честв личности), имеется надёжный инструментарий для однозначного выявления именно данного диагностируе­мого качества, имеется возможность измерения интен­сивности развития этого качества на основе используе­мых диагностических методик, а также обоснованная экспериментально шкала оценки качества [22, с. 32].

По мнению Н.Ф. Талызиной, контроль учебных до­стижений учащихся «должен быть проведён по всем ха­рактеристикам знаний и умений, которые предусмотре­ны целью обучения как в отношении вида психической деятельности — уровня памяти, мышления и т.д., так и в отношении их качеств — обобщённость, сознательность и т.д.» [149, с. 27].

Следовательно, ещё до составления теста должно быть чёткое представление об этих характеристиках зна­ний и умений в операциональных терминах ясно и иерар-хично сформулированных дидактических целей (в диа-гностичной их постановке). Иначе трудно понять, что же конкретно, на каком уровне глубины и широты нужно ди­агностировать с помощью теста и каким основным кон­кретным требованиям должен соответствовать тест (со­держательная его валидность). Задачи педагогической диагностики (и ее составной части — дидактической диа­гностики) намного объёмнее и шире задач дидактическо­го тестирования.

Педагогу-практику необходимо определить место ди­дактического тестирования в системе многоэтапного кон­троля, задача которого — обеспечить надёжную и опера­тивную обратную связь в педагогическом процессе.

В соответствии с целью управления обратная связь должна показать:

а) выполняется ли обучаемым именно то действие,
которое было запрограммировано;

б) правильно ли оно выполняется;

в) соответствует ли форма выполняемого действия за-
данной;

г) формируется ли действие с должной мерой обобще-
ния, свёрнутости, освоения автоматизированности, быст-
роты выполнения и пр. [148, с. 101].

Современный дидактический подход предполагает, с одной стороны, дополнение тестов другими методами контроля в тех случаях, когда они (другие методы) оказы­ваются диагностичными и более экономичными (с точки зрения затрат времени и средств на их реализацию).

С другой стороны, сами тесты должны органично впи­сываться в структуру педагогического процесса и стро­иться таким образом, чтобы способствовать повышению качества контроля, эффективности труда педагога и са­морегуляции учебной деятельности обследуемых.

Оптимальный дидактический тест — это тест, вклю­чённый в структуру диагностико-коррекционной про­граммы и построенный в расчёте на стимулирование са­морегуляции учащимся своей учебной деятельности.

В педагогической психодиагностике с 70-80-х гг. та­кой подход к разработке методик становится доминирую­щим.

Видный специалист в области педагогической психо­логии Д.Б. Эльконин пишет: «Мы предъявляем к диагно­стическим тестам, предназначенным для контроля за хо^-дом развития и коррекции, требование, чтобы они или моделировали учебную деятельность в целом, или служи­ли экспериментальными и абстрактными моделями от­дельных этапов той деятельности, которую осуществляет ученик на уроке». По его мнениьь, при конструировании методик диагностики в психолого-педагогических целях необходимо сближение процессов диагностики и форми­рования [172, с. 299].

В системе психологического тестирования это требо­вание формулируется как обеспечение конструктной пси­хологической валидности теста в сочетании с его концеп­туальным обоснованием (концептуальной, теоретической валидизацией).

В современной дидактике нет полного единства в по­нимании возможных и реальных целей дидактического тестирования, поскольку по-разному оцениваются воз­можности дидактических тестов как средства обеспече­ния эффективного многоаспектного контроля процесса обучения. В педагогической (и психолого-педагогичес­кой) литературе, в обыденном профессиональном созна­нии педагогов-практиков диапазон этих оценок весьма широк — от веры во всемогущество тестов до ограничения сферы дидактического тестирования узким кругом задач контроля воспроизводства заученного материала.

На наш взгляд, следует занимать среднюю позицию между этими крайностями. В. Оконь (Польша) выделяет четыре критерия разработки тестов в зависимости от це­лей обучения, поддающихся анализу с помощью дидакти­ческих тестов:

  1. знание фактов и взаимозависимости между ними;

  2. решение теоретических и практических проблем;

  3. 'самостоятельная оценка;

  4. самостоятельное применение знаний в новой ситу­ации.

Каждый из этих критериев может быть развит на том или ином изучаемом материале в более конкретные эмпи­рические индикаторы, признаки [106, с. 366]. Кроме то­го, в зависимости от цели дидактической диагностики оп­ределяется, какой объём тестирования необходим, каков охват тестом объёма и содержания диагностируемого ма­териала.

В.И. Михеев выделяет три основных направления ре­шения задачи построения педагогических тестов:

  1. Разработка методики построения тестовых кон­трольных работ (КР) для оценки качества знаний студен­тов определённой специальности:

а) в пределах тем (разделов) курсов;

б) по курсу (в семестре, учебном году);

в) для системы учебных курсов.

  1. Для оценки системы качеств знаний студентов оп­ределённой специальности (по рассматриваемому набору качества знаний и их интегративным признакам).

  2. Подготовка единой методики оценки знаний сту­дентов в вузе и реализация её на ЭВМ [95, с. 143].

По данным практики, цели и масштаб (охват, объём) тестирования не являются нейтральными характеристика­ми для формирования структуры теста и типологии его за­даний. К сожалению, этот вопрос в дидактической тестоло­гии мало исследован (как и многие другие), а высказыва­ния авторов педагогических работ по этому поводу чаще всего связаны с их личным опытом и интуицией, а не с экс­периментальными, корректно поставленными исследова­ниями. Надо сказать, что существует достаточно высокая корреляция между целями тестирования, его масштабами и оптимальностью различного типа тестовых заданий для субтестов и тестов. Задания разного типа могут оказаться максимально эффективными по своим диагностическим и развивающим (тренинговым) возможностям в тестах с оп­ределённой (какой — надо установить) целевой направлен­ностью, масштабом и уровнем контролирующих функций. И, наоборот, малопродуктивными в каких-то (каких?) тес­тах других типов. Тем самым следует целесообразно диф­ференцировать типы тестовых заданий в соответствии с ещё не определёнными (какими — предстоит выявить в экспериментах) существенными характеристиками тестов.

В любом случае, приступая к дидактическому тести­рованию, разработчику надо учитывать, что решение уча­щимися некоторых задач не поддаётся надёжному тесто­вому контролю (по крайней мере, с помощью распростра­нённых в массовой практике видов нормативных дидак­тических тестов). Многое здесь зависит от того, как трак­туется обратная связь педагога и учащегося, насколько разносторонней она должна быть для обоснованного педа­гогического вывода о хорошей или плохой успешности обучения школьника.

Н.Ф. Талызина, отмечая, что учёт обратной связи нельзя вести только по безошибочности ответа учащего­ся, считает целесообразным вводить такие параметры об­ратной связи, как проявление творчества при решении за­дач, понимание материала и точность его усвоения. На уровне эмпирических индикаторов и привязанных к ним критериальных оценок эти параметры должны способст­вовать выявлению различных степеней (уровней) усвое­ния материала [149].

Большинство задач творческого характера с трудом поддаётся алгоритмизации. Тем не менее алгоритмы творчества исследуются и разрабатываются. Однако ин­туитивные элементы творческого поиска всё равно явля­ются самым сложным моментом диагностического оцени­вания, особенно при массовом стандартизированном кон­троле.

В современной педагогической диагностике домини­рующим подходом становится не создание отдельных тес­тов или их батарей, а разработка контролирующе-коррек-тирующих диагностических программ (в том числе — компьютерных).

Составителям надо создавать такие программы, что­бы тестирование позволяло не только определить наличие или отсутствие правильных ответов учащихся на тесто­вые задания, Hd и выявить причины мотивации ошибоч­ных ответов. Это позволит учащемуся освоить недоучен­ный учебный материал.

Цель педагога — не поймать учащегося на незнании, а помочь ему в адекватной самооценке уровня своих зна­ний и ликвидации пробелов.

При разработке современных компьютерных диагно-стико-обучающих и диагностико-коррекционных про­грамм накопленный в 60-70-х гг. опыт программирован­ного обучения представляется особо ценным. По мнению Н.Ф. Талызиной, обучающая программа должна вклю­чать способ организации познавательной деятельности, в процессе обучения за ней необходим контроль.

Такой подход соответствует гуманистической направ­ленности нового педагогического мышления на индиви­дуализацию обучения, ибо в этом случае программа реа­лизует принцип поэтапной углубляющейся диагностики (от симптоматической — к этиологической и типологиче­ской).
СПЕЦИФИКА КОМПЬЮТЕРНОГО ТЕСТИРОВАНИЯ
Первоначально результаты учебной работы проходи­ли статистическую обработку на ЭВМ, в настоящее время компьютеризация образования связана с созданием АОС (автоматизированных обучающих систем различной сте­пени сложности и масштабности), построенным на муль­тимедийных технологиях — в том числе «виртуальной реальности».

«Виртуальная реальность» позволяет с помощью компьютера, телевидения и видеотехники «погружать» обучаемого в ситуацию, близкую к реальности, с эффек­том присутствия и возможностью имитационного модели­рования поведения.

Компьютеризация обучения увеличивает первона­чальные затраты на обучение, требует профессиональной компьютерной подготовки педагогов и учащихся хотя бы на уровне пользователя, требует качественной перестрой­ки всей системы обучения и контроля, снижает субъекти­визм в обучении и контроле знаний, умений и навыков учащихся, позволяет учителю производить более глубо­кий диагностический анализ, индивидуализирует (при соответствующей постановке) темп и уровень процесса ус­воения и закрепления учебного материала, активизируя саморегуляцию и самоуправление учащегося — качества, чрезвычайно важные для современного конкурентоспо­собного специалиста [82; 83; 158].

Безусловно, и техническая, и программно-методичес­кая обеспеченность учебного заведения, и качественный уровень педагогов и обучающихся определяют степень и результативность компьютеризации учебного процесса. В любом случае она немыслима без диагностической состав­ляющей.

Компьютерное тестирование (а в более широком ди­дактическом плане — компьютерные диагностико-кор-рекционные и обучающе-диагностические программы) существенно расширило возможности углублённой ди­дактической диагностики. Но при этом оно не в состоя­нии, на наш взгляд, в ближайшее время решить все про­блемы педагогического диагностирования.

По всей видимости, реальные возможности компью­терного тестирования на современном этапе развития компьютерной техники и программирования ограничива­ются теми (очень нечёткими) пределами, в каких дидак­тика является наукой. То есть логически целостной сис­темой, поддающейся алгоритмизации.

Не исключено, что открытие «хаотической логики» в программировании вскоре раздвинет эти пределы за счёт решения ряда пограничных проблем между алгоритмизи­рованными действиями и творческими решениями. Одна­ко интуитивная сфера принятия решений вряд ли в своих глубинных проявлениях, где педагогика становится ис­кусством, может быть компьютеризирована.

Диагностическое распознавание ошибок учащихся (по крайней мере — типичных) не только доступно ком­пьютерной диагностике, но при многопараметровой ха­рактеристике возможных видов и причин ошибок может оказаться более экономичным, информативным, надёж­ным и оперативным. Персональные компьютеры пре­красно контролируют знания с помощью многоуровне­вых программ, позволяющих применять тесты с широ­ким использованием различных видов наглядности (вплоть до кино и телефрагментов).

Уже имеются программы, требующие от учащегося конструктивных действий — построения и корректиров­ки заданных формул, графиков, текстовых материалов — вплоть до выполнения сочинений, ответов на открытые вопросы сложных дидактических опросников и анкет.

Компьютер позволяет использовать все типы тесто­вых заданий, что повышает методические и диагностичес­кий уровни программы, преодолевает однообразие тести­рования, делает его более интересным для обследуемого.

Большие формирующие и диагностические возмож­ности имеют диалоговые игровые программы, с помощью которых в занимательной форме можно получить знания из конкретных предметных и межпредметных сфер, а также определённые учебные умения и навыки (письма, счёта, графики, концентрации и распределения внима­ния, использования оперативной памяти и т.п., а также Умения и навыки владения клавиатурой дисплея, работы с периферийными устройствами).

В психодиагностике «различают два типа компьютер­ных психодиагностических метода — специально создан­ные в компьютерном режиме и перенесённые из традици­онной безмашинной психодиагностической практики». О.Н. Арестова считает, что необходимо определить новое качество методик во втором случае — как изменяются при этом их содержательная валидность, диагностичес­кая направленность и «разрешающая способность». По ее мнению, «на валидность методики при её автоматизации могут влиять не только свойства методической процеду­ры, связанные с особенностями представления стимуль-ного материала, но и главным образом те её свойства, ко­торые связаны с диалогическим «межличностным» взаи­модействием между «экспериментатором» — ЭВМ и ис­пытуемым» [14, с. 88]. Проверка методики анализа уров­ня притязаний (на небольшой выборке — 22 чел.) прошла на ЭВМ СММ.

Было отмечено, что применение ЭВМ больше побужда­ет испытуемых к самостоятельности, чем присутствие экс­периментатора, и повышает диагностическую ценность ре­зультата, позволяет судить об индивидуальных особеннос­тях стратегии деятельности испытуемого, «снижает влия­ние личностных особенностей экспериментатора и случай­ных поведенческих факторов на стратегию испытуемого, даёт возможность сравнить экспериментальные данные, полученные разными исследователями». При этом испы­туемые демонстрируют более разнообразные стили целепо-лагания, параметры их деятельности существенно разли­чаются. О.Н. Арестова пишет, что «в ситуации компьютер­ного эксперимента преобладают присущие субъекту инди­видуально-личностные формы мотивации, нивелирующи­еся в присутствии экспериментатора-психолога».

Качество большинства учебных общеобразователь­ных игровых программ профессиональными программис­тами оценивается как невысокое, хотя есть возможность его улучшения.

У современных ПЭВМ массового производства с мно­гоцветными дисплеями, достаточно разнообразной гра­фикой и звуковым сопровождением (в более дорогих — синтезирование звука) имеются богатые возможности подкрепления в процессе диагностики и коррекции моти­вации обследуемого в лучших традициях репетиторства и хорошего программированного обучения. Последнее, на наш взгляд, отнюдь не изжило себя — просто на него про­шла мода. Ныне с помощью компьютера можно реализо­вать самые смелые идеи программированного обучения, которые было трудно осуществлять на примитивных тех­нических устройствах.

Подкрепление и углублённый анализ ошибок необхо­димы в компьютерных тестах, входящих в АОС — авто­матизированные системы обучения с возможностями адаптации к уровню подготовленности учащегося, его ин­дивидуальному стилю и темпу обучения, сочетающие констатирующую и корректирующую функции диагнос­тики. Обе эти функции закладываются в систему тестовой проверки результатов работы учащихся с АОС (независи­мо от типа используемых ПЭВМ и уровня программно-ме­тодических средств). В цикл автоматизированного учеб­ного курса включается шаг тестовой проверки исходного уровня, шаг рубежной проверки и итоговый контроль [132, с. 84].

В связи с внедрением в процесс обучения новых тех­нологий, особенно успешным в системе профессионально­го образования, встаёт вопрос о диагностических аспек­тах использования активных методов обучения — особен­но таких, как имитационные упражнения, анализ ситуа­ций (которые всё более компьютеризируются). В дидак­тическом плане задача педагогов-методистов — перевести задания деловых игр и имитационных упражнений в тес­товую форму, выстроить их по чётким диагностическим критериям.

Проблемы технологии дидактического тестирования постепенно становятся главными в современной дидактике.

В течение полутора десятков лет массовое распрост­ранение быстродействующих и сравнительно недорогих ПЭВМ привело к пересмотру взглядов педагогов на ком­пьютер. Расширяется диапазон позитивных оценок воз­можностей компьютера в учебном процессе — от восприя­тия его как большого арифмометра, способного лишь бы­стрее просчитать четвертные оценки (или другую школь­ную статистику) до попыток его использования как рабо­чего инструмента педагога-методиста и квалифицирован­ного, надёжного репетитора и диагноста.

Появление «ноутбуков» — портативных ПЭВМ с до­статочно разнообразными для обучения характеристика­ми и приличным объёмом памяти — расширяет возмож­ности компьютеризации обучения и контроля. Компью­терный контроль выносится за пределы стационарного дисплейного класса, «ноутбуки» способствуют более ди­намичному и индивидуализированному планированию организации (и самоорганизации) учебного процесса. Со­ответственно более разнообразными, сложными, вариа­тивными становятся и проблемы технологии компьютер­ного дидактического тестирования.

Однако как исключить при самостоятельной работе учащегося дома на «ноутбуке» возможную его недобросо­вестность, школярские попытки обмануть диагноста или программу? Запретить использовать переносные компью­теры — не метод обеспечения качества контроля.

На наш взгляд, проблема вполне разрешима.

Потерянные неблагодарные функции внешнего кон­тролёра должны для педагога компенсироваться качест­вом разработки ППС. Это перспективная проблема, с ко­торой уже сегодня могут столкнуться частные (альтерна­тивные) учебные заведения, а в будущем — и государст­венные. Решать её всё равно придётся и с позиций общей и дидактической тестологии, и с позиций компьютерной дидактической тестологии.

Чудом компьютеризации является открытие «вирту­альной реальности». Сочетание возможностей видеотех­ники, компьютерной графики и тренажёрных компью­терных устройств с более мощными и быстродейственны-ми дисплейными классами — это проблема создания но­вого типа комплексных дидактических тестов и диагнос­тико-коррекционных программ для интегративного, мно­гоаспектного контроля качества профессионального обу­чения. По своему типу это будут качественно иные тесты действия.

Тесты действия имеют пока ограниченное использо­вание в бланковом дидактическом тестировании и связа­ны более с тренажёрами, учебным и типовым оборудова­нием. Они могут структурно усложняться, сочетая в себе наиболее выигрышные в дидактическом плане свойства других видов тестов. Очевидно, придётся критически пе­ресматривать и некоторые классические аксиомы тести­рования, выработанные в своё время в рамках психодиаг­ностики и зачастую автоматически перенесённые в сферу дидактического тестирования. Это и вопросы оптималь­ной трудности тестов, их сложности, сбалансированности заданий, вопросы количества и характера дистракторов в тесте (отвлекающих от эталона вариантов ответов), и ва-леологические аспекты диагностики, которые уже начи­нают исследоваться. Среди них — вопросы психофизиче­ской цены, которую придётся платить учащимся за стремление педагогов к более качественному контролю результатов обучения — вряд ли во многих случаях она окажется целесообразной.

Тенденция к углублению методик в практической психодиагностике ведёт к их значительному усложне­нию.

Болгарский дидакт И. Марев справедливо отмечает, что «метрический подход при определении результатов обучения и состояния каждого обучаемого по окончании им данного курса может быть полноценным и объектив­ным при условии учёта не только подготовки, которую показал обучаемый, но и способностей и задатков, кото­рыми он обладает и которые в значительной степени опре­деляют ход учебного процесса. Здесь речь идёт о пробле­матике, связанной не только с обученностью, но и с обуча­емостью, не только с воспитанностью, но и с воспитуемо-стью. Это означает, что если мы хотим не только выста­вить оценку учащимся, но и исследовать эффективность
2-2976

используемых методик обучения, продуктивность соот­ветствующего педагога или обучающей системы, мы должны точно учитывать все участвующие в дидактичес­ком процессе факторы» [82, с. 93].

Наиболее актуальными проблемами дидактической тестологии (и, в частности, компьютерного дидактическо­го тестирования) являются проблемы качественной и ор­ганизационной интеграции педагогической диагностики и психодиагностики в решении вопросов полноценного контроля общеобразовательной и профессиональной под­готовки с позиций дидактики развивающего обучения.

Этот круг проблем можно обозначить как психодиаг­ностическое сопровождение компьютерного дидактичес­кого тестирования. Их осознание связано с пониманием ограниченности чисто методического или чисто психоло­гического подхода к тестированию в сложной по своей структуре и сущности сфере образования.

Так, в США ведущие педагоги предлагают внести су­щественные изменения в сложившуюся практику педаго­гического тестирования, к числу которым относятся:

  1. исследование характерных ошибок в тестах с мно­жественным выбором, для того чтобы знать, что придётся корректировать;

  2. развитие стратегий тестирования, соответствую­щих различным стилям обучения;

  3. использование оценки в качестве формирующего (а не результатирующего) инструмента и новых методов оценивания;

4) включение в сферу тестирования установок,
чувств, впечатлений и т.д.;

  1. расширение форматов ответов за пределы закон­ченных;

  2. систематическая запись и анализ образцов учени­ческих работ. В диагностике и коррекции максимально использовать компьютеры [146, с. 216-217].

Это перспективное направление педагогической диа­гностики развивается активно, но односторонне. В отли­чие от «программного» аспекта методологические не раз­работаны как в дидактическом (нет единой классифика­ции, некорректен понятийный аппарат и л р.), так и в пси­хологическом плане.

Особый интерес в методологическом плане представ­ляют для компьютерного тестирования исследования в области математической психологии и математического моделирования в педагогике. Методики математического моделирования и описания научения могут найти приме­нение при создании адаптивных компьютерных диагнос-тико-корректирующих программ.

При разработке компьютерного теста (тем более — компьютерной диагностико-обучающе-коррекционной программы) порою «всплывают» весьма существенные «поправки», непривычные для педагогического экспери­мента.

Психологи отмечают, что при компьютеризации экс­перимента «возникла необходимость нового стиля конст­руирования психологической методики, предназначен­ной для реализации на компьютере». Нельзя было вос­пользоваться интуитивным планом эксперимента — ина­че замысел не мог быть превращен в адекватную програм­му для ЭВМ. Особенно это стало важным при переходе к диалоговым системам общения ЭВМ с испытуемым и вне­дрением адекватного эксперимента, при котором страте­гия исследования менялась в зависимости от полученных предшествующих результатов [14, с. 87].

В дидактическом компьютерном тестировании адап­тивная стратегия представляется оптимальной. Тем бо­лее что она полностью соответствует современным требо­ваниям гуманистической педагогики о бесстрессовом обучении.

Попытки создавать самостоятельно компьютерные тесты (в первую очередь для текущего контроля) все чаще предпринимаются учителями, особенно в эксперимен­тальных школах. Педагоги считают, что при компьютер­ном тестировании достигаются хорошие результаты про­верки обучения: «На этапе контроля знаний использова­лась многовариантная программа тестов, что обеспечива­ло полную самостоятельность учащихся и объективное выяснение уровня усвоения и владения материалом» (выделено мною. — Авт.) [92, с. 23]. Но поскольку ника­ких сведений о качестве составленных тестов, их эмпири­ческом анализе в публикации не приводится, объектив­ность их остаётся проблематичной.

Работая с группой Ш. Норова и Т. Ниязханова в Бу­харском технологическом институте пищевой и лёгкой промышленности (лаборатория компьютеризации обуче­ния ГКНТ Республики Узбекистан), мы определили не­сколько проблем психодиагностического сопровождения компьютерного дидактического тестирования: «входно­го» психодиагностического контроля; «поправок» на осо­бенности поведения обследуемых в работе с компьютер­ными контролирующими программами, построенными по разным принципам; проблем, связанных с личностной позицией обследуемого и составителей тестов, а также с психологией разработчиков и психодиагностическими ас­пектами процедур стандартизации компьютерного тести­рования.

Кроме того, есть проблемы интеграции сложившего­ся понятийного аппарата психодиагностики и компью­терного дидактического тестирования (пополнение, кор­ректировка, операционализация и др.). Общенаучная, по сути дела, терминология тестирования психологизирова­на, поскольку заимствуется в основном из эксперимен­тальной психологии. Однако ее нельзя назвать идеальной из-за некорректности употребления понятий, обилия тер­минов.

Сейчас на очереди — компьютерная «виртуальная ре­альность», связанная с возможностями синхронного ис­пользования видеотехники, создания тренажёров с эф­фектом присутствия, записи и воспроизведением микро­движений и т.п. [81].

Для того чтобы в системе современных российских средств контроля учебных достижений полностью ис­пользовалось тестирование, надо, чтобы разработкой и особенно апробацией тестов занимались педагоги-практи­ки всех видов учебных заведений. Необходимо организа­ционное и методическое обеспечение учебного процесса качественным диагностическим инструментарием; пред­стоит более или менее плавный переход с бланкового на компьютерное тестирование (при опережающей методо­логической разработке его технологии).

Развитие дидактической тестологии — с учётом на­копленного мирового педагогического и психологическо­го опыта, с ориентацией на современную компьютерную видеотехнику — призвано решить комплекс дидактичес­ких задач оперативного, объективного и качественного контроля в век новых информационных технологий.
  1   2   3   4   5   6   7   8   9   ...   18


Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации