В 2017 году крупнейшее американское издательство Шпрингер, зарекомендовавшее себя лояльными партнерскими отношениями с авторами, опубликовало коллективную монографию, название которой можно перевести как «Стандартизация образования: страны Северной Европы в международной перспективе». Эта книга является живым свидетельством того, насколько непродуманно европейские страны на сегодняшний день проводят национальную политику в области науки и образования на общегосударственном и муниципальном уровнях, что находит своё выражение в низких показателях успеваемости в общеобразовательных учреждениях.
Исследование нацелено на формирование широкого и полноценного понимания подходов к оцениванию данных об успеваемости учащихся на фоне динамично меняющихся инновационных механизмов и концепций по развитию компетенций и навыков в образовательных учреждениях во всём мире. Идея стандартизации образования, по убеждению авторов, должна стать востребованной в каждой школе, поскольку результаты национальных тестирований при наличии обратной связи позволят выявить и вовремя устранить все изъяны в учебном процессе, поспособствуют улучшению качества преподавания и эффективному освоению образовательных программ учащимися.
Редакторы коллективной монографии — Зигрид Блёмеке и Ян-Эрик Густафссон — собрали воедино научные разработки последних лет, обязанные своим появлением плеяде учёных из Германии, Великобритании и стран Скандинавии, специалистам в области измерения и оценивания результатов образовательной деятельности. Благодаря наличию академического и личного педагогического опыта исследователи активно дискуссируют по поводу существующих форматов и содержания стандартизованных тестов для учащихся школ, качественных и квантитативных методов обработки тестовой информации и интерпретации полученных данных.
Научная сфера деятельности Зигрид Блёмеке, профессора философского факультета Университета имени Гумбольдта, в основном связана с прикладными исследованиями по вопросу соотношения профессиональных компетенций и их эффективности, прежде всего, у выпускников высших учебных заведений. Исследователь отдаёт предпочтение статистическим методам работы с информацией, но не исключает и обращение к латентно-классовому анализу в случае необходимости. С 2014 года по совместительству она также является директором Центра измерений в области образования. Исследования профессора педагогических наук Гётеборгского университета и Университета Осло Яна-Эрика Густафссона направлены на изучение проблем педагогической психологии и разработку моделей развития познавательных способностей человека. Кроме того, учёный вносит вклад в развитие количественной методологии, а также совсем недавно возглавлял правительственную комиссию по развитию школьного образования в Швеции.
Во введении авторы считают необходимым показать актуальность изучения проблемы разработки стандартов в области образования. Прежде всего, определение контрольных показателей на разных уровнях успеваемости позволяет выявить сильные и слабые стороны в системе школьного образования, повысить качество преподавания и обучаемости благодаря наличию обратной связи между структурами, формирующими политику и образовательными учреждениями. Авторы указывают на неотъемлемость критериев надежности (релиабильности) и валидности в стандартизации образования, в случае же их игнорирования образовательная политика сталкивается с проблемой произвольного оценивания и, в результате, искажённой интерпретацией успеваемости некоторых учащихся.
За рубежом существует давняя традиция методологических исследований по установлению и применению стандартов в образовании, особенно в США. Примечательно, что эксперты приняли решение рассмотреть проблемные вопросы на примере стран Северной Европы, где, по их мнению, уделяется недостаточно внимания разработкам в данной области. Тем временем число национальных тестов в регионе ежегодно растёт, затрачивается большое количество времени и сил на составление и написание тестов при отсутствии как такового режима обратной связи. Центральное место в политической повестке дня занимает вопрос о поиске путей сглаживания серьезных проблем, вызревающих вследствие непродуманной стандартизации, например, нежелательных тенденций в педагогической практике.
По структуре своего содержания книга делится на три раздела. Коллектив авторов сосредоточивает внимание, главным образом, на методах оценивания результатов обучения и реализации системы оценивания, в частности рассматривает процедуры формативного и суммативного оценивания. Ссылаясь на множество исследований предшествующих лет, авторы представляют сугубо теоретизированный материал с аналитическими компонентами, что позволяет определить вызовы современной системе образования.
Во-первых, сегодня происходит дальнейшая децентрализация образования, что отражается на качестве образования, ведь оно в свою очередь находится в большой зависимости от решений муниципальных властей (например, муниципалитеты управляют 96% общеобразовательных школ в Финляндии). Во-вторых, выяснилось, что результаты национальных тестирований не являются востребованными среди школьных учителей как инструмент для совершенствования педагогической практики, что связано с разным характером ожиданий преподавателей, с одной стороны, и представителей государственной власти — с другой. В-третьих, наблюдается рост напряжённости по ряду вопросов, связанных с практикой оценивания между локальными сообществами (local communities of assessment practice) и общенациональными риторическими сообществами (nation-wide rhetorical community of assessment practice). В-четвёртых, немало внимания уделяется теме повышения цифровой компетенции учащихся и связанной с ней проблеме цифровой безопасности.
В первой главе представлен пласт информации из серии университетских учебников по методологии, однако, на более продвинутом уровне. Авторы достаточно ёмко суммируют опыт предыдущих работ по интересующей тематике, приводят свои точки зрения относительно традиционных методов установления стандартов и, можно сказать, перекидывают мостик к третьей главе книги, где речь идёт о внедрении новых методик.
Весьма необычным является замысел авторов, по которому вначале приводятся общие характеристики, которым должны соответствовать разработанные стандарты, затем подробнейшим образом освещаются традиционные методы стандартизации (метод Ангоффа, метод закладок, анализ матричных данных) и, наконец, в четвёртом разделе первой главы даётся определение, что собственно под стандартизацией следует понимать. Так, исследователи из Университета Гумбольдта Ханс Ананд Пант и Петра Станат трактуют процесс стандартизации как преобразование политических решений по установлению образовательных стандартов или критериев тестового прохождения в результате процедуры, определяемой экспертным суждением, интересами заинтересованных сторон и технической экспертизой.
Представляет определённый интерес интерполяция сюжета о результатах политики стандартизации образования в Германии. Авторы выявляют несоответствие целей национального тестирования (VERA) реальным достижениям. Так, несмотря на привлечение всех школ к обязательному участию в оценивании учеников третьих и восьмых классов в масштабах всего государства, результаты тестирования не вызвали никакой контрольной реакции или замечаний в адрес испытуемых. Более того, администрация ни одной из шестнадцати земель Германии не предоставила никаких рекомендаций учителям и директорам школ относительно того, как наилучшим образом преобразовать результаты в соответствующие учебные и организационные мероприятия. Как показывает практика, немецкие преподаватели в большинстве своём очень сдержанно относятся к эффективности государственного тестирования.
Наконец, авторы предпоследней части главы — норвежские исследователи Рольф Вегар Олсен и Труде Нильсен — анализируют международные тестовые исследования PISA и TIMSS, однако, предметом дискуссии являются отнюдь не сами результаты исследований, необходимые для управления качеством образования. Авторы ставят перед собой задачу выявить сходства и различия того, как исследования PISA и TIMSS устанавливают и в каком формате репрезентуют результаты измерений.
Авторы приходят к выводу, что в основу PISA заложена целевая установка на будущее, направленная на выявление необходимых знаний и компетенций для дальнейших исследований, карьеры и жизни в обществе в целом. TIMSS же стремится изучить учебный процесс с точки зрения его эффективности в рамках школьных классов, TIMSS не занимается отбором лучших и отсеиванием менее успешных учеников (как PISA), исследование не выходит за пределы школьной учебной программы. В дополнение к сравнительному обзору PISA и TIMSS авторы иллюстрируют недооцененную область процесса стандартизации, а именно природу и эмпирическую основу для выявления показателей уровня подготовленности (PLD).
Вторая глава посвящена процессу внедрения стандартов в национальные системы образования Дании, Швеции, Норвегии и Финляндии, что опять же могло бы выглядеть как сухое переложение фактов на канву истории, если бы не претворённые в жизнь исследовательские проекты как свидетельства позитивных и негативных тенденций в школьном образовании (например, проект «Стандарты как инструмент преподавания и оценивания письма» (NORMs project)). Более того, каждая часть главы завершается дискуссией, где эксперты, оперируя данными статистики, справедливо судят о неэффективности национальных тестов среди учащихся школ в небольших населённых пунктах по сравнению с крупными муниципалитетами.
Тон дискуссии задаёт профессор Гётеборгского университета Гудрун Эриксон, которая делится своими наблюдениями в области развития шведской системы школьного образования, указывая на отсутствие у шведов как таковой традиции установления образовательных стандартов. Частично это объясняется тем, что на протяжении долгого времени преподаватели выполняли единственную самостоятельную роль в присуждении оценок учащимся, при этом было низведено до минимума определяющее значение обязательных экзаменов.
По словам исследователя, если сравнивать результаты национального тестирования и оценки, выставленные ученикам школьным учителем, то последние оказываются явно завышенными и отличаются большей стабильностью. В результате, нестабильность тестовых оценок приводит к низкой надёжности тестов.
Эта проблема шведского общества до недавнего времени оставалась без внимания экспертов: в марте 2016 года был опубликован двухтомный отчёт (800 страниц) под названием «Эквивалентная, справедливая и эффективная — новая система национального оценивания» («Equivalent, fair and efficient — a new system for national assessment»). В исследовании была предложена общая структура всех национальных тестовых испытаний, которая включала обязательное тестирование, методические материалы по национальному тестированию и систему оценивания.
Автор другой части главы — руководитель исследовательского проекта в Университете Умео Анна Линд Пантзаре — ставит вопрос о целесообразности использования национальных тестов при оценивании успеваемости учащихся. По мнению исследователя, может показаться абсолютно неестественным, что разработчики тестов в Швеции должны быть проинформированы о проходных баллах каждого уровня непосредственно перед тем, как ученики проходят тестирование. В данном случае исключается возможность внесения балльных корректировок после написания тестов. В других же странах проходные баллы устанавливаются после тщательного анализа результатов тестирования.
Примечательно, что исследователи Хельсинкского университета Мари-Паулиина Вайникайнен, Юкка Маръянен, Яркко Хаутамяки, Сиркку Купиайнен и Ристо Хотулайнен изучают схожие болезни финской системы школьного образования, говорят о несложившейся практике стандартизации и наличии единственно возможной интерпретации результатов освоения программы учащимися со стороны школьного учителя, поскольку в Финляндии проводится незначительное число контролируемых кем-либо тестирований.
Тем не менее, авторы создают положительный ореол своей школьной системе, подчёркивая, что сегрегация в финских школах остаётся наименьшей по сравнению с другими странами Северной Европы. На мой взгляд, именно это позволяет рассматривать идею инклюзивного образования в наиболее полном её проявлении. Справедливо заметить, что достижением последних лет является реализация трёхступенчатой модели поддержки инклюзивного образования в соответствии с Законом «О базовом образовании».
Наиболее детализированным представляется исследование проблем стандартизации образования в Норвегии. Кандидат социологических наук Идунн Селенд и доктор философии Элизабет Ховдхауген показывают, как изменялись приоритеты в норвежской системе образования. Так, в 1970-е гг. успеваемость учащихся была второстепенной по отношению к содержанию программы образования, а с конца 1980-х гг. фокус сместился с образовательных ресурсов к результатам освоения образовательных программ. Весьма интересно, что эволюция политики образования с учётом его реформирования в 2006 году не приводит к конкретизации целей национальных учебных программ.
Следует добавить, что сама по себе процедура внедрения национального тестирования (начиная с 2004 года) в систему образования в Норвегии вызвала череду протестов со стороны учителей и академических учёных. До сих пор существует проблема проведения тестирования в малонаселённых местностях (менее 3000 жителей проживает на территории каждого из 40% муниципалитетов страны), где результаты национальных испытаний могли бы составить карту для индивидуализации обучения в будущем, однако, это не является перспективным для развития общего школьного образования.
Наконец, проблема обучения мигрантов является актуальным вызовом для стандартизации образования. Надо признать, что в Норвегии были достигнуты определённые результаты: норвежские исследователи Эли Мо и Норман Верхельст сообщают о проделанной работе Норвежского агентства по обеспечению непрерывного образования (Vox). Ещё в 2011 году агентство разработало серию тестов для иммигрантов, главной заслугой разработчиков стал многоступенчатый языковой тест Norskprøven.
Анализируя политику в отношении мигрантов в Норвегии, эксперты отмечают, что всем беженцам доступны бесплатные курсы по изучению норвежского языка, а также по освоению социальных дисциплин. В 2014 и 2016 году возраст обучавшихся в этих группах колебался от 16 до 56 лет, и беженцы составляли 85% от их численного состава. По данным исследователей, больше всего в составе групп было беженцев из Эритреи, Сомали, Таиланда, Сирии, Филиппин, Афганистана, Эфиопии, Судана и Ирана.
В третьей главе освещаются новые методологические подходы к установлению стандартов, при этом авторы сочли необходимым ещё раз обратиться к сущности традиционных методов. По сравнению с предыдущими главами содержание третьей главы представляется наиболее трудным для понимания, поскольку акцент смещён к детализации процедуры функционирования методик, что сопровождается специфической лексикой. В этой связи авторы включили небольшой подраздел, в котором даются определения терминов и аббревиатур.
Анализируя характеристики традиционных методов разработки стандартов образования, научные сотрудники Статистического управления Нидерландов Хендрик Страат, Йос Кёнинг и Ремко Фескенс предлагают новый метод — прямой консенсус по управлению данными (Data-Driven Direct Consensus (3DC)), который сочетает в себе гибкость метода Ангоффа, эмпирическую точность метода закладок с минимальными временными затратами, а также ясность и эффективность. В целом же, новый метод принято позиционировать как вариацию прямого консенсуса.
Отдельный сюжет главы связан с рассуждениями ведущего кембриджского исследователя и члена Консультативного совета «Digital Assessment Limited» Аластейра Поллитта на тему использования профессионального суждения для соответствия стандартам экзамена. Учёный демонстрирует на четырёх примерах, как метод парных сравнений Луиса Терстоуна может использоваться для поддержания стандартов в тех случаях, где возникает больше всего сложностей, например, где требуется расширенный письменный ответ или устное выступление. По мнению эксперта, это особенно актуально для Великобритании, где процедуру разработки эталонов в образовании можно назвать пересмотром уже существующих стандартов.
Обращаясь к наследию британского химика Уильяма Фэриша, Политт по достоинству оценивает вклад учёного в науку и образование, отмечая его роль в становлении письменной университетской экспертизы и развитии количественной аттестации учащихся при помощи секретной маркировки и суммирования. Таким образом, учёный XVIII века преодолел один из четырёх барьеров профессионального суждения — нарушение структуры (disorder). Среди других барьеров адекватного суждения Политт выделяет категоричность (severity), расхождения (different order) и дискриминацию (discrimination).
В завершающей части главы помимо очередного перечисления уже детально разобранных методов установления и применения стандартов в образовании, группа исследователей Лейбницкого университета сосредоточивает внимание на ещё одной важной проблеме — формировании представлений о способностях к приобретению научных знаний взрослым поколением и параллельная разработка стандартов оценивания имеющихся знаний. Исследователи справедливо утверждают, что в мире не существует ни опросов, ни тестирования, ни как таковых стандартов оценивания научной грамотности взрослых. Следовательно, представляется чрезвычайно сложным представить себе человека с минимальной научной грамотностью.
Безусловно, существуют некоторые исследования, например, Программа международной оценки компетенций взрослых (PIAAC), которые в основном направлены на получение информации о математической грамотности и грамотности в области чтения. Применительно к заявленной проблеме главным достижением можно считать реализацию первого в своём роде в Германии и на международном уровне Теста научной грамотности для взрослых (NEPS).
Книга рассчитана на научно-профессиональную аудиторию, занятую в педагогике и сфере образования, в области тестологии и психометрического анализа качества тестовых заданий. В целях лучшего усвоения материала, представленного на страницах монографии, большим преимуществом будет наличие специальных знаний в области математики, психологии и лингводидактики. Кроме того, авторы дают ценные советы по улучшению нынешнего состояния в сфере образования европейских стран, которые могут быть использованы государственными властями.
Рецензия подготовлена при выполнении проекта в рамках государственного задания Министерства образования и науки России 28.4306.2017/НМ «Исследование и информационно-аналитическое обеспечение процессов и мероприятий в рамках многостороннего и двустороннего сотрудничества в сфере науки, образования, инноваций и молодежной политики Российской Федерации в северной и арктической зонах».
Список источников и литературы
1. The Nordic Countries in an International Perspective / Ed. by S. Blömeke, J. Gustafsson. Cham: Springer, 2017. 339 p.
2. Sigrid Blömeke // UiO [Electronic resource]. Oslo, 2017. URL: http://www.uv.uio.no/cemo/english/people/aca/sigribl/, свободный (Дата обращения 04.11.2017).
3. Jan-Eric Gustafsson // University of Gothenburg [Electronic resource]. Gothenburg, 2017. URL: http://www.gu.se/english/about_the_university/staff/?languageId=100001&disableRedirect=true&returnUrl=http%3A%2F%2Fwww.gu.se%2Fomuniversitetet%2Fpersonal%2F%3FuserId%3Dxgjanp&userId=xgjanp