Что не так со стандартизированными тестами в США?

По материалам сайта американской организации «Национальный Центр за честное и открытое Тестирование» (англ. The National Center for Fair & Open Testing (FairTest). Организация последовательно борется за отказ от стандартизированных тестов и считает их серьезным препятствием на пути развития образования в США.

Являются ли стандартизированные тесты справедливыми и полезными инструментами оценки?

Нет не являются. На стандартизированных экзаменах все испытуемые отвечают на одни и те же вопросы в тех же условиях, как правило, в формате множественного выбора. Такие тесты предполагают быстрые ответы на поверхностные вопросы. Они не измеряют способность мыслить глубоко или творчески. Их использование поощряет суженную учебную программу и устаревшие (а порой и вредные) учебные практики. Например, оставление «на второй год» или деление учеников на классы по уровню их успеваемости.

Являются ли стандартизированные тесты объективными?

Единственной объективной частью большинства стандартизированных тестов является результат тестирования, когда это делается по точно заданному алгоритму. Принятие решения о том, какие элементы следует включить в тест, как сформулированы вопросы, какие ответы заносятся как «правильные», как проводится тест, как используются результаты экзаменов – все это делают люди. А следовательно, все это субъективно.

Являются ли результаты тестов «надежными»?

Тест является полностью надежным, если вы получите точно такие же результаты повторном прохождении теста. Все тесты имеют "погрешность измерения". Это означает, что оценка индивидуума может существенно варьироваться ото дня в день из-за условий тестирования или психического, или эмоционального состояния тестируемого. Особенно ненадежными являются результаты маленьких детей и баллы по отдельным подразделам тестов.

Отражают ли результаты тестирования значительные различия между людьми?

Не обязательно. Целью большинства тестов является сортировка и ранжирование. Чтобы добиться этого, при проведении тестов небольшие различия делаются большими. Вопросы, на которые большинство людей дают правильные или неправильные ответы удаляются, потому что они не помогают с ранжированием. Из-за ошибки измерения, два человека с очень разными баллами на одном экзамене могут получить близкие оценки на повторном тестирование, или наоборот. И это делается по усмотрению администрации. На тестировании SAT, например, оценки двух студентов должны отличаться по крайней мере на 144 балла (из 1 600), прежде чем спонсоры теста готовы сказать, что измеренные способности учащихся действительно отличаются.

Отражают ли тесты текущие знания о том, как учащиеся учатся?

Конечно, нет. Хотя наше понимание работы мозга и то, как люди учатся и думают, продвинулись чрезвычайно сильно, стандартизированные тесты остались прежними (тест SAT был впервые введен в 1901 году). Тестеры все еще предполагают, что знания могут быть разбиты на отдельные «биты» и, что люди учатся, поглощая эти отдельные части. Сегодня специалисты по когнитивному развитию и психологи понимают, что знания не являются отделимыми битами и что люди (включая детей) учатся, соединяя то, что они уже знают, с тем, что они изучают. Если они не могут активно создать смысл из того, что они делают, они не учатся и не помнят.

Позволяют ли тесты с множественным выбором или с коротким ответом измерить учебные достижения учащихся?

Эти виды тестов являются очень плохими критериями оценки обучения студентов. Они являются слабыми мерами способности понимать сложный материал, писать, применять математику, понимать научные методы или рассуждения, или понять концепции социальных наук. Они также не способны адекватно измерять навыки мышления или оценивать то, что как люди могут решать реальные задачи.

Являются ли результаты тестирования полезными для учителей?

Многочисленные аудиторские обследования показывают, что большинство учителей не находят результаты стандартизированных тестов очень полезными. Тесты не помогают учителю понять, что делать дальше в работе с учащимися, потому что они не указывают, как ученик учится или думает. Кроме того, они не измеряют многое из того, чему студенты должны учиться. Хорошая система оценивания должна давать преподавателям полезную информацию.

Как федеральный акт: «Ни один ребенок не должен оставаться без внимания» (англ.  No Child Left Behind (NCLB) повлиял на использование стандартизированных тестов в США?

(Cправка: этот акт был принят в 2001 году и направлен на оказание помощи отстающим, малоимущим учащимся и учащимся-инвалидам в рамках закона «О начальном и среднем образовании (ESEA)»).

Принятие NCLB привело к огромному росту количества проводимых тестов. Дополнительно потребовалось государственное (федеральное) тестирования каждого учащегося в классах (3-8) и один раз в средней школе. Это более чем в два раза больше, чем ранее по федеральным мандатам.  NCLB также привел к взрывному росту числа других стандартизированных экзаменов, в том числе т.н. "эталонных" тестов (стали проводить 3-10 раз в год). 
Похоже, что американские учащиеся в настоящее время наиболее протестированные ученики на земле.

Что такое итоговое тестирование?

Итоговое тестирование используются для принятия важных решений. Таких как, продвижение или градация учащихся; предоставление грантов учителям; санкции для школ с неудовлетворительными результатами работы. 
NCLB определяет санкции по результатам испытаний. Несмотря на то, что NCLB не смогла усовершенствовать школы, директивные руководители продолжают расширять использование итоговых тестов, например для оценки уровня квалификации учителей.

Что происходит, когда тест становится итоговым?

Итоговое тестирование часто приводит к сужению учебных программ, к обучению только тому материалу, который нужен в тестах (подготовка к тестированию вместо обучения предмету). Объем других учебных материалов либо резко сокращается, либо эти темы вовсе исключаются из программ. Так происходит с социальными науками, искусством и музыкой и т.п. Итоговое тестирование также производит дискредитацию оценивания, как такового: результаты идут вверх, но студенты не узнали больше. Часто результаты итогового тестирования значительно ниже, чем результаты по другим стандартизированным тестам. Это подрывает смысл результатов итоговых испытаний, а также и образования вообще.

Есть ли более эффективные способы оценки способностей и успеваемости учащихся?

Да, есть другие способы. Например, наблюдение за учителем, документирование работы учащихся и «оценка по результатам». Все включают прямую оценку результатов выполнения реальных задач обучения. Они предоставляют полезный материал для учителей, родителей и общественности. Многие страны, успехи образовательных систем которых общепризнаны, например Финляндия, используют эти методы вместо крупномасштабных стандартизированных испытаний.

Комментарии переводчика

В течение многих лет в США проведение стандартизированного тестирования в образовании подвергается всесторонней массированной критике. И тем не менее эта система оценки продолжает существовать. В самой Америке высказываются разные предположения почему это так. Вот одно из возможных объяснений.

Проведение любых социально значимых, стандартизированных, массовых процедур рано или поздно становится прибыльным бизнесом. Проведение стандартизированного тестирования в образовании, скорее всего, не является исключением.

Точных данных, во сколько обходятся стандартизированные тесты, найти не удалось. Однако есть косвенные, примерные оценки. В 2013 году на поддержку образовательного процесса из федерального бюджета США было выделено около 16,5 млрд долларов. Тестирование получает средства именно по этой графе бюджета и составляет значительную ее часть. Поэтому можно смело говорить о миллиардах долларов в год.

Ясно, что те, кто «прислонен» к этой деятельности, не торопятся отказаться от такого «лакомого кусочка».

Оригинал статьи

Подписаться на канал Образование за рубежом

Образование за рубежом