Головна

ТЕСТОВІ методи оцінки ступеня засвоєння репродуктивної діяльності.

  1. Погодження прикметників у формі порівняльної ступеня з іменниками
  2. I. Методи суворо регламентованого вправи.
  3. I. ФОРМУВАННЯ СПІВРОБІТНИЦТВА ДИТИНИ з дорослими і однолітками І ОВОЛОДІННЯ СПОСОБАМИ ЗАСВОЄННЯ ГРОМАДСЬКОГО ДОСВІДУ
  4. II Общепедагогические методи.
  5. II. Методи виховання фізичних якостей.
  6. II. МЕТОДИ ЧАСТКОВО регламентовані вправи
  7. II. МЕТОДИ, ПІДХОДИ І ПРОЦЕДУРИ ДІАГНОСТИКИ І ЛІКУВАННЯ

Одним з важливих і складних складових педагогічної діяльності є оціночна діяльність. А оскільки будь-яке раціонально орієнтоване обговорення вимагає максимально однозначних визначень основних понять, що використовуються в ньому, то домовимося розуміти під оціночною діяльністю сукупність дій по формуванню судження, думки щодо гідності, значення, інтенсивності властивості чого-небудь або кого-небудь.

Базовим дією в оціночної діяльності є порівняння оцінюваного об'єкта (суб'єкта, предмета, процесу, явища, результату діяльності і т. Д.) З іншими аналогічними об'єктом або з їх безліччю. При цьому в процесі життєдіяльності кожної людини свідомо чи несвідомо формується, з більшим чи меншим впливом на цей процес професійно-громадської думки, певний еталон (як правило, в неартікулірованном вигляді образу - уявлення) якості даного типу об'єктів, з цим еталоном і йде порівняння в процесі оцінювання. Такий еталон може бути відображенням (у свідомості людини, що оцінює об'єкт) нечітких і нестрогих суспільно визнаних норм моралі, моральності, етики. У той же час еталон порівняння може бути відображенням певного стандарту як строго зафіксованого нормативу, відступ від якого карається законом.

Приймемо як аксіому досить переконливе саме по собі твердження: оцінка не може бути більш об'єктивною і однозначною, ніж образ, опис, визначення еталону, з яким порівнюється даний об'єкт.

У повсякденному оціночної діяльності в освітніх системах ми, як правило, використовуємо шкалу порядку (ординальних шкалу), в якій природне упорядкування об'єктів щодо якогось властивості або групи властивостей встановлюється операціями: "встановлення рівності" і "встановленням відносини - більше або менше". Наші традиційні оцінки успішності учнів базуються на використанні цієї шкали. При цьому еталон, щодо якого встановлюються відносини рівності, відносини "більше або менше", або взагалі не описаний, або описаний вкрай неоднозначно, наприклад, на мові "знань, умінь, навичок".

Найчастіше, основою порівняння є якийсь інтуїтивний еталон засвоєння змісту навчання, історично складаний у конкретного викладача в процесі власного навчання, у взаємодії з середовищем, в якій він працює, еталон, скоригований на середній рівень навчальних досягнень в даному класі (студентській групі), в даний проміжок часу. Саме щодо таких еталонів визначаються оцінки успішності не тільки проміжної, поточної, а й остаточною, атестаційної успішності засвоєння змісту освіти, включаючи знання, освоєння типові алгоритми, методи вирішення задач, перенесення, поширення, адаптацію їх на нетипові ситуації, евристичне моделювання та вирішення проблемних ситуацій .

Зробити оцінку більш об'єктивною і однозначною можна лише за умови:

o використання більш однозначного еталона (згадаємо сформульовану вище аксіому);

o в більш об'єктивованою оціночної процедурі, ніж в традиційній, що спирається на думку одного експерта - викладача або групи зацікавлених викладачів, які оцінюють в тому числі (як це найчастіше буває в нашій повсякденній ситуації) і результати власної діяльності.

Традиційна в російській освіті оціночна діяльність, яка встановлює зв'язок між рівнем підготовленості учня і певним еталоном такої підготовленості, існуючим у свідомості викладача, завершується відміткою від 2 до 5. Отже, такий процес можна назвати процесом вимірювання, визначаючи вимір як: «Вимірювання є приписування чисел речам відповідно до певних правил »[1, С. 12] Існує більш зобов'язує визначення, запропоноване Адамсом, - вимір полягає в привласненні чисел речам таким чином, що якісь операції з приписуються числами і деякі відносини між ними відповідають спостережуваним відносин і операцій над речами , яким вони привласнені або які з їх допомогою представляються [2, С. 37]. Нам ближче, як можливе для використання в якості робітника, визначення А. Тарського [3, С. 37; 374;], відповідно до якого вимір може бути розглянуто як гомоморфності відображення якоїсь емпіричної структури на деяку числову структуру.

Обов'язковим атрибутом приписування, присвоєння чисел, відображення емпіричної структури на числову є шкали.

Опис шкал:

O найменування [3, С. 198] «Шкала найменувань заснована на будь-якому приписуванні чисел (чисел), що грають роль простих імен: таке приписування служить для нумерації індивідуальних предметів тільки з метою їх ідентифікації або для нумерації класів, причому такий нумерації, що кожному з елементів відповідного класу приписується одна і та ж цифра; в обох випадках діє правило: «Не приписуй одну й ту ж саму цифру різних класів або різні цифри - одному і тому ж класу» [1, С. 20];

O ординальне шкала, або шкала порядку, що передбачає природне впорядкування об'єктів щодо якогось властивості, визначається двома емпіричними операціями: "встановленням рівності" і "встановленням відносини - більше або менше".

O Интервальная шкала (шкала інтервалів) відрізняється від попередньої тим, що вимагає встановлення одиниці виміру і якогось початку і що вона допускає все арифметичні операції, якщо вони відносяться до інтервалів між двома шкальними значеннями.

O шкала відносин [3, С. 200] з формальної точки зору є власне интервальная шкала з природним початком ... »- 0.

Ще раз відзначимо, що операції додавання і віднімання і всі інші арифметичні операції коректно виконуються тільки в шкалах інтервального і відносин.

1. Гласс Дж., Стенлі Дж. Статистичні методи в педагогіці і психології / М .: Изд-во "Прогрес", 1976, 496 с.

2. Берка К. Вимірювання: поняття. теорії, проблеми / М .: Изд-во "Прогрес", 1987, 320 с.

3. Тарський А. Введення в логіку і методологію дедуктивних наук / М., 1948

1. StevensS. S. Mathematics, tasurement and psychophysics. - In StevensS. S. (ed.) Handbook of Experimental Psychology. New York, 1959.

З наведених визначень випливає, що у своїй традиційній педагогічній діяльності максимум, на що можна претендувати, - це на не в повній мірі коректно певну шкалу порядку. Як правило, викладач у своїй професійно - педагогічної діяльності постійно має справу з процесом оцінювання навченості, підготовленості студента. Така діяльність здійснюється викладачем тільки на підставі наявних у нього педагогічного досвіду та інтуїції без фіксованого алгоритму оцінювання, тому процедура встановлення рівності відносини "більше - менше", навіть при оцінці письмової відповіді учня, строго не визначена. Значить, такі традиційно вчительські арифметичні операції з п'ятибальною оцінками (визначення середньої оцінки за різними масивів, порівняння різних груп і т. Д.) За великим рахунком, є некоректними і, в кращому випадку, мають лише розмиті якісні експертні значення.

Достовірність педагогічних оцінок успішності навчання можна підвищити, замінюючи звичайні завдання або завдання стандартизованими тестами (т. Е. Тестами володіють певною валідність, надійністю) і батареями тестів, що застосовуються за певною процедурою тестування. Використовуючи тести, можна спробувати вийти за межі шкали порядку, ступивши в область шкали інтервалів. Однак абсолютно необхідно мати на увазі, що найпростіше побудувати систему валідних і надійних тестів для фіксації володіння визначеннями, поняттями (по-перше, пам'ятати, по-друге, використовувати в найпростіших операціях), простими методами, правилами, співвідношеннями, алгоритмами операцій і дій з визначеннями і поняттями. і, навпаки, чим складніше завдання або завдання, тим складніше побудувати валідну - для даних цілей - і надійну систему тестів.

З вищесказаного виходять принципово важливі положення.

Традиційний підхід до оцінки виконаних завдань (відносимо до їх числа ділові, рольові ігри, проблемні ситуації, що імітують реальну діяльність), завдань різного роду носить характер інтуїтивного, неалгорітмізірованного експертного оцінювання. Іншими словами, будь-якого більш-менш однозначного правила відповідності присвоєння числа даного прояву оцінюється якості немає.

Ступінь об'єктивності, достовірності такої оцінки потрібно розуміти і правильно враховувати, особливо у випадках дійсно складних, комплексних завдань. Виходячи з цього, потрібно максимально виважено ставитися до абсолютній величині самих оцінок і різноманітним діям з ними, кожен раз визначаючи, чому отримані числа відповідають. Підвищуючи об'єктивність і достовірність оцінок, можна йти до цього двома шляхами.

Перший шлях - складається ніби з двох гілок. Перша: перехід на оцінювання з письмовим роботам. Введення такої процедури оцінювання не тільки істотно знизить суб'єктивність експертної оцінки за рахунок можливості залучення до оцінювання будь-якого необхідного числа експертів (що відразу ж підвищує відповідальність кожного з них), але і забезпечить більший захист інтересів випробуваного. (До речі, теж елемент гуманізації педагогічної системи) Друга (гілка): розробка та введення професійно схвалених алгоритмів оцінювання складних завдань і задач.

Другий шлях - пропонує перехід до тестового контролю. До тестового контролю як ефективного засобу діагностики підштовхує один важливий для вирішення обговорюваної проблеми принцип функціонування діагностики - оперативність оцінки ступеня досягнення заявлених вимог. Оперативність не просто сама по собі, а ще як засіб, що забезпечує можливість оцінки рівня засвоєння великого обсягу навчальних елементів. У оперативності оцінки очевидне першість у тестових систем. Не випадково саме тестові способи оцінки успішності в педагогічних системах так розвинені в США, Великобританії та в інших європейських країнах.

У США багато років діє дуже розвинена система тестових оцінок рівня навченості. Так, більше половини чотирирічних коледжів і університетів США використовують введений вперше в 1926 році як обов'язкову частину приймальні процедури The Scholastic Aptitude Test (SAT) [40]. SAT- тригодинний тестовий іспит. Кількість балів SAT коливається від 200 до 800 одиниць, і чим вище престижність коледжу або університету, тим більшу кількість балів SAT потрібно для вступу в такий вуз. У 1959 році була затверджена Радою коледжів Програма тестів американських коледжів The American Testing Program оціночні іспити - ACT Assessment, використання яких в останні роки зростає.

Претендентам на магістратуру належить справитися з тестовими програмами The Graduate Record Examinational (GRE), The Miller Analogies Test (MAT), The Advanced Tests [40]. Претендує на посаду в фірмі, як правило, також піддається тестуванню для оцінки його підготовленості до конкретної роботи. Очевидно, що всі ці відпрацьовані і общепрізнаваемие тестові систем, що визначають ступінь підготовленості претендента на місце в коледжі, університеті, в магістратурі або в фірмі, нехай не відкрито і не повно, відображають професійно сформовані і усталені вимоги до підготовленості випускника відповідної освітньої щаблі.

Однак, віддаючи належне тестовим системам, абсолютно необхідно звернути увагу на деякі дуже важливі міркування.

У стимуляції і фіксації системної підготовленості випускника (згадаємо про цільових пріоритетах педагогічної системи) пріоритетну роль повинні грати комплексні, системні завдання, а тести, орієнтовані на оперативність оцінки, на великий обсяг оцінюваних УЕ при високому ступені валідності і надійності, більше орієнтовані на фіксацію рутинних умінь , що базуються на використанні при їх виконанні тільки власної пам'яті випробовуваних.

Орієнтація найбільш просто розроблюваних тестових систем на рутинні уміння, оперативність, валідність і надійність таких випробувань, при відсутності чітких обмежень на число вимог, що виходять на тестову діагностику, неминуче призведе до зміщення пріоритетності навчання в сторону контрольованих рутинних умінь.

Дійсно, така природа людини, що реалізується в процесі навчання, що в першу чергу зусилля учнів зосереджуються на відпрацюванні того, що найбільш жорстко вимагають і надійно оцінюють. Зрозуміло, що вуз, орієнтуючись на оперативно і надійно оцінювані тестами вимоги, буде саме до цього готувати своїх випускників, при цьому увагу і тимчасові витрати студентів будуть зрушені, спрямовані на цю частину підготовки, на шкоду її системної частини, індивідуалізації, отже, на шкоду розвитку особистості, т. к. саме системність більш, ніж що - небудь, працює на розвиток. (Детальніше див. Додаток 4).

Отже, постійно піклуючись про необхідність відображення в ДОС головних пріоритетів освіти: розвиток особистості і вибір через варіативність освітніх траєкторій, при реалізації принципу мінімальної достатності, перш за все діагностованих вимог, ми зобов'язані вкрай жорстко і обачливо визначати їх кількість, що виходить на тестування.

Таким чином, ми виходимо на проблему обґрунтованого відбору того змісту освіти, тієї сукупності навчальних елементів (УЕ), яку випускник конкретного освітнього рівня, навчального закладу повинен вміти використовувати, спираючись тільки на власну пам'ять, без звернення до зовнішніх джерел інформації.

Переходячи до безпосередньої інформації про тести, яка базується в основному на джерелах [1-7] і лише в деяких приватних питаннях виходить на джерела [8-18], спираючись на терміни, представлені в проекті «Галузевий стандарт: Педагогічні тести. Терміни та визначення М .: Изд-во Центру тестування, 2001..

Перш за все, домовимося вважати тестом не всяку композицію питань, завдань, лише таку їх сукупність, яка задовольняє чітко представленим таким властивостям:

стандартизації тесту, що забезпечує обов'язкова умова тестування - У ВСІХ ВСЕ ОДНАКОВО! А саме: визначено і жорстко витримується максимальний час, відведений на тестування; однаково кількість і зміст тестових завдань; уніфіковані бланки тестових матеріалів (текстове або / і символічне уявлення тестових завдань), бланки відповідей (стандартизований бланк для запису відповідей, куди тестований записує або зазначає номери обраних відповідей, або самі відповіді); максимально однакові умови проведення тестування.

валідність тесту - комплексна характеристика тесту, що відображає його відповідність вимірювати те, для чого він призначений.

Змістовна валідність тесту - характеристика тесту, що виражає відповідність змісту тестових завдань найбільш значимого змісту, засвоєння якого має вимірюватися даними тестом.

Валідність факторная - обумовлена ??кореляцією результатів тестування і результатами інших способів оцінки ступеня засвоєння змісту завдань тесту.

надійність тесту - показник стійкості результатів вимірювань при багаторазовому застосуванні тесту в досить еквівалентних умовах. Кількісна характеристика, яка відображає ступінь статистичної рівнозначності результатів тестування в досить рівних умовах. Одним з простих способів оцінки надійності є оцінка коефіцієнта кореляції за результатами виконання двох еквівалентних половинок тесту. Більш досконалим методом оцінки надійності тесту (при дихотомічної оцінки відповіді тестованого - правильно - 1; неправильно - 0) є метод Кьюдера -Річардсона, який будується на оцінці надійності по всіляких поділом тесту на дві половини.

Стандартизація, валідність, надійність - обов'язкові характеристики будь-якого тесту. Ми ж, при описі цих характеристик і далі, відображаємо специфіку педагогічних тестів досягнень.

Про класифікацію тестів.

Тест гомогенний - педагогічний тест, призначений для вимірювання рівня засвоєння змісту однієї дисципліни.

Тест гетерогенний - педагогічний тест, призначений для вимірювання рівня засвоєння декількох дисциплін.

Тест критеріально - орієнтований - тест, призначений для оцінки подолання тестованим певного порогу ступеня засвоєння відповідного змісту, який встановлюється виходячи з прийнятих критеріїв.

Тест нормативно - орієнтований - тест, призначений для оцінки ступеня засвоєння відповідного змісту, який встановлюється на підставі попередньо отриманих результатів тестування.

Тестові завдання (тести) з вибором відповіді (закритого типу) - тестові завдання, які супроводжуються пронумерованими варіантами відповідей. Тестируемому пропонується вказати правильні відповіді / відповідь.

Тестові завдання (тести) відкритого типу - завдання, питання, відповідаючи на які тестований користується властивим йому стилем відповіді.

Диференціюючі тести - тести, призначені для диференціації ступеня підготовленості тестованих.

Про сучасні теорії тестування, моделі Раша і Item Response Theory.

Надсилаючи бажаючих більш повної інформації до Додатку 5, з наведеної в ньому бібліографією, зупинимося лише на загальному вигляді функції успіху, відповідної основної моделі Раша

p = 1 / {1 + exp [- (? - ?)]},

де р - ймовірність відповіді випробуваного, має підготовленість ?, на завдання труднощі - ?. Пропонований підхід в принципі дозволяє оцінити (? - ?) і потім визначити рівень підготовленості ?. Саме такий підхід використовується в ЄДІ.

Зупинимося лише на приватних, граничних випадках, щоб продемонструвати розумність такого підходу.

1. ? - труднощі дуже велика в порівнянні з рівнем підготовленості. Т. е. ? »?. У межі ? прагнути до нескінченності. Тоді p прагнути до нуля.

2. ? «? В межі ? прагнути до нескінченності. Тоді p прагнути до одиниці, т. Е. Випробуваний дає правильну відповідь.

3. ? = ?. Т. е. Ймовірність правильної відповіді 1/2.

Погодьтеся, що представлені оцінки досить розумні.

1. Аванесов В. С. Композиція тестових завдань (2-е изд.) / М .: Адепт, 1998, 217 с.

2. Аванесов В. С. Основи наукової організації педагогічного контролю у вищій школі: Навчальний посібник / М .: Дослідницький центр проблем якості підготовки фахівців, 1989, 168 с.

3. Аванесов В. С. Теоретичні основи розробки завдань у тестовій формі / М .: МГТА, 1995, 95 с.

4. Аванесов В. С. Форма тестових завдань: Навчальний посібник / М .: Дослідницький центр проблем якості підготовки фахівців, 1991, 33с.

5. Анастази А. Психологічне тестування: Кн. 1., М .: Педагогіка, 1982, 320 с.

6. Анастази А., Урбіна С. Психологічне тестування - 7-е видання - СПб: Пітер, 2003. - 688 с. - (Серія «Майстра психології»).

7. Інгенкамп К. Педагогічна діагностика / М., 1991.

додаткова література

8. Майоров А. Н. Теорія і практика створення тестів для системи освіти (Як вибирати, створювати і використовувати тести для цілей освіти). - М .: «Інтелект - центр», 2001. - 296 с. ISBN 5-89790-5

9. Майоров А. Н. Тести шкільних досягнень: конструювання, проведення, використання. Вид. 2-е - СПб .: Освіта та культура, 1997. - 304 с.

10. Нардюжев В. І., Нардюжев І. В. Моделі і алгоритми інформаційно-обчислювальної системи комп'ютерного тестування. Монографія. - М .: Прометей, 2000. - 148 с.

11. Нейман Ю. М. Як виміряти навчальні досягнення? / Питання тестування в освіті М., 2001 № 1, С. 40 - 56 2

12. Нейман Ю. М., Хлєбніков В. А. Введення в теорію моделювання та параметризації педагогічних тестів М., 2000., 169 с.

13. Рівний Джон Педагогічне тестування: Проблеми, помилки, перспективи / Пер. з англ. - «Когнітів-центр», 1999. - 144 с.

14. Родіонов Б. у., Татур А. о. Стандарти і тести в освіті. РІО МІФІ, 1995. 35 с.

15. Самиловскій А. І. Тест як об'єктивний вимірювальний інструмент в освіті / Питання тестування в освіті М., 2001 № 1, С. 10 - 39

16. Соколов В. М. Висновок функції успіху виконання тесту досягнень з принципу максимальності інформації // Питання тестування в освіті. 2003 № 5, С. 136 - 143.

17. Челишкова М. б. Розробка педагогічних тестів на основі сучасних математичних моделей. - М .: МІСІС, 1995..

18. Челишкова М. б. Теорія і практика конструювання педагогічних тестів: Навчальний посібник.-М: Логос, 2002.-432с.


[1] В. П. Беспалько визначає педагогічні системи як "системи, в яких здійснюються педагогічні процеси". Н. В. Кузьміна дає таке визначення педагогічної системі: "безліч взаємопов'язаних структурних і функціональних компонентів, підпорядкованих цілям виховання, освіти і навчання підростаючого покоління і дорослих людей".

[2] КОМПЕТЕНТНІСТЬ [1, с.247] 1) володіння компетенцією; 2) володіння знаннями, що дозволяють судити про що-небудь.

КОМПЕТЕНЦІЯ [2, C. 134] - єдність знань, професійного досвіду, здібностей діяти і навичок поведінки індивіда, що визначаються метою, заданістю ситуації і посадою. К. відноситься до даної конкретної ситуації, комбінує і з'єднує динамічним чином складові її елементи для адаптації до вимоги посади. Для визначення змісту К. необхідний детальний аналіз усіх видів діяльності, що здійснюються на даній посаді, а також виявлення різних видів необхідних знань, навичок; побудова ієрархії К. з урахуванням розвитку її складових; визначення складових К., загальних для різних напрямків діяльності на цій посаді.

1. Словник іншомовних слів - 8-е изд. стереотип. - М .: Російська мова 1981. - 624 с.

2. Управління персоналом: Енциклопедичний словник / Ред. І. Я. Кібанов - М .: ИНФРА - М, 1998 VIII, 453 с. - (Бібліотека словників «ИНФРА - М»

[3] Більш узагальненої дефініцією компетентності можна вважати - компетентність: це цілісна, системна сукупність властивостей людини, що дозволяє йому цілеспрямовано, успішно і досить ефективно виконувати типову діяльність і вирішувати проблемні ситуації, що виникають в реальному житті.

[4] Вимога до чутливості думки професійного співтовариства суперечливо! Наукові позиції професійної спільноти, орієнтовані на прийняті, що сформувалися парадигми, інерційні. Спільнота може не прийняти нову, що виходить за межі прийнятого, ідею, теорію, щоб лише потім, якщо вона справедлива, включити її в сукупність усталених парадигм.

[5] Слід зазначити, що не тільки в повсякденній мові, але і в педагогічних текстах поняття «вміння» трактується значно ширше запропонованого визначення. Вельми часто говорять і пишуть про вміння вирішувати проблемні ситуації і т. П.

[6] Модальность [8, С. 216] - одне з основних властивостей відчуттів, їх якісна характеристика (колір - в зорі, тон і тембр - в слух, характер запаху в нюху і т. П.). ... Поняття модальності поряд з відчуттями відноситься і до багатьох інших психічних процесів, описуючи якісні характеристики когнітивних (пізнавальних) образів будь-якого рівня і складності.

[7] Таксон [5, с. 495] - (лат. - Оцінювати) - група дискретних об'єктів, пов'язаних тим чи іншим ступенем спільності властивостей і ознак і завдяки цьому дають підставу для присвоєння їм певної таксономічної категорії.

таксономія [5, С. 495] - теорія класифікації і систематизації складноорганізованих областей дійсності, що мають зазвичай ієрархічну будову (органічний світ, об'єкти географії, геології, мовознавства, етнографії ит. Д.).

5. Словник іншомовних слів. / М .: Російська мова, 8 - е стереотип. изд., 1981, 624с.

[8] На мій погляд, втрачено уяву!

МЕТОДИ, ТЕХНОЛОГІЇ | Корольов 2007 р

© 2016-2022  um.co.ua - учбові матеріали та реферати