О точности алгоритмов СППРП «Сокол» (2025 год)

 

Для обучение и валидизации алгоритмов классификации полиграмм ТВС (тестов вопросов сравнения) с использованием метрических данных использовано 456 полиграмм с известным решением. Полиграмма с известным решением – это полиграмма теста, ответ на задачу, которую он решал (лгал/не лгал проверяемый на Пв, причастен/непричастен, значим стимул/незначим Пв) стал известен из независимых достоверных источников.

Алгоритм «Сокол» и алгоритм Combi Calc v.2 на январь 2025 года переобучение не проходили.

Алгоритм

Предобработка данных

Метод машинного обучения

Кросс-валидация

«Сокол»

косинусная нормализация

bootstrap, линейная регрессия

на тестовой выборке

«ПравдоРуб»

косинусная нормализация, векторное преобразование

«случайный лес»

ИОТ

«Тензор»

косинусная нормализация, векторное преобразование

ядерная оценка плотности

ИОТ

Out_Lier 2

логарифм отношения дисперсии к квадрату отклонения с увеличивающим коэффициентом

ядерная оценка плотности

ИОТ

«Полилог»

логарифм отношения дисперсии к квадрату отклонения с увеличивающим коэффициентом

логистическая регрессия

ИОТ

Combi Calc

ранжирование и вычислением p-значения с использование формулы Ликкена

линейное разделение с ядерной оценкой плотности

на тестовой выборке

Мета оценщик

 

логистическая регрессия

LOO

 

456 полиграмм с известным решением, представляли различные ТВС с различным количеством повторов/предъявлений, с различным количеством проверочных и контрольных вопросов. Кроме того, полиграммы были записаны с использованием различных наборов физиологических каналов.

Поэтому признаку полиграммы разбивались на подмножества, некоторые из которых получались с исключением каналов (например, Манжеты и ФПГ), обучение и валидация алгоритмов производилась для каждого подмножества полиграмм.

LOO (Leave-One-Out) метод кросс-валидации, при котором из обучающей выборки с N элементами исключается один элемент. На оставшихся N-1 элементах производится обучение модели машинного обучения, и на исключенном элементе проверяется результат обучения. Процесс повторяется N раз и каждый элемент выборки участвует в тестировании. Таким образом тестовая выборка содержит в себе N элементов.

 

ИОТ - исключение элементов одного теста, обучение на остальных, проверка на исключенном тесте

 

При обучении алгоритмов из выборки исключалось не по одному элементу, который соответствовал одному проверочному вопросу, а все элементы, которые соответствовали одному тесту. Так повторялось столько раз сколько имелось тестов в выборке. Таким образом все элементы, соответствующие одному тесту, участвовали и в обучении, и в тестировании – в тестовой выборке.

Далее, в случае алгоритма «Правдоруб», путем удаления элементов, которые соответствовали случайно выбранным тестам, производилось выравнивание классов. Обучение производилось на оставшихся элементах.

На тестовой выборке – валидация производилась на тестовой выборке, ни один элемент которой не участвовали в обучение

 

Д – Дыхание, К – КГР, М – Манжета, Ф – размах ФПГ

ППЦ – положительная прогностическая ценность (оценка вероятности того, что ОЛ действительно лгал, при условии, что решение алгоритма «диагностирована ложь»)

ОПЦ – отрицательная прогностическая ценность (оценка вероятности того, что ОЛ действительно отвечал правду, при условии, что решение алгоритма «диагностирована правда»)

 

Мета оценщик

Чувств.

Специфич.

Точность

Нет реш.

ППЦ

ОПЦ

кол-во полигр.

 

0,93

0,94

0,94

0

0,94

0,93

456

 

0,89

0,91

0,90

0,07

0,97

0,96

456

 

 

Правдоруб

Чувств.

Специфич.

Точность

Нет реш.

ППЦ

ОПЦ

кол-во полигр.

Д, К, М, Ф

0,93

0,89

0,91

0

0,9

0,93

156

 

0,87

0,83

0,85

0,1

0,93

0,95

156

Д, К, М

0,92

0,94

0,93

0

0,94

0,92

280

 

0,82

0,86

0,84

0,125

0,97

0,95

280

Д, К, Ф

0,82

0,86

0,84

0

0,85

0,82

308

 

0,69

0,72

0,71

0,21

0,91

0,89

308

Д, К

0,81

0,87

0,84

0

0,86

0,82

436

 

0,72

0,70

0,71

0,23

0,93

0,91

436

К, М, Ф

0,89

0,89

0,89

0

0,89

0,89

152

 

0,86

0,82

0,84

0,09

0,92

0,91

152

К, М

0,78

0,85

0,81

0,14

0,97

0,93

100

К, Ф

0,69

0,68

0,69

0,23

0,89

0,89

308

 

(здесь и далее показатели вычислены с балансировкой при помощи коэффициента пропорциональности)

 

Тензор

Чувств.

Специфич.

Точность

Нет реш.

ППЦ

ОПЦ

кол-во полигр.

Д, К, М, Ф

0,86

0,91

0,89

0

0,9

0,87

185

 

0,75

0,83

0,79

0,14

0,92

0,92

185

Д, К, М

0,88

0,93

0,91

0

0,93

0,89

314

 

0,78

0,86

0,82

0,14

0,96

0,94

314

Д, К, Ф

0,83

0,85

0,84

0

0,85

0,83

324

 

0,65

0,7

0,67

0,25

0,90

0,90

324

К, М, Ф

0,85

0,88

0,87

0

0,88

0,86

185

 

0,72

0,81

0,76

0,18

0,92

0,95

185

К, М

0,87

0,92

0,9

0

0,92

0,88

315

 

0.78

0,74

0,76

0,19

0,94

0,93

315

К, Ф

0,85

0,84

0,84

0

0,84

0,85

324

 

0,64

0,69

0,66

0,27

0,90

0,91

324

 

Out_Lier 2

 

Чувств.

Специфич.

Точность

Нет реш.

ППЦ

ОПЦ

кол-во полигр.

Д, К, М, Ф

0,83

0,91

0,87

0

0,9

0,85

185

 

0,74

0,78

0,76

0,16

0,92

0,89

185

Д, К, М

0,85

0,91

0,88

0

0,90

0,86

320

 

0,74

0,83

0,79

0,16

0,94

0,94

320

Д, К, Ф

0,83

0,81

0,82

0

0,82

0,83

340

 

0,65

0,61

0,63

0,29

0,88

0,89

340

К, М, Ф

0,83

0,88

0,86

0

0,88

0,84

185

 

0,67

0,76

0,72

0,22

0,92

0,92

185

К, М

0,83

0,90

0,86

0

0,89

0,84

320

 

0,71

0,78

0,75

0,19

0,93

0,93

320

К, Ф

0,84

0,83

0,83

0

0,83

0,84

340

 

0,61

0,64

0,62

0,3

0,88

0,9

340

 

Полилог

 

Чувств.

Специфич.

Точность

Нет реш.

ППЦ

ОПЦ

кол-во полигр.

Д, К, М, Ф

0,86

0,90

0,88

0

0,9

0,87

185

 

0,75

0,75

0,75

0,21

0,95

0,95

185

Д, К, М

0,87

0,90

0,89

0

0,89

0,88

320

 

0,79

0,78

0,78

0,17

0,93

0,95

320

Д, К, Ф

0,86

0,79

0,82

0

0,8

0,85

340

 

0,68

0,6

0,64

0,29

0,89

0,93

340

К, М, Ф

0,87

0,87

0,87

0

0,87

0,87

185

 

0,69

0,75

0,72

0,23

0,93

0,93

185

К, М

0,88

0,89

0,89

0

0,89

0,88

320

 

0,72

0,74

0,73

0,21

0,92

0,93

320

К, Ф

0,85

0,79

0,82

0

0,8

0,84

340

 

0,65

0,62

0,62

0,30

0,87

0,91

340