Статистическая значимость
Односторонний тест Кокрана-Армитажа на тренд:
library(DescTools)
data_table <- matrix(
c(
63, 57, 57, 51, # Строка неправильных ответов
13, 19, 19, 25 # Строка правильных ответов
),
nrow = 2,
byrow = TRUE
)
colnames(data_table) <- c("Difficult_1", "Difficult_2", "Difficult_3", "Difficult_4")
rownames(data_table) <- c("False", "True")
CochranArmitageTest(data_table, alternative = "one.sided")
Cochran-Armitage test for trend
data: data_table
Z = -2.1325, dim = 4, p-value = 0.01648
alternative hypothesis: one.sided
Размер эффекта
График вероятностей, предсказанных логистической регрессией
(наглядный способ оценить размер эффекта):
library(dplyr)
library(ggplot2)
library(marginaleffects)
# Данные
data <- data.frame(
detail_level = c(rep(1, 76), rep(2, 76), rep(3, 76), rep(4, 76)),
correct = c(
rep(1, 13), rep(0, 63), # Уровень 1
rep(1, 19), rep(0, 57), # Уровень 2
rep(1, 19), rep(0, 57), # Уровень 3
rep(1, 25), rep(0, 51) # Уровень 4
)
)
# Строим логистическую регрессия
model <- glm(correct ~ detail_level, data = data, family = binomial)
# Предсказываем вероятности на каждом уровне детализации
all_levels <- predictions(
model,
newdata = datagrid(detail_level = 1:4)
)
# Строим график
ggplot(all_levels, aes(x = factor(detail_level), y = estimate)) +
# Пунктирная линия случайного угадывания
geom_hline(yintercept = 0.25, linetype = "dashed", color = "gray50") +
# Доверительные интервалы
geom_errorbar(aes(ymin = conf.low, ymax = conf.high), width = 0.1, color = "gray30", linewidth = 0.8) +
# Точки предсказанных вероятностей
geom_point(size = 4, color = "gray30") +
# Добавим тонкую линию, соединяющую точки, чтобы подчеркнуть тренд
geom_line(aes(group = 1), linetype = "dotted", color = "gray30") +
# Настройка осей
scale_y_continuous(
labels = scales::percent_format(accuracy = 1),
breaks = seq(0.1, 0.5, by = 0.05),
limits = c(0.1, 0.45)
) +
theme_minimal() +
labs(
x = "Уровень детализации варианта ответа",
y = "Вероятность ответить правильно",
) +
theme(text = element_text(size = 16, family = "serif"))

print(all_levels)
detail_level Estimate Pr(>|z|) S 2.5 % 97.5 %
1 0.182 <0.001 31.1 0.122 0.263
2 0.223 <0.001 49.8 0.175 0.280
3 0.271 <0.001 39.5 0.220 0.328
4 0.324 <0.001 11.1 0.241 0.420
Type: invlink(link)
Практически интересный размера эффекта (стратегия выбора наиболее
детализированного варианта ответа позволяет угадывать с вероятностью на
0.0741 выше):
library(marginaleffects)
# Данные
data <- data.frame(
detail_level = c(rep(1, 76), rep(2, 76), rep(3, 76), rep(4, 76)),
correct = c(
rep(1, 13), rep(0, 63), # Уровень 1
rep(1, 19), rep(0, 57), # Уровень 2
rep(1, 19), rep(0, 57), # Уровень 3
rep(1, 25), rep(0, 51) # Уровень 4
)
)
# Строим логистическую регрессию
model <- glm(correct ~ detail_level, data = data, family = binomial)
# Считаем разницу вероятностей
results <- predictions(
model,
newdata = datagrid(detail_level = 4),
hypothesis = "b1 - 0.25 = 0",
type = "response"
)
print(results)
Hypothesis Estimate Std. Error z Pr(>|z|) S 2.5 % 97.5 %
b1-0.25=0 0.0741 0.046 1.61 0.107 3.2 -0.016 0.164
Type: response
Анализ мощности
Апостериорные анализы мощности
Апостериорный анализ мощности для теста Кокрана-Армитажа:
library(multiCA)
power.CA.test(
N = 304, # Размер выборки (количество вариантов ответа)
n.prop = c(0.25, 0.25, 0.25, 0.25), # Пропорция размеров групп на каждом уровне
pvec = c(0.1711, 0.25, 0.25, 0.3289), # Фактические пропорции правильных ответов на каждом уровне
sig.level = 0.05, # Уровень значимости альфа
alternative = "greater" # Направление проверки
)
Cochran-Armitage trend test
n = 304
n.prop = 0.25, 0.25, 0.25, 0.25
p = 0.1711, 0.2500, 0.2500, 0.3289
alternative = greater
sig.level = 0.05
power = 0.6892607
Априорные анализы мощности
Априорный анализ мощности для теста Кокрана-Армитажа:
library(multiCA)
power.CA.test(
n.prop = c(0.25, 0.25, 0.25, 0.25), # Пропорция размеров групп на каждом уровне
pvec = c(0.1711, 0.25, 0.25, 0.3289), # Фактические пропорции правильных ответов на каждом уровне
sig.level = 0.05, # Уровень значимости альфа
alternative = "greater", # Направление проверки
power = 0.8 # Необходимая мощность
)
Cochran-Armitage trend test
n = 409.6055
n.prop = 0.25, 0.25, 0.25, 0.25
p = 0.1711, 0.2500, 0.2500, 0.3289
alternative = greater
sig.level = 0.05
power = 0.8
Априорный анализ мощности для практически интересного размера эффекта
методом Монте-Карло. Расчёт статистической мощности для выборки размером
172 вопроса (688 вариантов ответа):
library(marginaleffects)
# Функция расчёта статистической мощность по размеру выборки n_per_level
simulate_power_exact <- function(n_per_level, b0, b1, n_sim, alpha) {
success_count <- 0
for (i in 1:n_sim) {
# 1. Генерируем данные
sim_detail_level <- rep(1:4, each = n_per_level)
sim_log_odds <- b0 + b1 * sim_detail_level
sim_probs <- 1 / (1 + exp(-sim_log_odds))
sim_correct <- rbinom(length(sim_detail_level), size = 1, prob = sim_probs)
sim_data <- data.frame(detail_level = sim_detail_level, correct = sim_correct)
# 2. Обучаем модель
fit <- glm(correct ~ detail_level, data = sim_data, family = binomial)
# 3. Используем marginaleffects для проверки значимости эффекта
results <- predictions(
fit,
newdata = datagrid(detail_level = 4),
hypothesis = "b1 - 0.25 = 0",
type = "response"
)
# 4. Извлекаем одностороннее p-значение
# Делим на 2, если эффект направлен в ожидаемую сторону (Estimate > 0)
if (results$estimate > 0) {
p_val_one_sided <- results$p.value / 2
} else {
p_val_one_sided <- 1 - (results$p.value / 2)
}
if (p_val_one_sided < alpha) {
success_count <- success_count + 1
}
}
return(success_count / n_sim)
}
# Расчитываем статистическую мощность
set.seed(42)
estimated_power <- simulate_power_exact(
n_per_level = 172, # Размер выборки на каждый уровень (количество вопросов)
b0 = coef(model)[1], # Константа (intercept) в регрессии
b1 = coef(model)[2], # Коэффициент для переменной detail_level
n_sim = 100, # Количество симуляций
alpha = 0.05 # Уровень значимости α
)
print(estimated_power)
[1] 0.84
---
title: "Тесты по истории"
output: html_notebook
---

```{r, markdown_settings, include=FALSE}
knitr::opts_chunk$set(warning = FALSE)
```

```{r, installing-libraries, include = FALSE}
#install.packages(c("DescTools", "multiCA", "lmtest", "dplyr", "marginaleffects", "rstanarm", "collapse", "Rcpp", "zoo"))
```

## Статистическая значимость

Односторонний тест Кокрана-Армитажа на тренд:

```{r, cochrane_armitage-test}
library(DescTools)

data_table <- matrix(
  c(
    63, 57, 57, 51, # Строка неправильных ответов
    13, 19, 19, 25 # Строка правильных ответов
  ),
  nrow = 2,
  byrow = TRUE
)

colnames(data_table) <- c("Difficult_1", "Difficult_2", "Difficult_3", "Difficult_4")
rownames(data_table) <- c("False", "True")

CochranArmitageTest(data_table, alternative = "one.sided")
```

## Размер эффекта

График вероятностей, предсказанных логистической регрессией (наглядный способ оценить размер эффекта):

```{r, effect_size-graph, fig.width = 8, fig.height = 5, message = FALSE}
library(dplyr)
library(ggplot2)
library(marginaleffects)

# Данные
data <- data.frame(
  detail_level = c(rep(1, 76), rep(2, 76), rep(3, 76), rep(4, 76)),
  correct = c(
    rep(1, 13), rep(0, 63), # Уровень 1
    rep(1, 19), rep(0, 57), # Уровень 2
    rep(1, 19), rep(0, 57), # Уровень 3
    rep(1, 25), rep(0, 51) # Уровень 4
  )
)

# Строим логистическую регрессия
model <- glm(correct ~ detail_level, data = data, family = binomial)

# Предсказываем вероятности на каждом уровне детализации
all_levels <- predictions(
  model,
  newdata = datagrid(detail_level = 1:4)
)

# Строим график
ggplot(all_levels, aes(x = factor(detail_level), y = estimate)) +
  # Пунктирная линия случайного угадывания
  geom_hline(yintercept = 0.25, linetype = "dashed", color = "gray50") +
  # Доверительные интервалы
  geom_errorbar(aes(ymin = conf.low, ymax = conf.high), width = 0.1, color = "gray30", linewidth = 0.8) +
  # Точки предсказанных вероятностей
  geom_point(size = 4, color = "gray30") +
  # Добавим тонкую линию, соединяющую точки, чтобы подчеркнуть тренд
  geom_line(aes(group = 1), linetype = "dotted", color = "gray30") +
  # Настройка осей
  scale_y_continuous(
    labels = scales::percent_format(accuracy = 1),
    breaks = seq(0.1, 0.5, by = 0.05),
    limits = c(0.1, 0.45)
  ) +
  theme_minimal() +
  labs(
    x = "Уровень детализации варианта ответа",
    y = "Вероятность ответить правильно",
  ) +
  theme(text = element_text(size = 16, family = "serif"))

print(all_levels)
```

Практически интересный размера эффекта (стратегия выбора наиболее детализированного варианта ответа позволяет угадывать с вероятностью на 0.0741 выше):

```{r, practical_effect-size}
library(marginaleffects)

# Данные
data <- data.frame(
  detail_level = c(rep(1, 76), rep(2, 76), rep(3, 76), rep(4, 76)),
  correct = c(
    rep(1, 13), rep(0, 63), # Уровень 1
    rep(1, 19), rep(0, 57), # Уровень 2
    rep(1, 19), rep(0, 57), # Уровень 3
    rep(1, 25), rep(0, 51) # Уровень 4
  )
)

# Строим логистическую регрессию
model <- glm(correct ~ detail_level, data = data, family = binomial)

# Считаем разницу вероятностей
results <- predictions(
  model,
  newdata = datagrid(detail_level = 4),
  hypothesis = "b1 - 0.25 = 0",
  type = "response"
)

print(results)
```

## Анализ мощности

### Апостериорные анализы мощности

Апостериорный анализ мощности для теста Кокрана-Армитажа:

```{r, posterior_cochrane_armitage_power_analysis}
library(multiCA)

power.CA.test(
  N = 304, # Размер выборки (количество вариантов ответа)
  n.prop = c(0.25, 0.25, 0.25, 0.25), # Пропорция размеров групп на каждом уровне
  pvec = c(0.1711, 0.25, 0.25, 0.3289), # Фактические пропорции правильных ответов на каждом уровне
  sig.level = 0.05, # Уровень значимости альфа
  alternative = "greater" # Направление проверки
)
```

### Априорные анализы мощности

Априорный анализ мощности для теста Кокрана-Армитажа:

```{r, prior_cochrane_armitage_power_analysis}
library(multiCA)

power.CA.test(
  n.prop = c(0.25, 0.25, 0.25, 0.25), # Пропорция размеров групп на каждом уровне
  pvec = c(0.1711, 0.25, 0.25, 0.3289), # Фактические пропорции правильных ответов на каждом уровне
  sig.level = 0.05, # Уровень значимости альфа
  alternative = "greater", # Направление проверки
  power = 0.8 # Необходимая мощность
)
```

Априорный анализ мощности для практически интересного размера эффекта методом Монте-Карло. Расчёт статистической мощности для выборки размером 172 вопроса (688 вариантов ответа):

```{r, prior_practical_power_analysis}
library(marginaleffects)

# Функция расчёта статистической мощность по размеру выборки n_per_level
simulate_power_exact <- function(n_per_level, b0, b1, n_sim, alpha) {
  success_count <- 0

  for (i in 1:n_sim) {
    # 1. Генерируем данные
    sim_detail_level <- rep(1:4, each = n_per_level)
    sim_log_odds <- b0 + b1 * sim_detail_level
    sim_probs <- 1 / (1 + exp(-sim_log_odds))
    sim_correct <- rbinom(length(sim_detail_level), size = 1, prob = sim_probs)

    sim_data <- data.frame(detail_level = sim_detail_level, correct = sim_correct)

    # 2. Обучаем модель
    fit <- glm(correct ~ detail_level, data = sim_data, family = binomial)

    # 3. Используем marginaleffects для проверки значимости эффекта
    results <- predictions(
      fit,
      newdata = datagrid(detail_level = 4),
      hypothesis = "b1 - 0.25 = 0",
      type = "response"
    )

    # 4. Извлекаем одностороннее p-значение
    # Делим на 2, если эффект направлен в ожидаемую сторону (Estimate > 0)
    if (results$estimate > 0) {
      p_val_one_sided <- results$p.value / 2
    } else {
      p_val_one_sided <- 1 - (results$p.value / 2)
    }

    if (p_val_one_sided < alpha) {
      success_count <- success_count + 1
    }
  }

  return(success_count / n_sim)
}

# Расчитываем статистическую мощность
set.seed(42)
estimated_power <- simulate_power_exact(
  n_per_level = 172, # Размер выборки на каждый уровень (количество вопросов)
  b0 = coef(model)[1], # Константа (intercept) в регрессии
  b1 = coef(model)[2], # Коэффициент для переменной detail_level
  n_sim = 100, # Количество симуляций
  alpha = 0.05 # Уровень значимости α
)

print(estimated_power)
```