Перейти к основному содержимому
Перейти к основному содержимому

cramersV

cramersV

Введено в версии v22.1.0

Cramer's V (иногда также называемая Cramer's phi) — это мера связи между двумя столбцами в таблице. Результат функции cramersV лежит в диапазоне от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только тогда, когда каждое значение полностью определяется другим. Эту меру можно рассматривать как связь между двумя переменными, выраженную в процентах от их максимально возможной вариации.

Примечание

Вариант Cramer's V с коррекцией смещения см.: cramersVBiasCorrected

Синтаксис

cramersV(column1, column2)

Аргументы

  • column1 — Первый столбец для сравнения. (U)Int* или Float* или Decimal
  • column2 — Второй столбец для сравнения. (U)Int* или Float* или Decimal

Возвращаемое значение

Возвращает значение от 0 (что соответствует отсутствию связи между значениями столбцов) до 1 (полная связь). Float64

Примеры

Отсутствие связи между столбцами

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );
┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

Сильная связь между столбцами

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            if (number % 12 = 0, (number + 1) % 5, number % 5) AS b
        FROM
            numbers(150)
    );
┌─────cramersV(a, b)─┐
│ 0.9066801892162646 │
└────────────────────┘