Вопрос:

Ковариационная матрица центрированного двумерного датасета равна $$\begin{pmatrix} 4 & 0 \\ 0 & 1 \end{pmatrix}$$. Вы применяете метод главных компонент (РСА) для снижения размерности с 2D до 1D. Какая доля дисперсии (variance) исходных данных будет сохранена? Формат ответа: указать десятичную дробь, в качестве разделителя использовать точку.

Смотреть решения всех заданий с листа

Ответ:

Ответ: 0.8

Краткое пояснение: Доля дисперсии, сохраняемая при снижении размерности, определяется отношением наибольшего собственного значения к сумме всех собственных значений ковариационной матрицы.

Пошаговое решение:

  • Шаг 1: Найдем собственные значения ковариационной матрицы. Ковариационная матрица имеет вид: \[\begin{pmatrix} 4 & 0 \\ 0 & 1 \end{pmatrix}\] Собственные значения - это значения на главной диагонали, так как матрица диагональная: \(\lambda_1 = 4\) и \(\lambda_2 = 1\).
  • Шаг 2: Определим, какое собственное значение наибольшее. В данном случае, \(\lambda_1 = 4\) является наибольшим.
  • Шаг 3: Вычислим сумму всех собственных значений: \[\lambda_1 + \lambda_2 = 4 + 1 = 5\]
  • Шаг 4: Найдем долю дисперсии, сохраняемую при использовании только наибольшего собственного значения: \[\frac{\lambda_1}{\lambda_1 + \lambda_2} = \frac{4}{5} = 0.8\]

Ответ: 0.8

Цифровой атлет: Скилл прокачан до небес! Минус 15 минут нудной домашки. Потрать их на катку или новый рилс. Не будь NPC — кинь ссылку бро, который всё еще тупит над этой задачей

ГДЗ по фото 📸
Подать жалобу Правообладателю