Задание №27. Кластерный анализ
№ XTB26C
(Уровень сложности: Средний)
Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких, что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям. Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных его точек минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1, y1) и B(x2, y2) вычисляется по формуле:
В файле A хранятся координаты точек двух кластеров, где H = 6 и W = 4,5 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Известно, что количество точек не превышает 1000.
В файле Б хранятся координаты точек трёх кластеров, где H = 6, W = 5 для каждого кластера. Известно, что количество точек не превышает 10 000. Структура хранения информации в файле Б аналогична структуре в файле А. Известно, что в файле Б имеются координаты ровно трёх «лишних» точек, представляющих аномалии, которые возникли в результате помех при передаче данных. Эти три точки не относятся ни к одному из кластеров, их учитывать не нужно.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: Px – минимальную из абсцисс центров кластеров и Py – минимальную из ординат центров кластеров.
Для файла Б определите координаты центра каждого кластера, затем найдите два числа: Q1 – расстояние между центрами кластеров с минимальным и максимальным количеством точек и Q2 – максимальное расстояние от центра кластера до точки этого же кластера среди всех кластеров.
Гарантируется, что во всех кластерах количество точек различно.
В ответе запишите четыре числа: в первой строке – сначала целую часть абсолютной величины произведения Px × 10 000, затем целую часть абсолютной величины произведения Py × 10 000; во второй строке – сначала целую часть произведения Q1 × 10 000, затем целую часть произведения Q2 × 10 000.
Возможные данные одного из файлов проиллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.
Файлы к заданию:
Заполните таблицу:
| № | 1 | 2 |
|---|---|---|
| 1 | ||
| 2 |
№ LWAZFZ
(Уровень сложности: Базовый)
Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями планет, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.
Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Для каждой планеты дана характеристика: тип цвета, тип светимости и её размер в соответствии с таблицей.

Полученные значения записаны в характеристике слитно: обозначение цвета, светимость (обозначается арабской цифрой) и размер планеты.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1, y1) и B(x2, y2) вычисляется по формуле:
В файле А хранятся данные о звёздах двух кластеров, где Н = 6,5 и W = 4,5 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата х, затем координата у, а затем характеристика звезды. Значения даны в условных единицах. Известно, что количество точек не превышает 1000.
В файле Б хранятся данные о звёздах трёх кластеров, где Н = 6,5 и W = 5 для каждого кластера. Известно, что количество точек не превышает 10 000. Структура хранения информации о звездах в файле Б аналогична файлу А.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: A1 – минимальное расстояние от центра кластера с наименьшим количеством точек до красного гиганта, и A2 – максимальное расстояние от центра кластера с наименьшим количеством точек до красного гиганта.
Для файла Б определите координаты центра каждого кластера, затем найдите два числа: B1 – минимальное расстояние между двумя различными жёлтыми сверхгигантами, расположенными в одном и том же кластере, и B2 – расстояние между центрами кластеров с минимальным и максимальным количеством жёлтых сверхгигантов.
В ответе запишите четыре числа: в первой строке – сначала целую часть абсолютного значения произведения A1 × 10 000, затем целую часть абсолютного значения произведения A2 × 10 000; во второй строке – сначала целую часть абсолютного значения произведения B1 × 10 000, затем целую часть абсолютного значения произведения B2 × 10 000.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию.
Для выполнения задания используйте данные из прилагаемого файла.

Заполните таблицу:
| № | 1 | 2 |
|---|---|---|
| 1 | ||
| 2 |
№ CVNQ0S
(Уровень сложности: Базовый)
Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких, что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям. Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть центром кластера точку (звезду) этого кластера, сумма расстояний от которой до всех остальных его точек минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1, y1) и B(x2, y2) вычисляется по формуле:
Каждая звезда помимо координат на плоской карте характеризуется своим спектральным классом и классом светимости.
Спектральный класс определяет цвет (который связан с температурой звезды) следующим образом.
Каждый из спектральных классов, в свою очередь, делится на подклассы от 0 до 9 в порядке уменьшения температуры.
Обозначение подкласса ставится после обозначения спектрального класса (например, B2).
Класс светимости звезды обозначим римскими цифрами от I до VII.
В файле A хранится информация о точках двух кластеров, где H = 6,0 и W = 5,5 для каждого кластера. В каждой строке сначала записана информация о расположении на карте одной звезды: координата x, затем координата y. Далее в той же строке для звёзд классов светимости I–VI указываются спектральный класс, подкласс и класс светимости. Обозначения классов ничем не разделяются. Для звёзд класса светимости VII (Белый карлик) обозначения спектрального класса и подкласса в файле не указываются. Известно, что количество точек не превышает 2000.
В файле Б хранятся координаты точек трёх кластеров, где H = 6,0, W = 5,5 для каждого кластера. Известно, что количество точек не превышает 10 000. Структура хранения информации в файле Б аналогична структуре в файле А.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: Ax и Ay – абсциссу и ординату красного гиганта, ближайшего к центру кластера, который содержит наименьшее количество точек.
Для файла Б определите координаты центра каждого кластера, затем найдите два числа: B1 – расстояние между центрами кластеров с наименьшим и наибольшим количеством оранжевых гигантов и B2 – наибольшее расстояние между жёлтыми карликами одного кластера.
В ответе запишите четыре числа: в первой строке – сначала целую часть абсолютной величины произведения Ax × 10 000, затем целую часть абсолютной величины произведения Ay × 10 000; во второй строке – сначала целую часть произведения B1 × 10 000, затем целую часть произведения B2 × 10 000.
Пример организации данных в одном из исходных файлов для случая четырёх звёзд
Внимание! Пример приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемых файлов.
Заполните таблицу:
| № | 1 | 2 |
|---|---|---|
| 1 | ||
| 2 |