Описание вычислительного кластера CL120
Вычислительный кластер проектировался и создавался параллельно с проектным, строительным и монтажно-наладочным процессами компьютерного класса в аудитории №120 в 2024 году. В январе 2025 года кластер введён в эксплуатацию.
Было начато реальное использование кластерных параллельных вычислений, освоены классическое и нейросетевое машинное обучение, вошли в арсенал современные языки программирования.
Комплекс получил наименование CL120.
Аппаратная конфигурация
Компонент | Кол-во | Характеристики |
---|---|---|
Вычислительные узлы (ПК) | 35 шт. | 20 ядер, 32 ГиБ RAM, RTX 3050 |
Коммутаторы | 2 шт. | 24 порта, 1 GbE |
Центральный сервер | 1 шт. | 16 ядер, 128 ГиБ RAM |
Программное обеспечение
Категория | Версия | Назначение |
---|---|---|
Операционная система | Debian GNU/Linux 12 | Базовая система на всех узлах |
Фреймворк | Apache Spark 3.5.5 | Параллельная обработка данных, ML |
Плагин GPU | Spark RAPIDS 25.04.0 | Ускорение Spark на GPU (NVIDIA) |
СУБД | PostgreSQL 17.5 | Хранение и аналитика данных |
JDBC-драйвер | PostgreSQL JDBC 42.7.7 | Соединение Java/Spark ↔ PostgreSQL |
Языки программирования
- Python 3.11
- Scala 2.13
- Java 17
- PL/pgSQL
Использование кластера
Все оборудование класса используется в учебное время, согласно расписанию, как обычный учебный компьютерный класс, кроме тех случаев, когда занятие предполагает использование параллельных вычислений.
Во внеурочное время персональные компьютеры перезагружаются в операционную систему GNU/Linux, после чего кластер готов к работе. Впрочем, и в этом случае компьютеры класса могут использоваться как обычные ПК — все кластерные вычисления используют ресурсы ПК в фоновом режиме.
Другими словами: под Linux класс может быть использован в учебных целях как с использованием вычислительного кластера студентами, так и с использованием традиционных, однопользовательских программных средств.
Функции сервера
- Распараллеливание выполняемой задачи
- Хранение данных
- Распределение вычислительной нагрузки и данных между узлами
- Объединение результатов, полученных от узлов
- Самостоятельная работа над задачей в период, когда узлы (ПК) заняты или выключены
Вывод
Университет впервые получил вычислительный кластер, способный в режиме параллельных вычислений решать статистические и иные задачи на больших данных, с использованием как классического машинного обучения, так и глубокого обучения на нейросетях.
Годовой баланс времени
- Учебное время: 8 месяцев × 20 дней × 8 часов = 1280 часов в год
- Полный годовой баланс: 365 × 24 = 8760 часов в год
- Ресурс вычислителя: 8760 – 1280 = 7480 часов в год (или около 85% годового баланса, если считать только вне учебное время)
Примечание:
Это теоретические выкладки. Машину нужно обслуживать, готовить к каждому большому проекту. Небольшие и учебные проекты могут выполняться параллельно, сразу группами, в учебное и вне учебное время. Реальный ресурс CL120 можно будет оценить не менее чем через несколько месяцев или лет эксплуатации.
Примеры использования
В презентации есть несколько примеров использования вычислительного кластера CL120.
Приглашаем
Приглашаем всех, кому нужны исследования больших данных, воспользоваться услугами Лаборатории ЭВТ им. Чепоского.
- Декомпозировать вашу задачу
- Собрать и предобработать данные
- Создать и обучить вашу модель
- Внедрить её в приложение
Контакты
- Кабинеты: 4016, 4011
- Телефоны внутренние: 16-79, 15-07
- Телефон мобильный: +7 926 932-3001
- E-mail: lab-meit@inno.mgimo.ru
Приложения
- Эта статья в PDF: Вычислительный кластер CL120 (PDF)
Подробное описание, состав оборудования, программное обеспечение, языки программирования, использование, функции сервера, выводы и годовой баланс времени. - Презентация: Презентация кластера CL120 (PDF)
История создания, архитектура, используемые технологии, примеры использования, статистика и результаты исследований, контакты лаборатории.
- Блог пользователя an2k
- Войдите, чтобы оставлять комментарии
- 74 просмотра