С бързото нарастване на AI приложенията, водени от модели като ChatGPT, търсенето на изчислителна мощност рязко нарасна. За да отговори на нарастващите изчислителни изисквания на ерата на AI, H3C Group, под егидата на Tsinghua Unigroup, наскоро представи 11 нови продукта в серията H3C UniServer G6 и HPE Gen11 на NAVIGATE Leader Summit 2023. Тези нови сървърни продукти създават цялостна матрица за AI в различни сценарии, осигурявайки мощна основна платформа за обработка на масивни данни и моделни алгоритми и осигурявайки достатъчно количество изчислителни ресурси за AI.
Разнообразна продуктова матрица за посрещане на разнообразни компютърни нужди с изкуствен интелект
Като лидер в интелигентните изчисления, H3C Group е дълбоко ангажирана в областта на AI от много години. През 2022 г. H3C постигна най-високия темп на растеж на китайския пазар на ускорени изчисления и натрупа общо 132 световни класации в световноизвестния бенчмарк за изкуствен интелект MLPerf, демонстрирайки своя силен технически опит и възможности.
Възползвайки се от усъвършенствана изчислителна архитектура и възможности за интелигентно управление на изчислителната мощност, изградени върху основата на интелигентните изчисления, H3C разработи флагмана за интелигентни изчисления H3C UniServer R5500 G6, специално проектиран за широкомащабно обучение на модели. Те също така представиха H3C UniServer R5300 G6, хибридна изчислителна машина, подходяща за мащабни сценарии за извод/обучение. Тези продукти освен това отговарят на разнообразните компютърни изисквания в различни сценарии с ИИ, осигурявайки цялостно покритие на ИИ изчисления.
Флагман за интелигентни изчисления, предназначен за обучение на широкомащабни модели
H3C UniServer R5500 G6 съчетава сила, ниска консумация на енергия и интелигентност. В сравнение с предишното поколение, той предлага три пъти по-голяма изчислителна мощност, намалявайки времето за обучение със 70% за сценарии за обучение на широкомащабни модели на GPT-4. Приложим е за различни бизнес сценарии на AI, като широкомащабно обучение, разпознаване на реч, класификация на изображения и машинен превод.
Сила: R5500 G6 поддържа до 96 CPU ядра, осигурявайки 150% увеличение на производителността на ядрото. Той е оборудван с новия 8-GPU модул NVIDIA HGX H800, осигуряващ 32 PFLOPS изчислителна мощност, което води до 9x подобрение в скоростта на обучение на AI модел в голям мащаб и 30x подобрение в производителността на изводите на AI модел в голям мащаб. Освен това, с поддръжката на PCIe 5.0 и 400G мрежа, потребителите могат да разположат по-високопроизводителни AI изчислителни клъстери, ускорявайки приемането и прилагането на AI в предприятията.
Интелигентност: R5500 G6 поддържа две топологични конфигурации, интелигентно адаптиране към различни сценарии на AI приложения и ускоряване на задълбочено обучение и научни изчислителни приложения, като значително подобрява използването на GPU ресурсите. Благодарение на функцията за много инстанции на GPU на модула H800, един H800 може да бъде разделен на 7 GPU инстанции, с възможност за до 56 GPU инстанции, всяка от които има независими изчислителни и паметови ресурси. Това значително подобрява гъвкавостта на AI ресурсите.
Нисък въглероден отпечатък: R5500 G6 напълно поддържа течно охлаждане, включително течно охлаждане както за CPU, така и за GPU. С PUE (Ефективност на използването на енергия) под 1,1, той позволява „готино изчисление“ в разгара на изчислителния скок.
Струва си да се спомене, че R5500 G6 беше признат за един от „Топ 10 изключителни високопроизводителни сървъри за 2023 г.″ в „2023 Power Ranking for Computational Performance“ при пускането му.
Хибридна изчислителна машина за гъвкаво съпоставяне на изискванията за обучение и изводи
H3C UniServer R5300 G6, като следващо поколение AI сървър, предлага значителни подобрения в спецификациите на CPU и GPU в сравнение със своя предшественик. Той може да се похвали с изключителна производителност, интелигентна топология и интегрирани възможности за изчисление и съхранение, което го прави подходящ за обучение по модели за задълбочено обучение, изводи за задълбочено обучение и други сценарии на приложение на AI, гъвкаво отговарящи на нуждите от обучение и изчисления за изводи.
Изключителна производителност: R5300 G6 е съвместим с най-новото поколение графични процесори NVIDIA от корпоративен клас, осигурявайки 4,85x подобрение на производителността в сравнение с предишното поколение. Той поддържа различни видове карти за ускорение на AI, като GPU, DPU и NPU, за да отговори на изискванията за хетерогенна изчислителна мощност на AI в различни сценарии, давайки възможност на ерата на интелигентността.
Интелигентна топология: R5300 G6 предлага пет настройки за топология на GPU, включително HPC, паралелен AI, сериен AI, директен достъп с 4 карти и директен достъп с 8 карти. Тази безпрецедентна гъвкавост значително подобрява адаптивността към различни сценарии на потребителско приложение, интелигентно разпределя ресурси и управлява ефективна работа с изчислителна мощност.
Интегрирани изчисления и съхранение: R5300 G6 гъвкаво приспособява карти за ускорение с изкуствен интелект и интелигентни NIC, комбинирайки възможности за обучение и изводи. Той поддържа до 10 графични процесора с двойна ширина и 24 слота за твърд диск LFF (Large Form Factor), позволявайки едновременно обучение и изводи на един сървър и предоставяйки рентабилен изчислителен двигател за среди за разработка и тестване. С капацитет за съхранение до 400TB, той напълно отговаря на изискванията за пространство за съхранение на AI данни.
С нарастващия бум на ИИ изчислителната мощ непрекъснато се променя и се поставя под предизвикателство. Пускането на следващото поколение сървъри с изкуствен интелект бележи още един крайъгълен камък в ангажимента на H3C Group към технологията на „присъщата интелигентност“ и нейния непрекъснат стремеж за еволюция на интелигентните изчисления.
С поглед към бъдещето, ръководен от стратегията „Cloud-Native Intelligence“, H3C Group се придържа към концепцията за „внимателен прагматизъм, даряващ ерата с интелигентност“. Те ще продължат да обработват плодородната почва на интелигентните изчисления, да изследват сценарии за приложения на AI на дълбоко ниво и да ускорят пристигането на интелигентен свят с готова за бъдещето, адаптивна изчислителна мощност.
Време на публикуване: 04 юли 2023 г