Tecnologia

Hewlett Packard Enterprise lança portfólio completo de ponta a ponta nativo em IA para GenAI

Drops de Jogos recebeu informações oficiais da HP.  Hewlett Packard Enterprise lança portfólio completo de ponta a ponta nativo em IA para GenAI.

Hoje, durante a conferência NVIDIA GTC, a Hewlett Packard Enterprise (NYSE: HPE) anunciou atualizações para um dos portfólios mais abrangentes do setor em IA nativa, para avançar na operação da IA generativa (GenAI), deep learning e aplicações de Machine Learning (ML). As atualizações incluem:

  • Disponibilidade de duas soluções full-stack para a IA Generativa, co-desenvolvidas pela HPE e NVIDIA;
  • Uma prévia do HPE Machine Learning Inference Software;
  • Uma arquitetura referência em Geração Aumentada de Recuperação (RAG) empresarial;
  • Suporte para desenvolver futuros produtos desenvolvidos na nova plataforma NVIDIA Blackwell;

“Para cumprir com nossa promessa da IA Generativa e abordar de forma eficaz todo o ciclo de vida da IA, as soluções devem ser híbridas por design”, explica Antonio Neri, presidente e CEO da HPE. “Desde o treinamento e ajuste de modelos in-loco, implementados em colocation ou na nuvem pública, até a inferência na borda, a IA é uma carga de trabalho para nuvem híbrida. A HPE e a NVIDIA têm uma longa história de inovação e colaboração, e continuaremos a fornecer soluções de software e hardware de IA co-desenvolvidas para ajudar nossos clientes a acelerarem o desenvolvimento e a implementação da GenAI do conceito à produção”.

“A IA Generativa pode transformar dados de dispositivos conectados na rede, datacenters ou em nuvem em insights que desbloqueiam um novo potencial para empresas”, disse Jensen Huang, fundador e CEO da NVIDIA. “Nossa colaboração com a HPE irá permitir que as empresas disponham de uma produtividade sem precedentes, para aproveitar seus dados e implementar aplicações de IA para transformar seus negócios”.

Treinamento e ajuste de GenAI potencializados pela supercomputação

Anunciada durante a SC23, a solução de supercomputação da HPE para IA generativa agora está disponível para pedidos de empresas que buscam uma solução full-stack pré-configurada e pré-testada para o desenvolvimento e treinamento de grandes modelos de IA. Projetada para ajudar a aceleração de projetos de GenAI e deep learning dos clientes, a solução pronta para uso é alimentada pela NVIDIA, e pode suportar até 168 superchips Grace Hopper GH200. O recurso permite que grandes empresas, instituições de pesquisa e entidades governamentais simplifiquem o processo de desenvolvimento de modelos por meio de um stack de software de IA/ML, que auxilia os clientes a desenvolverem seus projetos de GenAI e deep learning, incluindo LLMs, sistemas de recomendação e bancos de dados de vetores. Entregue com serviços de implementação e configuração, a solução pronta para uso é projetada para centros de pesquisa de IA e grandes empresas, para alcançar uma melhor relação entre tempo e custo e acelerar o treinamento de 2 a 3 vezes.

Para mais informações, visite o site da solução HPE de supercomputação para a IA Generativa.

Ajuste e inferência de GenAI a nível empresarial

Apresentada durante o Discover Barcelona 2023, a solução HPE de supercomputação para a IA Generativa está disponível para clientes diretamente ou por meio do HPE GreenLake, com um modelo flexível pay-per-use. Desenvolvido em conjunto com a NVIDIA, a solução pré-configurada para ajuste e inferência é projetada para reduzir o tempo e os custos de implementação, oferecendo o poder de computação, armazenamento, software, rede e serviços de consultoria adequados que as organizações precisam para desenvolver aplicações de IA Generativa. A solução full-stack nativa em IA disponibiliza para as empresas a velocidade, escala e controle necessários para adaptar modelos fundamentais, usando dados privados e implementando aplicações de GenAI dentro de um modelo de nuvem híbrida.

Com um cluster de alta performance para computação de IA e o software desenvolvido pela HPE e NVIDIA, a solução é ideal para o ajuste preciso de modelos de linguagem, RAG e inferência de escala. O tempo de ajuste preciso para um modelo Llama2 com 70 bilhões de parâmetros rodando nesta solução diminui linearmente com a contagem de nós, levando seis minutos em um sistema de 16 nós¹. A velocidade e o desempenho permitem que os clientes obtenham uma escala entre tempo e valor superior, melhorando a produtividade empresarial em aplicações de IA como assistentes virtuais, chatbots, além de pesquisas empresariais.

Utilizando os servidores HPE ProLiant DL380a Gen11, a solução é pré-configurada com GPUs da NVIDIA, além do NVIDIA Spectrum-X Ethernet networking e DPUs NVIDIA BlueField-3 . A solução é aprimorada via software de Machine Learning e análise da HPE e também via NVIDIA AI Enterprise 5.0, que conta com o microsserviço NVIDIA NIM, otimizado para inferência de modelos de IA Generativa, além do NVIDIA NeMo Retriever e outras bibliotecas de IA e Data Science.

Para melhorar os resultados em IA, os especialistas da HPE Services ajudarão as empresas a projetar, implementar e gerenciar a solução, que inclui o uso de técnicas adequadas de ajuste de modelos.

Do protótipo à produtividade

A HPE e a NVIDIA estão colaborando no desenvolvimento de softwares que ajudarão empresas a darem o próximo passo ao transformar provas de conceito de IA e Machine Learning em aplicações de produção. Disponível para clientes da HPE como uma prévia, o HPE Machine Learning Inference Software permitirá que as empresas implementem rapidamente e de forma segura modelos de ML em escala. A nova oferta se integrará ao NVIDIA NIM para fornecer modelos otimizados pela NVIDIA usando contêineres pré-construídos.

Para auxiliar as empresas que precisam desenvolver e aderir rapidamente aplicações de GenAI que envolvem dados privados, a HPE desenvolveu uma arquitetura de referência empresarial RAG, já disponível, que se baseia na arquitetura de microsserviços do NVIDIA NeMo Retriever. A oferta consiste em uma base de dados abrangente do Software HPE Ezmeral Data Fabric e do HPE GreenLake for File Storage. A nova arquitetura de referência oferecerá às empresas um modelo para criar chatbots personalizados, geradores ou copilots.

Ajudando na preparação de dados, treinamento, e inferência de IA, a solução combina todo o espectro de ferramentas e soluções open-source do HPE Ezmeral Unified Analytics Software e do software de IA da HPE, que inclui os softwares de Gerenciamento de Dados de Machine Learning HPE, Ambiente de Desenvolvimento de Machine Learning HPE, e o novo Software de Inferência de Machine Learning HPE. O software de IA da HPE está disponível tanto nas soluções de supercomputação quanto de computação empresarial da HPE para IA generativa, fornecendo um ambiente consistente para os clientes gerenciarem suas cargas de trabalho em IA Generativa.

Soluções de nova geração construidas na plataforma NVIDIA Blackwell

A HPE desenvolverá futuros produtos baseados na recém-anunciada plataforma NVIDIA Blackwell, que incorpora o Transformer Engine de segunda geração para acelerar as cargas de trabalho envolvendo a IA Generativa. Detalhes adicionais e disponibilidade para os futuros produtos da HPE apresentando o Superchip NVIDIA GB200 Grace Blackwell, HGX B200 e o HGXB100 serão anunciados futuramente.

¹ Com base em benchmarks internos de ajustes do llama-recipes finetuning.py, que acompanhou o tempo médio do epoch para o ajuste preciso de oito nós em 594 segundos e 16 nós em 369 segundos com flash attention e ajuste preciso e eficiente de parâmetros.

Sobre a Hewlett Packard Enterprise

A Hewlett Packard Enterprise (NYSE: HPE) é uma empresa global da borda à nuvem que ajuda organizações a acelerarem os resultados ao liberar valor de todos os seus dados, em qualquer lugar. Com base em décadas reimaginando o futuro e inovando para aprimorar a maneira como as pessoas vivem e trabalham, a HPE oferece soluções de tecnologia exclusivas, abertas e inteligentes. Com ofertas que abrangem serviços de nuvem, computação, computação de alto desempenho & IA, borda inteligente, software e armazenamento, a HPE oferece uma experiência consistente em todas as nuvens e bordas, ajudando os clientes a desenvolver novos modelos de negócios, engajar de novas maneiras e aumentar o desempenho operacional. Para mais informações, visite o site oficial.

Solução de supercomputação HPE para a IA Generativa. Foto: Divulgação

Veja nossa campanha de financiamento coletivo, nosso crowdfunding.

Conheça os canais do Drops de Jogos no YouTube, no Facebook, na Twitch, no TikTok e no Instagram.

Pedro Zambarda

É jornalista, escritor e comunicador. Formado em Jornalismo pela Faculdade Cásper Líbero e em Filosofia pela FFLCH-USP. É editor-chefe do Drops de Jogos e editor do projeto Geração Gamer. Escreve sobre games, tecnologia, política, negócios, economia e sociedade. Email: dropsdejogos@gmail.com ou pedrozambarda@gmail.com.

Thank you for trying AMP!

We have no ad to show to you!