Janus Pro-7B: a melhor IA de imagens também é da DeepSeek - Drops de Jogos

Janus Pro-7B: a melhor IA de imagens também é da DeepSeek

Resultados de benchmark e natureza de código aberto colocam a geradora de imagens da DeepSeek na frente de todos os concorrentes desenvolvidos pelos EUA.

(Créditos: Montagem Rafael Silva/Drops de Jogos)

Desde que superou o número de downloads do Chat GPT na app Store e derrubou toda a economia de inteligência artificial do ocidente, todos os olhos do mercado estão voltados para a startup chinesa DeepSeek. Mas não é só na parte de textos que as IAs generativas da companhia se destacam: a startup recentemente reportou os resultados do JanusPro-7B, sua mais recente solução de IA para gerar imagens. E, claro, ela também já apresentou resultados melhores do que os concorrentes ocidentais.

O relatório divulgado pela companhia acabou passando batido por muita gente que estava de olho na quantia de dinheiro que alguns dos maiores bilionários do mundo estavam perdendo. Mas quem se interessa por IA precisa ficar de olho na Janus Pro-7B, porque tudo indica que ela será o próximo grande baque no mercado.

O que é a Janus Pro 7B?

Janus Pro-7B é o nome do modelo de inteligência artificial para a análise e geração de imagens desenvolvido pela DeepSeek. Ele possui estrutura auto-regressiva, que permite que a imagem seja construída aos poucos, prompt a prompt.

Por exemplo, se você digita que quer “uma cesta cheia de maçãs”, ela vai gerar a imagem de uma cesta cheia de maçãs. Mas digamos que na imagem gerada a cesta é de plástico e você queria uma cesta de vime. Se você digitar um novo prompt dizendo “quero que a cesta seja de vime”, a IA vai entender que você está falando da cesta cheia de maçãs e irá refazer a imagem com um cesto de vime. Não são todas as IAs que fazem isso, e algumas entregariam uma cesta de vime vazia ou com outras frutas, pois não entenderia que o comando é uma continuação do anterior.

À esquerda, um gráfico que compara a performance média e quantidade de parâmetros reconhecidos da Janus Pro-7B com outras IAs geradoras de imagem multimodal. E à direita, comparação da Janus Pro-7B com outras IAs no entendimento de prompts de texto para a geração de imagens.(Créditos: Divulgação/DeepSeek)

Outra característica da Janus Pro-7B é ser multimodal. Isso significa que ela consegue trabalhar com diferentes dados (como texto e imagem) de forma integrada. Por exemplo, se você faz o upload da capa de uma HQ dos X-Men de 1997 e pede que a IA gere a imagem de um super-herói brasileiro e original baseado naquele traço, ela irá fazer a análise do prompt em texto e da capa da HQ, analisar ambas, entender o contexto que há entre elas e gerar uma imagem nova que tem ambos os comandos como base.

Uma terceira característica é a flexibilidade dessa solução de IA: ela pode variar de 1 bilhão (Janus Pro-1B) até 7 bilhões (Janus Pro-7B) de parâmetros. Isto permite que os usuários possam instalar a IA da empresa em equipamentos menos potentes, ou mesmo escolher uma versão menor e mais rápida para rodar em aplicações que não exigem tanta precisão.

A DeepSeek ainda afirma que o grande diferencial do Janus Pro-7B está na habilidade que ele tem de gerar imagens a partir de um prompt de texto, com resultados que refletem de forma precisa e consistente todos os parâmetros descritos. Na imagem abaixo, podemos ver como ela supera IAs conhecidas como o DALL-E 3 e o Stable Diffusion XL (ambos da OpenAI).

Comparação entre as imagens geradas pela Janus Pro (versão mais atualizada) e a Janus (versão anterior da IA de imagens da DeepSeek) ao receberem o mesmo prompt em texto.(Créditos: Divulgação/DeepSeek)

Por que essa IA da DeepSeek passou despercebida?

Uma explicação para isso foi o quanto as pessoas ficaram impressionadas com o DeepSeek R1. A IA generativa da empresa chegou chutando a porta de toda a concorrência, e mostrou em diversos testes que consegue entregar algo no mesmo nível de qualidade do Chat GPT com um décimo do investimento e usando chips bem mais capengas.

Outro motivo é a dificuldade de usar a Janus Pro. Enquanto o DeepSeek R1 já possui um app de assistente de IA próprio que pode ser baixado no celular por qualquer pessoa, a Janus Pro ainda é uma IA acessível apenas por programadores. Ela é uma solução de código aberto, mas a única forma de usar ela é baixando o código completo dela no GitHub e depois saber o que fazer para instalar ele em algum lugar.

Mas pode ter certeza: assim que a Janus Pro-7B se tornar uma aplicação que o público geral pode acessar, vamos ter mais um dia de desespero nas ações das Big Techs.

Veja nossa campanha de financiamento coletivo, nosso crowdfunding.

DROPS DE JOGOS RELANÇA SUA CAMPANHA DE FINANCIAMENTO COLETIVO

Conheça os canais do Drops de Jogos no YouTube, no Facebook, na Twitch, no TikTok e no Instagram.

** Este texto não reflete, necessariamente, a opinião do Portal UAI.

Subscribe
Notify of
guest
0 Comentários
Inline Feedbacks
View all comments