- Together AI processa mais de 400 trilhões de tokens mensais em inferência
- Receita anualizada chega a US$ 1 bilhão no início de 2026
- Volume diário saltou de 1 bilhão para mais de 1 trilhão de tokens
A Together AI cruzou a marca de 400 trilhões de tokens processados por mês em sua plataforma de inferência na nuvem. Há um ano, o volume era de 30 bilhões. A conta dá um salto próximo de 13.000 vezes em doze meses, segundo dados divulgados pelo fundador Vipul Ved Prakash.
O número coloca a empresa entre as infraestruturas de inteligência artificial que mais crescem no mundo. E, diferente de boa parte do setor, o avanço vem acompanhado de receita real, não apenas valuation inflado por rodadas de venture capital.
Receita anualizada chega a US$ 1 bilhão
A Together AI atingiu uma receita anualizada estimada em US$ 1 bilhão no início de 2026. O dado não se refere a captação ou avaliação de mercado, mas a faturamento efetivo da operação. O processamento diário, que rodava na casa de 1 bilhão de tokens há doze meses, ultrapassou 1 trilhão de tokens por dia.
O modelo de negócio é direto. A empresa oferece infraestrutura para rodar modelos de código aberto com custo significativamente menor do que as APIs proprietárias da OpenAI e da Anthropic. Em escala empresarial, a diferença de preço por token vira economia de milhões de dólares por mês.
O recado para o investidor que acompanha o setor é o seguinte, a corrida da IA deixou de ser sobre quem treina o modelo mais inteligente. Passou a ser sobre quem entrega inferência o uso prático do modelo em produção com a menor latência e o menor custo por token. Treinamento é despesa pontual. Inferência roda 24 horas por dia e escala junto com o número de usuários.
Vector Core Compute fecha primeiro contrato comercial
Em 3 de junho de 2026, a Together AI se tornou o primeiro cliente comercial da nova nuvem de inferência da Vector Core Compute. A arquitetura combina CPU, GPU e RDU (unidades reconfiguráveis de fluxo de dados) em formato híbrido, voltado para cargas de trabalho de alta vazão.
O acordo mira um problema real. Conforme modelos abertos como a família Llama, da Meta, ganham espaço, a camada de inferência tende a se comoditizar rápido. Travar vantagem em hardware de próxima geração antes que o mercado fique saturado vira diferencial competitivo. A Together AI parece já estar jogando esse jogo.
Sombra da IA pesa sobre o Bitcoin
Para quem investe em cripto no Brasil, o crescimento da Together AI ajuda a contextualizar uma tese que vem sendo discutida há meses. A BlackRock alertou que o boom da IA está sugando capital que historicamente migrava para o Bitcoin em ciclos de risk-on. Capex bilionário em data centers, em chips e em infraestrutura de inferência concorre diretamente pela atenção de fundos de tecnologia.
O BTC é negociado a US$ 62.483 (R$ 323.291,60) nesta terça-feira, em queda de 2% em 24 horas. O ETH recua 3% e opera a US$ 1.664,15. O contraste com o ritmo da Together AI é didático, enquanto a camada de IA registra receita anualizada de US$ 1 bilhão em doze meses, o Bitcoin segue absorvendo pressão vendedora de holders e ETFs.
No mercado brasileiro, o efeito tende a aparecer de duas formas. Exchanges locais como Mercado Bitcoin e Foxbit precisam disputar atenção do investidor pessoa física contra ações de empresas de IA negociadas via BDR. E mineradoras de Bitcoin listadas, que vêm pivotando para hospedar cargas de IA, encontram na demanda por inferência uma fonte de receita potencialmente mais estável do que o hash rate.
A informação foi divulgada pelo próprio fundador da empresa em publicação no X. O número de 400 trilhões de tokens posiciona a Together AI ao lado de provedores como Fireworks AI e Anyscale na disputa pela camada de inferência open-source segmento onde a Llama 4 e modelos da Mistral concentram a maior parte do volume processado globalmente.