ezon news feed · digest

Placa de circuito iluminada representando infraestrutura de IA conectada

modelos ★ must-read

Claude Code + GBrain + MCPs: resultado palpável em empresa real

Engenheiros de Ouse Saber conectaram GBrain como camada de memória e dispararam MCPs internos no Claude Code: dashboards, automações e revisão de PRs num único loop. Não é demo — é fluxo de produção rodando há semanas, com queda de retrabalho e tempo de entrega medido, e custo de inferência sob controle. O ponto não é o modelo, é o encanamento ao redor dele.

So what: a vantagem competitiva migrou do modelo para o encanamento. Quem orquestra memória + ferramentas colhe o ganho — não quem tem o "melhor" modelo.

𝕏 x.com/garrytan 11.9

Equipe em reunião de negócios discutindo adoção de ferramentas

marketing ★ must

Empresas reais querem Claude/ChatGPT, não stack própria

Ethan Mollick observa o padrão na base que ele acompanha: empresas não querem construir LLM — querem usar a fronteira já pronta e focar no problema de negócio. Stack própria virou custo afundado para a maioria; o diferencial está em workflow e dados, não em treinar do zero.

So what: posicione a Ezon como integradora de fronteira, não como quem reinventa modelo. O cliente compra resultado, não infra.

𝕏 x.com/emollick 11.9

Fachada de prédio institucional com colunas, sugerindo regulação

mercado ★ must

EUA pode banir uso empresarial de modelos open weights

Sinal regulatório: discussão sobre restringir uso corporativo de modelos de peso aberto nos EUA, citando segurança nacional. Se avançar, muda o cálculo de risco de quem depende de Llama/Mistral em produção e empurra adoção para APIs de fronteira fechadas.

So what: risco de dependência em open weights subiu. Vale ter plano B em Claude/API fechada antes de a regra fechar.

𝕏 x.com/emollick 10.9

modelos ezon · sem og:image

Deploy de LLM open-source em produção: opções acessíveis

Thread no r/MachineLearning compara caminhos baratos para servir modelos abertos: vLLM, quantização e GPUs spot. Útil como referência de custo, mas o consenso ainda é: só vale se você tem volume e expertise de ops.

So what: mapa de custo útil — mas pra Ezon, o trade-off ops dificilmente compensa vs. API de fronteira.

r/ r/MachineLearning 9.9

Mesa de trabalho com anotações de planejamento de conteúdo e roteiro

marketing secundário

Roteiro de VSL com prompt versionado: consistência que escala

Padrão emergente de growth: tratar o prompt do roteiro como ativo versionado, não como improviso por campanha. Mesma estrutura de gancho, prova e oferta, parametrizada por avatar — reduz variância e acelera teste A/B.

So what: prompt como ativo de marca = roteiros consistentes em escala. Abaixo, o template real que a Ezon usa.

ver prompt do roteiro

vsl-roteiro · v3 · método deep

# Papel
Você é copywriter sênior do Método DEEP (Ezon).
Avatar: {avatar} · Oferta: {oferta} · Objeção #1: {objecao}

# Estrutura (não pule etapas)
1. Gancho — quebra de padrão em "1 frase"
2. Prova — caso concreto, número real
3. Mecanismo — por que funciona (o "deep")
4. Oferta + CTA — escassez honesta

# Tom
pt-BR, direto, sem hype. Frases curtas.
Saída: roteiro falado, ~90s, marcações [PAUSA] e [B-ROLL].

𝕏 x.com/garrytan 9.4

Vista da Terra com luzes conectadas, simbolizando fronteira e escala

frontier secundário

Contexto de 1M tokens muda o design de agentes

Com janelas de 1M tokens estáveis, RAG agressivo deixa de ser obrigatório para muitos casos. Dá pra carregar a base inteira e deixar o modelo navegar — simplifica arquitetura, mas o custo por chamada sobe.

So what: revise pipelines de RAG da Ezon — parte pode virar "contexto cheio" mais simples e barato de manter.

𝕏 x.com/emollick 8.8

paper ezon · sem og:image

SFT de SLM em traces de agentes frontier reduz custo em 100x

Paper destila o comportamento de um agente de fronteira em um modelo pequeno via fine-tuning supervisionado nos traces.

So what: caminho concreto pra rodar tarefas repetitivas a 1% do custo — destile o agente caro, sirva o barato.

r/ r/MachineLearning 8.3

Gráfico de tendência de queda exibido em tela, representando custo de inferência

mercado secundário

Preço de inferência despenca de novo e reabre casos de uso

Mais uma rodada de queda no custo por token nos modelos de fronteira. Tarefas que antes não fechavam a conta voltam ao radar — atendimento, geração em massa e classificação ficam viáveis.

So what: reabra a lista de casos "caros demais" da Ezon — alguns agora fecham a conta e viram oferta.

𝕏 x.com/emollick 8.1

Painel de métricas e gráficos de avaliação em monitor

modelos secundário

Avaliação de agentes ainda é o gargalo, não a capacidade

Discussão recorrente: o modelo já consegue, mas medir se a tarefa saiu certa continua manual e caro. Sem eval confiável, ninguém solta o agente sozinho em produção — o "human in the loop" persiste por falta de medição, não de capacidade.

So what: investir em eval automatizado é o que destrava autonomia real nos agentes da Ezon. Capacidade já temos.

r/ r/MachineLearning 7.6

O que de fato importa em IA, mercado e produto.