ezon news feed

Equipe trabalhando em frente a múltiplas telas com código e dashboards

modelos

x.com/garrytan · 11.9 must-read

Claude Code + GBrain + MCPs: resultado palpável em empresa real

Garry Tan relata um caso concreto de produção: a combinação de Claude Code com uma camada de memória (GBrain) e servidores MCP gerou ganho mensurável de throughput numa equipe real — não em demo, mas em fluxo de trabalho diário. O fio detalha onde o agente entregou e onde ainda precisou de supervisão humana.

so what: A tese de "agente + memória persistente + ferramentas via MCP" deixou de ser promessa e virou arquitetura replicável. Para a Ezon, é o gabarito de como empacotar agentes pra clientes: o valor está na orquestração, não no modelo cru.

abrir fonte

imagem do og:image da fonte na implementação real

Reunião de negócios com pessoas discutindo estratégia ao redor de uma mesa

marketing

x.com/emollick · 11.9 must-read

Empresas reais querem Claude/ChatGPT, não stack própria

Ethan Mollick argumenta, com base em conversas com líderes de empresas tradicionais, que a maioria não quer construir infra de IA própria — quer o produto pronto (Claude, ChatGPT) integrado ao fluxo. O custo e o risco de manter modelos in-house raramente compensam fora das big techs.

so what: Confirma o posicionamento da Ezon: vender integração e camada de aplicação sobre modelos de prateleira, não prometer LLM proprietário. O fosso competitivo é o domínio do problema do cliente, não o peso do modelo.

abrir fonte

imagem do og:image da fonte na implementação real

mercado

sem og:image · tile de marca

x.com/emollick · 10.9 must-read

EUA pode banir uso empresarial de modelos open weights

Discussão sobre proposta regulatória que restringiria o uso comercial de modelos de pesos abertos por empresas nos EUA, sob argumento de segurança nacional. O thread pondera o efeito colateral: empurrar PMEs de volta para APIs fechadas e concentrar ainda mais o mercado.

so what: Risco de cauda para quem aposta em stack open-weights self-hosted. Para a Ezon, reforça a resiliência de depender de APIs gerenciadas — mas vale monitorar: regulação assim redesenha custo e disponibilidade da camada base.

abrir fonte

Pessoa gravando vídeo com câmera e iluminação de estúdio

marketing

x.com/ezonpartners · 10.4 must-read

Roteiro de Reels que converte: estrutura gancho → tensão → prova

Breakdown de um roteiro de vídeo curto que performou acima da média numa campanha real da Ezon. A peça abre com um gancho de 1,5s, instala tensão com um custo concreto e fecha com prova social — pronto para virar template no método DEEP.

so what: O padrão é destilável em prompt reutilizável para o agente de copy. Toca em "ver prompt do roteiro" e adapta direto pro próximo cliente — economia de tempo real no fluxo de produção.

prompt_reels_deep.md

# Roteiro Reels — método DEEP (Ezon)
papel: copywriter sênior de performance
objetivo: roteiro de 18-22s, ratio de retenção alto

estrutura obrigatória:
  1. gancho  → 1.5s, quebra de padrão visual + dor
  2. tensão  → custo concreto de NÃO agir
  3. prova   → número ou caso real, 1 só
  4. cta     → 1 ação, verbo no imperativo

restrições:
  - PT-BR, sentence case, zero jargão
  - frases < 12 palavras
  - sem promessa que o produto não cumpre

entrada: {produto}, {avatar}, {oferta}
saida: roteiro em blocos + sugestão de b-roll

abrir fonte

imagem do og:image da fonte na implementação real

Racks de servidores em um data center iluminado

modelos

r/MachineLearning · 9.9 secundário

Deploy de LLM open-source em produção: opções acessíveis

Thread comparando caminhos de baixo custo para servir modelos abertos em produção — vLLM, llama.cpp, Ollama em VPS, e provedores de GPU sob demanda. A comunidade detalha trade-offs de latência, custo por token e esforço de manutenção para cada rota.

so what: Mapa útil de plano B caso o custo de API gerenciada estoure num projeto de margem apertada. Não muda o default da Ezon (API), mas é munição pra precificar a opção self-hosted com honestidade.

abrir fonte

imagem do og:image da fonte na implementação real

frontier

sem og:image · tile de marca

x.com/AnthropicAI · 9.6 secundário

Janela de contexto longa muda padrão de design de agentes

Discussão sobre como contextos muito longos deslocam parte do trabalho que hoje fica em RAG/orquestração para dentro do próprio prompt. O ponto central: nem tudo precisa de pipeline — às vezes "jogar tudo no contexto" é mais simples e robusto do que recuperar.

so what: Reforça a "simplicidade calibrada": antes de montar RAG, perguntar se o contexto já resolve. Menos infra pra manter por cliente = margem melhor e menos pontos de falha.

abrir fonte

Quadro coberto de fórmulas e diagramas matemáticos

paper

r/MachineLearning · 8.3 papers

SFT de SLM em traces de agentes frontier reduz custo em 100x

Paper mostra que fazer fine-tuning supervisionado (SFT) de um small language model sobre traces de um agente frontier preserva boa parte da qualidade em tarefas específicas, com custo de inferência ordens de grandeza menor. A destilação de "comportamento de agente" se prova viável em escala.

so what: Caminho concreto para baratear agentes em produção: rodar o frontier pra gerar dados, destilar num SLM pro caminho quente. Pra Ezon, é como entregar margem em volume sem degradar a experiência do cliente.

abrir fonte

imagem do og:image da fonte na implementação real

mercado

x.com/sama · 8.8 secundário

Preço de inferência cai de novo: pressão sobre quem revende tokens

Anúncio de mais um corte de preço por token nos modelos de ponta. A leitura do mercado: margem de quem só revende acesso a API encolhe, e o valor migra para quem entrega resultado de negócio em cima do modelo.

so what: Validação direta do modelo de receita da Ezon: não competir em preço de token, competir em outcome. Cada queda de preço aumenta a margem de quem cobra por valor entregue, não por chamada de API.

abrir fonte

imagem do og:image da fonte na implementação real

Linhas de código coloridas projetadas em tela escura

modelos

x.com/swyx · 10.1 must-read

Subagentes paralelos viram padrão para tarefas de pesquisa

Relato de como dividir uma tarefa de pesquisa entre subagentes paralelos — cada um varrendo uma fatia — e consolidar no fim reduz drasticamente o tempo de parede e melhora a cobertura, comparado a um único agente sequencial trabalhando o problema inteiro.

so what: Padrão diretamente aplicável aos squads de agentes da Ezon: fan-out paralelo para investigação, fan-in para síntese. Mais throughput por tarefa sem aumentar custo por token de forma linear.

abrir fonte

imagem do og:image da fonte na implementação real

Dashboard de analytics com métricas de campanha em monitor

marketing

x.com/marketingexa · 7.9 secundário

Agente de SDR com memória dobra taxa de resposta em outbound

Estudo de caso de um agente de prospecção que mantém memória de cada conta entre toques — referenciando contexto anterior em vez de recomeçar do zero. Resultado: cadência mais humana e quase o dobro de taxa de resposta versus sequência genérica.

so what: Caso de uso de prateleira para clientes B2B da Ezon: memória de conta como diferencial competitivo no outbound. Combina direto com a tese de "agente + memória" do card do Garry Tan.

abrir fonte

imagem do og:image da fonte na implementação real

ezon news feed — aba digest, timeline social contínua de múltiplos dias

Claude Code + GBrain + MCPs: resultado palpável em empresa real

Empresas reais querem Claude/ChatGPT, não stack própria

EUA pode banir uso empresarial de modelos open weights

Roteiro de Reels que converte: estrutura gancho → tensão → prova

Deploy de LLM open-source em produção: opções acessíveis

Janela de contexto longa muda padrão de design de agentes

SFT de SLM em traces de agentes frontier reduz custo em 100x

Preço de inferência cai de novo: pressão sobre quem revende tokens

Subagentes paralelos viram padrão para tarefas de pesquisa

Agente de SDR com memória dobra taxa de resposta em outbound