Blog da Maritaca

·20 min de leitura

Por que o Brasil precisa treinar suas próprias IAs do zero, e um plano para fazer isso

Por que o Brasil precisa dominar a pilha de LLMs antes que a janela feche, e como organizar um programa de financiamento competitivo em três fases para fazer isso acontecer.

·25 min de leitura

Escalando treinamento de LLMs na Maritaca AI

Como construímos cada nova geração da família Sabiá: o ciclo de desenvolvimento centrado em benchmarks, a pirâmide de escala que parte de centenas de experimentos em modelos pequenos e termina no treinamento da versão final, e as escolhas de arquitetura, dados e infraestrutura que sustentam essa cadência.

·6 min de leitura

Persuasão em LLMs: até onde modelos de linguagem influenciam opiniões

Estudo sobre a capacidade de modelos de linguagem persuadirem usuários, com experimentos controlados e análise de risco.

·5 min de leitura

LLM Bias Bench: medindo viés ideológico em modelos de linguagem

Apresentamos um benchmark para medir vieses ideológicos em LLMs, com análise de modelos comerciais e abertos em português.

·6 min de leitura

Sabiá-4

Estamos introduzindo nossa nova geração de modelos com Sabiazinho-4 e Sabiá-4, com melhorias no domínio jurídico, uso de contexto longo, seguir instruções e capacidades de agente.

·7 min de leitura

Sabiazinho-4

Estamos introduzindo nosso novo modelo focado em velocidade e baixo custo: Sabiazinho-4, com melhorias no domínio jurídico, uso de contexto longo, seguir instruções e capacidades de agente.