Sabiá-4: Relatório Técnico
2026Este relatório técnico apresenta o Sabiá-4 e o Sabiazinho-4, uma nova geração de modelos de linguagem com foco em português brasileiro. Os modelos foram desenvolvidos em quatro etapas: pré-treino contínuo em corpora em português e jurídico brasileiro, extensão de contexto longo para 128K tokens, ajuste fino supervisionado e alinhamento de preferências.