Uma Arquitetura Baseada em Pacotes para Inferência de IA na Borda
Apesar das melhorias significativas no rendimento, os aceleradores de IA na borda (Unidades de Processamento Neural, ou NPUs) ainda são frequentemente subutilizados. A gestão ineficiente de pesos e ativações leva …