Finalmente temos uma definição para IA de código aberto

Publicado originalmente por MIT Technology Review

A IA de código aberto está em todo lugar agora. O problema é que ninguém concorda sobre o que ela realmente é. Agora podemos finalmente ter uma resposta. A Open Source Initiative (OSI), os árbitros autonomeados do que significa ser de código aberto, lançou uma nova definição, que espera que ajude os legisladores a desenvolver regulamentações para proteger os consumidores dos riscos da IA. 

Embora a OSI tenha publicado muito sobre o que constitui tecnologia de código aberto em outros campos, isso marca sua primeira tentativa de definir o termo para modelos de IA. Ela pediu a um grupo de 70 pessoas de pesquisadores, advogados, formuladores de políticas e ativistas, bem como representantes de grandes empresas de tecnologia como Meta, Google e Amazon, para chegar à definição de trabalho. 

De acordo com o grupo, um sistema de IA de código aberto pode ser usado para qualquer propósito sem a necessidade de obter permissão, e os pesquisadores devem ser capazes de inspecionar seus componentes e estudar como o sistema funciona .

Também deve ser possível modificar o sistema para qualquer propósito — incluindo alterar sua saída — e compartilhá-lo com outros para uso, com ou sem modificações, para qualquer propósito. Além disso, o padrão tenta definir um nível de transparência para os dados de treinamento, código-fonte e pesos de um determinado modelo. 

A ausência anterior de um padrão de código aberto apresentou um problema. Embora saibamos que as decisões da OpenAI e da Anthropic de manter seus modelos, conjuntos de dados e algoritmos em segredo tornam sua IA de código fechado, alguns especialistas argumentam que os modelos de livre acesso da Meta e do Google, que são abertos para qualquer um inspecionar e adaptar, também não são verdadeiramente de código aberto, por causa de licenças que restringem o que os usuários podem fazer com os modelos e porque os conjuntos de dados de treinamento não são tornados públicos. A Meta, o Google e a OpenAI foram contatados para sua resposta à nova definição, mas não responderam antes da publicação.

“As empresas são conhecidas por usar o termo de forma incorreta ao comercializar seus modelos”, diz Avijit Ghosh, pesquisador de política aplicada na Hugging Face, uma plataforma para construir e compartilhar modelos de IA. Descrever modelos como de código aberto pode fazer com que eles sejam percebidos como mais confiáveis, mesmo que os pesquisadores não consigam investigar de forma independente se eles realmente são de código aberto.

Ayah Bdeir, consultor sênior da Mozilla e participante do processo da OSI, diz que certas partes da definição de código aberto foram relativamente fáceis de concordar, incluindo a necessidade de revelar pesos de modelo (os parâmetros que ajudam a determinar como um modelo de IA gera uma saída). Outras partes das deliberações foram mais controversas, particularmente a questão de como os dados de treinamento públicos deveriam ser.

A falta de transparência sobre a origem dos dados de treinamento levou a inúmeros processos judiciais contra grandes empresas de IA, desde fabricantes de grandes modelos de linguagem como OpenAI até geradores de música como Suno, que não divulgam muito sobre seus conjuntos de treinamento além de dizer que eles contêm “informações publicamente acessíveis”. Em resposta, alguns defensores dizem que os modelos de código aberto devem divulgar todos os seus conjuntos de treinamento, um padrão que Bdeir diz que seria difícil de aplicar devido a questões como direitos autorais e propriedade de dados. 

Por fim, a nova definição exige que os modelos de código aberto forneçam informações sobre os dados de treinamento na medida em que “uma pessoa qualificada possa recriar um sistema substancialmente equivalente usando os mesmos dados ou dados semelhantes”. Não é um requisito geral compartilhar todos os conjuntos de dados de treinamento, mas também vai além do que muitos modelos proprietários ou mesmo modelos ostensivamente de código aberto fazem hoje. É um compromisso…

Veja o artigo completo no site MIT Technology Review


Mais desse tópico: