Publicado originalmente por IEEE Spectrum
Poucos LLMs ostensivamente de código aberto atendem à reivindicação de abertura
A empresa de mídia social e tecnologia de publicidade Meta lançou recentemente uma atualização para seu grande modelo de linguagem Llama. O Llama 2 foi lançado como código aberto, fornecendo aos usuários acesso aos pesos, código de avaliação e documentação do modelo. A Meta afirma que o lançamento de código aberto pretendia tornar o modelo “acessível a indivíduos, criadores, pesquisadores e empresas, para que possam experimentar, inovar e dimensionar suas ideias com responsabilidade”.
No entanto, em comparação com outros LLMs de código aberto e pacotes de software de código aberto em geral, o Llama 2 é consideravelmente fechado. Embora a Meta tenha disponibilizado o modelo treinado, ela não está compartilhando os dados de treinamento do modelo ou o código usado para treiná-lo. Embora terceiros tenham sido capazes de criar aplicativos que se estendem no modelo básico, aspirantes a desenvolvedores e pesquisadores têm uma capacidade limitada de separar o modelo como está .
Em pesquisa apresentada na ACM Conference on Conversational User Interfaces, um grupo de pesquisadores de IA da Radboud University, em Nijmegen, Holanda, argumenta que o Llama 2 não é o único LLM a ser questionavelmente rotulado como “código aberto”. No artigo, os cientistas apresentam uma avaliação multidimensional da abertura do modelo. Eles usam esta rubrica para pontuar 15 diferentes LLMs nominalmente de código aberto em diferentes aspectos de sua disponibilidade, documentação e métodos de acesso. Os pesquisadores coletaram essas avaliações em uma tabela onlineque desde então se expandiram para incluir 21 modelos diferentes de código aberto. Modelos menores e focados em pesquisa foram incluídos na avaliação se fossem considerados, conforme declarado na pré-impressão, “abertos, suficientemente documentados e lançados sob uma licença de código aberto”…
Veja o artigo completo no site IEEE Spectrum