Transformador pré-treinado generativo

Modelo GPT original

Um transformador pré-treinado generativo ( GPT ) é um tipo de modelo de linguagem grande (LLM) [1][2][3] e uma estrutura proeminente para inteligência artificial generativa .[4][5] É uma rede neural artificial que é usada no processamento de linguagem natural .[6] Baseia-se na arquitetura de aprendizagem profunda do transformador, pré-treinada em grandes conjuntos de dados de texto não rotulado e capaz de gerar novos conteúdos semelhantes aos humanos.[2][3] Em 2023, a maioria dos LLMs apresentava essas características[7] e às vezes são chamados amplamente de GPTs.[8]

O primeiro GPT foi introduzido em 2018 pela OpenAI .[9] A OpenAI lançou modelos de base GPT significativos que foram numerados sequencialmente para compor sua série "GPT- n ".[10] Cada um deles era significativamente mais capaz que o anterior, devido ao aumento do tamanho (número de parâmetros treináveis) e do treinamento. O mais recente deles, o GPT-4o, foi lançado em maio de 2024.[11] Esses modelos têm sido a base para seus sistemas GPT mais específicos para tarefas, incluindo modelos ajustados para seguir instruções — que por sua vez alimentam o serviço de chatbot ChatGPT .[1]

O termo "GPT" (sigla para "Generative Pre-trained Transformer") também é utilizado nos nomes e nas descrições de modelos de linguagem de grande escala semelhantes, desenvolvidos por outras organizações ou empresas além da OpenAI, que criou o conceito original. Esses modelos, que compartilham características arquiteturais ou funcionais com o GPT, são frequentemente nomeados ou descritos com o termo "GPT" para indicar sua natureza de transformadores pré-treinados voltados para tarefas de geração de texto ou outras aplicações de inteligência artificial. Por exemplo, outros modelos de fundação GPT incluem uma série de modelos criados pela EleutherAI,[12] e sete modelos criados pela Cerebras em 2023.[13] Empresas de diferentes indústrias desenvolveram GPTs específicos para tarefas em seus respectivos campos, como o "EinsteinGPT" da Salesforce (para CRM ) [14] e o "BloombergGPT" da Bloomberg (para finanças).[15]

Referências

  1. a b Haddad, Mohammed. «How does GPT-4 work and how can you start using it in ChatGPT?». www.aljazeera.com. Consultado em 10 de abril de 2023. Cópia arquivada em 5 de julho de 2023 
  2. a b «Generative AI: a game-changer society needs to be ready for». World Economic Forum. 9 de janeiro de 2023. Consultado em 8 de abril de 2023. Cópia arquivada em 25 de abril de 2023 
  3. a b «The A to Z of Artificial Intelligence». Time. 13 de abril de 2023. Consultado em 14 de abril de 2023. Cópia arquivada em 16 de junho de 2023 
  4. Hu, Luhui (15 de novembro de 2022). «Generative AI and Future». Medium. Consultado em 29 de abril de 2023. Cópia arquivada em 5 de junho de 2023 
  5. «CSDL | IEEE Computer Society». www.computer.org. Consultado em 29 de abril de 2023. Cópia arquivada em 28 de abril de 2023 
  6. «LibGuides: Using AI Language Models : ChatGPT». Consultado em 7 de dezembro de 2023. Cópia arquivada em 8 de dezembro de 2023 
  7. Toews, Rob. «The Next Generation Of Large Language Models». Forbes. Consultado em 9 de abril de 2023. Cópia arquivada em 14 de abril de 2023 
  8. Mckendrick, Joe (13 de março de 2023). «Most Jobs Soon To Be 'Influenced' By Artificial Intelligence, Research Out Of OpenAI And University Of Pennsylvania Suggests». Forbes. Consultado em 16 de abril de 2023. Cópia arquivada em 16 de abril de 2023 
  9. «Improving language understanding with unsupervised learning». openai.com (em inglês). 11 de junho de 2018. Consultado em 18 de março de 2023. Cópia arquivada em 18 de março de 2023 
  10. «GPT-1 to GPT-4: Each of OpenAI's GPT Models Explained and Compared». MUO. 11 de abril de 2023. Consultado em 3 de maio de 2023. Cópia arquivada em 15 de abril de 2023 
  11. «GPT-4». openai.com (em inglês). Consultado em 8 de dezembro de 2023. Cópia arquivada em 14 de março de 2023 
  12. Alford, Anthony (13 de julho de 2021). «EleutherAI Open-Sources Six Billion Parameter GPT-3 Clone GPT-J». InfoQ. Consultado em 3 de abril de 2023. Cópia arquivada em 10 de fevereiro de 2023 
  13. «News» (Nota de imprensa). Consultado em 5 de abril de 2023. Cópia arquivada em 5 de abril de 2023 
  14. Morrison, Ryan (7 de março de 2023). «Salesforce launches EinsteinGPT built with OpenAI technology». Tech Monitor. Consultado em 10 de abril de 2023. Cópia arquivada em 15 de abril de 2023 
  15. «The ChatGPT of Finance is Here, Bloomberg is Combining AI and Fintech». Forbes. Consultado em 6 de abril de 2023. Cópia arquivada em 6 de abril de 2023