U-Turn da OpenAI: Não Treinar GPT-4 com Dados de Clientes da API

alterações-de-privacidade-openai-6457d3fd3d25f-sej-760x400.png

Numa mudança significativa em relação às suas práticas anteriores, a OpenAI anunciou que não irá mais utilizar os dados dos clientes enviados através das suas APIs para treinar os seus amplos modelos de linguagem, como o GPT-4.

A alteração foi confirmada por Sam Altman, CEO da OpenAI, numa entrevista recente à CNBC.

A nova abordagem da OpenAI aos dados do utilizador

A mudança de política da OpenAI foi implementada em 1 de março de 2023, quando a empresa atualizou silenciosamente seus termos de serviço para refletir esse novo compromisso com a privacidade do usuário.

Altman esclareceu: "Os clientes claramente não querem que treinemos com os seus dados, por isso alterámos os nossos planos: não o faremos."

As APIs, ou interfaces de programação de aplicações, são estruturas tecnológicas que permitem aos clientes conectarem-se diretamente ao software da OpenAI.

Altman afirmou que a OpenAI não tem utilizado dados da API para treinar os modelos "há algum tempo", sugerindo que este anúncio oficial formaliza uma prática já existente.

Implicações para Clientes Empresariais

A mudança da OpenAI tem implicações de grande alcance, especialmente para seus clientes empresariais, que incluem gigantes como Microsoft, Salesforce e Snapchat.

Estas empresas têm maior probabilidade de utilizar as capacidades da API da OpenAI para as suas operações, por isso, a mudança de privacidade e proteção de dados é especialmente relevante para elas.

No entanto, as novas medidas de proteção de dados aplicam-se exclusivamente aos clientes que utilizam os serviços da API da empresa. Os termos de serviço atualizados da OpenAI afirmam: "Podemos usar Conteúdo de Serviços diferentes da nossa API".

Como tal, outras formas de inserção de dados, como texto digitado no popular chatbot ChatGPT, ainda podem ser utilizadas pela OpenAI, a menos que os dados sejam compartilhados por meio da API.

Impacto Mais Amplo na Indústria

A mudança de política da OpenAI surge quando as indústrias enfrentam os possíveis impactos do potencial de grandes modelos de linguagem, como o ChatGPT da OpenAI, substituindo conteúdos tradicionalmente criados por humanos.

Por exemplo, o Writers Guild of America iniciou recentemente uma greve depois que as negociações entre o Sindicato e os estúdios de cinema fracassaram. O Sindicato havia estado a defender restrições ao uso do ChatGPT da OpenAI para geração ou reescrita de roteiros.

A decisão da OpenAI de não utilizar dados do cliente para treinamento é um momento crucial na conversa em curso sobre privacidade de dados e IA. À medida que as empresas continuam a explorar e empurrar os limites da tecnologia de IA, garantir a privacidade do usuário e manter a confiança provavelmente permanecerão no centro dessas discussões.

A Evolução do ChatGPT: GPT-3 para GPT-4

É importante salientar que o compromisso da OpenAI de não utilizar os dados do cliente para treino aplica-se ao seu mais recente modelo de linguagem, o GPT-4, lançado em 14 de março de 2023.

O GPT-4 introduziu várias melhorias em relação ao seu antecessor, o GPT-3, incluindo um aumento significativo no limite de palavras (25.000 em comparação com o limite de 3.000 palavras do ChatGPT), um tamanho maior de janela de contexto e melhores capacidades de raciocínio e compreensão.

Outra característica notável do GPT-4 é a sua multimodalidade, ou seja, a capacidade de compreender e inferir informações a partir de imagens além do texto. Este último modelo gera textos mais humanos, utilizando recursos como emojis para uma sensação mais personalizada.

No entanto, o tamanho exato e a arquitetura do GPT-4 permanecem em segredo, levando à especulação sobre os detalhes do modelo.

Apesar desses rumores, o CEO da OpenAI negou alegações específicas sobre o tamanho do modelo.

No que diz respeito ao desempenho, o GPT-4 tem demonstrado pontos fortes na geração de texto, mas também algumas limitações. Por exemplo, obteve uma pontuação no percentil 54 no Exame de Escrita do Graduate Record Examination (GRE) e teve um desempenho entre o percentil 43 e 59 no exame de Cálculo BC do Programa Avançado (AP Calculus BC).

Além disso, ele se saiu bem em tarefas de codificação fácil do Leetcode, mas seu desempenho diminuiu com o aumento da dificuldade da tarefa.

Embora os detalhes do processo de treinamento do GPT-4 não sejam oficialmente documentados, sabe-se que os modelos GPT geralmente envolvem aprendizado de máquina em grande escala com uma ampla variedade de textos da internet.

A aguardar com expectativa

Como resultado das alterações à política de utilização de dados da OpenAI, os dados utilizados para treinar os seus modelos de linguagem não incluem informações partilhadas através da API, a menos que os utilizadores concordem explicitamente em contribuir para este fim.

Enquanto esta tecnologia melhora e desempenha um papel mais significativo em nossas vidas, é interessante ver como as empresas se adaptam e respondem às preocupações sobre a manutenção dos dados privados e conquistando a confiança das pessoas.

Artigos Relacionados

Ver Mais >>

Desbloqueie o poder da IA com HIX.AI!