Meta lança ferramenta de IA que pode identificar e separar itens em imagens

Com suas ambições do Metaverso em frangalhos, a Meta agora está olhando para a IA para conduzir seu próximo estágio de desenvolvimento. Um dos projetos mais recentes da Meta, o gigante da mídia social anunciado na quarta-feira, é chamado de Segment Anything Model.

O Segment Anything ajuda os usuários a identificar itens específicos em uma imagem com apenas alguns cliques. Ainda em modo de demonstração, a empresa diz que o Segment Anything já pode tirar uma foto e identificar individualmente os pixels que compõem tudo na imagem para que um ou mais itens possam ser separados do restante da imagem.

“A segmentação – identificar quais pixels da imagem pertencem a um objeto – é uma tarefa central na visão computacional e é usada em uma ampla gama de aplicações, desde a análise de imagens científicas até a edição de fotos”

Meta escreveu em um post anunciando o novo modelo. A Meta disse que a criação de um modelo de segmentação preciso para tarefas específicas requer trabalho altamente especializado de especialistas técnicos com acesso à infraestrutura de treinamento de IA e grandes volumes de dados no domínio cuidadosamente anotados.

“Conseguimos maior generalização do que as abordagens anteriores, coletando um novo conjunto de dados de tamanho sem precedentes.”

Ross Girshick, um cientista pesquisador da Meta, disse:

“Crucialmente, neste conjunto de dados, não restringimos os tipos de objetos que anotamos.”

e Girshick acrescentou:

“Graças à escala dos dados e sua generalidade, nosso modelo resultante mostra capacidades impressionantes para lidar com tipos de imagens que não foram vistas durante o treinamento, como imagens egocêntricas, microscopia ou fotos subaquáticas.”

 A inteligência artificial generativa é um sistema de IA que gera texto, imagens ou outras mídias em resposta a solicitações. Alguns dos exemplos mais proeminentes dessa tecnologia são o ChatGPT da OpenAI e a plataforma de arte digital Midjourney.

Meta diz que o sistema Segment Anything AI foi treinado em mais de 11 milhões de imagens. Como explicou Girshick, a Meta está disponibilizando o Segment Anything para a comunidade de pesquisa sob uma licença aberta permissiva, Apache 2.0, que pode ser acessada por meio do Segment Anything no Github.

“Um aspecto fundamental das leis de privacidade é que a coleta de dados deve ser feita de forma transparente e com o consentimento total do indivíduo”

disse Lyle Solomon, principal advogado do Oak View Law Group.

“O uso de IA para reconhecimento facial sem consentimento expresso levanta questões sobre possíveis violações da lei de privacidade. Além disso, as empresas devem evitar compartilhar dados faciais com terceiros, a menos que o indivíduo tenha consentido, e qualquer compartilhamento deve aderir às disposições da lei de privacidade.”

Girshick diz também que o Segment Anything está em fase de pesquisa, sem planos de usá-lo na produção. Ainda assim, existem preocupações relacionadas à privacidade nos usos potenciais da inteligência artificial.

Em fevereiro, a Meta abandonou seus planos de lançar um metaverso para focar em outros produtos, incluindo inteligência artificial, anunciando a criação de um novo grupo de produtos focado em IA generativa. Líderes globais, cansados ​​do avanço da inteligência artificial, expressaram preocupações e abriram investigações sobre a tecnologia e o que ela significa para a privacidade e segurança do usuário após o lançamento do ChatGPT da OpenAI. A Itália já baniu o popular chatbot.

“Muitos usuários não entendem como esse processo funciona ou quais as consequências disso podem ser a longo prazo se seu rosto for usado para treinar um modelo de aprendizado de máquina sem seu consentimento”

disse Kristen Ruby, presidente de mídia social e consultora de IA Ruby Media Group.

“O maior desafio que muitas empresas enfrentam é obter acesso a dados de treinamento em larga escala, e não há melhor fonte de dados de treinamento do que aqueles que as pessoas fornecem nas redes de mídia social”

disse Kristen Ruby e que sugere verificar se uma empresa incluiu uma cláusula de aprendizado de máquina que informa aos usuários como seus dados estão sendo usados ​​e se eles podem optar por não participar de futuros modelos de treinamento. Ela observa que muitas empresas atualmente têm uma configuração padrão de opt-in, mas isso pode mudar para opt-out no futuro.

“Empregamos várias técnicas de preservação da privacidade, como desfocar rostos e outras informações de identificação pessoal (por exemplo, placas de carro)”

disse Ross Girshick que concluiu:

“Os usuários podem nos denunciar conteúdo ofensivo enviando um e-mail para segment-anything@meta.com com o id da imagem, e nós o removeremos do conjunto de dados.”

Créditos: Decrypt e Canva.