Com o surgimento do Chat-GPT, entramos na era da inovação disruptiva trazida pelo AIGC.
AIGC (AI Generated Content) é considerado um novo método de produção de conteúdo após UGC e PGC. Pintura AI, escrita AI, etc. são todos ramos do AIGC. Chat-GPT é um grande modelo de linguagem AI para processamento de linguagem natural, modelo AI Como uma forma específica de AIGC, quais são os elementos-chave no processo de treinamento e no processo de raciocínio?
Elemento 1: poder de computação
Dados diversificados e de alta qualidade são a base para o treinamento de modelos de IA, e o poder de computação fornece a força motriz para o treinamento de modelos.
Em termos de fornecimento de poder de computação, para a fase de treinamento do modelo de IA, o poder de computação é usado para executar tarefas como retropropagação, atualização de parâmetros e otimização de modelos em conjuntos de dados de grande escala. Maior poder de computação pode acelerar o processo de treinamento, permitindo que o modelo converja mais rapidamente e aprenda as características dos dados. Para a fase de inferência do modelo de IA, o poder de computação é usado para aplicar o modelo treinado a novas instâncias de dados para previsão e inferência. Em aplicações de tempo real, o nível de poder computacional determina a quantidade de requisições e a velocidade de resposta que o modelo pode suportar.
Muitos algoritmos de IA complexos exigem recursos de computação massivos. O desenvolvimento da IA tradicional é limitado pelo desempenho e poder de computação dos dispositivos de hardware. Especialmente ao processar conjuntos de dados em larga escala ou conduzir treinamento de modelo altamente complexo, é necessário um poder de computação mais poderoso.
Atualmente, ainda há uma falta de produtos e soluções maduros para o compartilhamento de poder de computação inteligente no mercado. O mercado de poder de computação tradicional introduz poder de computação ocioso social de terceiros, como terminais pessoais, e os operadores de serviços de poder de computação não têm a capacidade de controlar efetivamente os nós. A segurança e a credibilidade dos nós de poder de computação não podem ser garantidas, o que aumenta muito a amplitude e a dificuldade da proteção de segurança.
Elemento 2: Dados
O compartilhamento de dados com base na proteção de privacidade é um suporte importante para a modelagem AIGC.
Em termos de fornecimento de dados, o treinamento do modelo AIGC precisa usar uma grande quantidade de dados para obter um bom desempenho e melhorar a capacidade de raciocínio e precisão do modelo. Tomando o ChatGPT como exemplo, o treinamento do GPT usa dados de dezenas de bilhões de tokens. Como um modelo de linguagem AI em grande escala, os dados de treinamento do GPT incluem uma ampla variedade de fontes de texto na Internet, incluindo páginas da Web, livros, artigos, teses e outros recursos de texto disponíveis publicamente. Esses dados abrangem vários domínios e tópicos, permitindo modelos com amplo conhecimento e recursos de compreensão de linguagem.
Em suma, o treinamento de um grande modelo de IA requer grandes quantidades de dados, e os dados internos de uma única empresa geralmente são insuficientes para atender à demanda. Portanto, o compartilhamento de dados é necessário nesse processo. No entanto, embora a quantidade de dados globais seja crescendo rapidamente, o vazamento de privacidade causado pelo compartilhamento de dados afetou seriamente Faça pleno uso do valor dos dados. De acordo com o relatório da IBM Security em julho de 2022, violações de dados ocorreram em 550 empresas em todo o mundo entre março de 2021 e março de 2022, e a perda média causada por uma violação de dados atingiu 4,4 milhões de dólares americanos, um aumento de 13% em relação a 2020 Portanto, como realizar a circulação de dados e a mineração de valor sob a premissa de garantir a privacidade e a segurança dos dados e atender ao crescimento da tecnologia AIGC tornou-se um tópico de preocupação crescente no setor.
Quais melhorias a combinação de Web3 e IA pode trazer?
Como uma nova geração de Internet construída em blockchain e tecnologia descentralizada, o Web3 possui maior descentralização, abertura e transparência. Quando a IA é combinada com o Web3, ela pode obter muitas vantagens diferentes da IA tradicional.
Recursos de computação distribuída:
A natureza descentralizada do Web3 permite que os recursos de computação em escala global sejam integrados e compartilhados. Isso fornece maior poder de computação para treinamento e inferência de modelos de IA. O treinamento tradicional do modelo de IA geralmente depende de um único dispositivo de computação ou provedor de serviços em nuvem, mas combinado com Web3, recursos de computação distribuídos na rede global podem ser utilizados para fornecer suporte de poder de computação mais eficiente e elástico.
Compartilhamento de dados e proteção de privacidade:
Um dos conceitos centrais do Web3 é a descentralização e o poder dos usuários sobre os dados. Combinado com IA, o Web3 pode fornecer aos usuários mais oportunidades de controle e compartilhamento de dados, permitindo que eles participem do treinamento de modelos de IA e do compartilhamento de dados de maneira mais privada e segura.
Desenvolvimento e implantação de modelo descentralizado:
Os contratos inteligentes e a plataforma de computação distribuída da Web3 podem facilitar o desenvolvimento e a implantação de modelos de IA. Os contratos inteligentes podem fornecer uma maneira descentralizada de gerenciar e verificar o processo de treinamento do modelo, enquanto a plataforma de computação distribuída pode utilizar os recursos de computação na rede global para acelerar o treinamento e o raciocínio do modelo.
Melhore a qualidade e a diversidade dos dados:
O Web3 pode encorajar os usuários a fornecer dados mais diversificados e de alta qualidade por meio de um mecanismo de incentivo e um mercado de dados descentralizado, melhorando assim o problema de limitação de dados enfrentado pela IA tradicional.
Tomemos como exemplo a plataforma AIGC WaterWheel da Web3.0
No módulo de potência de computação:
A rede de poder de computação da Waterwheel combina tecnologia TEE e tecnologia blockchain para construir uma plataforma de compartilhamento de poder de computação credível, aberta e eficiente. . poder de computação.
No módulo de dados:
Waterwheel é uma plataforma descentralizada de compartilhamento de dados baseada em blockchain e computação de privacidade, constrói uma rede global de ativos de dados, oferece suporte a contribuidores de dados para registrar dados e participar de tarefas de crowdfunding de dados e resolve o processo de circulação de dados por meio da tecnologia de computação de privacidade para resolver a segurança questões de vazamento de dados no meio, com a premissa de garantir a segurança e privacidade dos dados, trará benefícios de valor para os contribuidores de dados.
Módulos de autoria em AIGC:
O AIGC tradicional também carece de proteção de privacidade. A maioria das ideias exclusivas dos usuários será divulgada diretamente por meio da entrada imediata. Diferentes métodos de fornecimento e cobrança de modelos de IA também fazem com que os usuários paguem custos mais altos. Como o processo de criação do AIGC é composto principalmente de Após o O modelo de IA está concluído, é difícil para os criadores obter uma renda razoável por meio de transações tradicionais de direitos autorais.
No módulo de veiculação do modelo:
Waterwheel integra blockchain, computação de privacidade e tecnologia AI para criar uma plataforma de treinamento de modelo segura e confiável. Ao usar a certificação remota e o ambiente de privacidade da tecnologia TEE de computação de privacidade, resolve a lacuna entre as partes de treinamento de modelo, provedores de dados e provedores de poder de computação. Desconfiança mútua e problemas de risco de vazamento de dados, garantindo que os dados e modelos estejam em um estado "disponível e invisível" durante todo o processo de treinamento do modelo, ajudando os treinadores de modelos de IA a obter mais dados de maneira segura e compatível, enquanto hospeda modelos de IA em In o ambiente de privacidade, a segurança e a privacidade do modelo são garantidas.
Ansioso para ver mais plataformas Web3.0 promoverem o desenvolvimento e a aplicação da indústria de IA!
Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
IA na Era Web3: Explorando o Potencial Ilimitado do Blockchain e da Inteligência Artificial
Com o surgimento do Chat-GPT, entramos na era da inovação disruptiva trazida pelo AIGC.
AIGC (AI Generated Content) é considerado um novo método de produção de conteúdo após UGC e PGC. Pintura AI, escrita AI, etc. são todos ramos do AIGC. Chat-GPT é um grande modelo de linguagem AI para processamento de linguagem natural, modelo AI Como uma forma específica de AIGC, quais são os elementos-chave no processo de treinamento e no processo de raciocínio?
Elemento 1: poder de computação
Dados diversificados e de alta qualidade são a base para o treinamento de modelos de IA, e o poder de computação fornece a força motriz para o treinamento de modelos.
Em termos de fornecimento de poder de computação, para a fase de treinamento do modelo de IA, o poder de computação é usado para executar tarefas como retropropagação, atualização de parâmetros e otimização de modelos em conjuntos de dados de grande escala. Maior poder de computação pode acelerar o processo de treinamento, permitindo que o modelo converja mais rapidamente e aprenda as características dos dados. Para a fase de inferência do modelo de IA, o poder de computação é usado para aplicar o modelo treinado a novas instâncias de dados para previsão e inferência. Em aplicações de tempo real, o nível de poder computacional determina a quantidade de requisições e a velocidade de resposta que o modelo pode suportar.
Muitos algoritmos de IA complexos exigem recursos de computação massivos. O desenvolvimento da IA tradicional é limitado pelo desempenho e poder de computação dos dispositivos de hardware. Especialmente ao processar conjuntos de dados em larga escala ou conduzir treinamento de modelo altamente complexo, é necessário um poder de computação mais poderoso.
Atualmente, ainda há uma falta de produtos e soluções maduros para o compartilhamento de poder de computação inteligente no mercado. O mercado de poder de computação tradicional introduz poder de computação ocioso social de terceiros, como terminais pessoais, e os operadores de serviços de poder de computação não têm a capacidade de controlar efetivamente os nós. A segurança e a credibilidade dos nós de poder de computação não podem ser garantidas, o que aumenta muito a amplitude e a dificuldade da proteção de segurança.
Elemento 2: Dados
O compartilhamento de dados com base na proteção de privacidade é um suporte importante para a modelagem AIGC.
Em termos de fornecimento de dados, o treinamento do modelo AIGC precisa usar uma grande quantidade de dados para obter um bom desempenho e melhorar a capacidade de raciocínio e precisão do modelo. Tomando o ChatGPT como exemplo, o treinamento do GPT usa dados de dezenas de bilhões de tokens. Como um modelo de linguagem AI em grande escala, os dados de treinamento do GPT incluem uma ampla variedade de fontes de texto na Internet, incluindo páginas da Web, livros, artigos, teses e outros recursos de texto disponíveis publicamente. Esses dados abrangem vários domínios e tópicos, permitindo modelos com amplo conhecimento e recursos de compreensão de linguagem.
Em suma, o treinamento de um grande modelo de IA requer grandes quantidades de dados, e os dados internos de uma única empresa geralmente são insuficientes para atender à demanda. Portanto, o compartilhamento de dados é necessário nesse processo. No entanto, embora a quantidade de dados globais seja crescendo rapidamente, o vazamento de privacidade causado pelo compartilhamento de dados afetou seriamente Faça pleno uso do valor dos dados. De acordo com o relatório da IBM Security em julho de 2022, violações de dados ocorreram em 550 empresas em todo o mundo entre março de 2021 e março de 2022, e a perda média causada por uma violação de dados atingiu 4,4 milhões de dólares americanos, um aumento de 13% em relação a 2020 Portanto, como realizar a circulação de dados e a mineração de valor sob a premissa de garantir a privacidade e a segurança dos dados e atender ao crescimento da tecnologia AIGC tornou-se um tópico de preocupação crescente no setor.
Quais melhorias a combinação de Web3 e IA pode trazer?
Como uma nova geração de Internet construída em blockchain e tecnologia descentralizada, o Web3 possui maior descentralização, abertura e transparência. Quando a IA é combinada com o Web3, ela pode obter muitas vantagens diferentes da IA tradicional.
Recursos de computação distribuída:
A natureza descentralizada do Web3 permite que os recursos de computação em escala global sejam integrados e compartilhados. Isso fornece maior poder de computação para treinamento e inferência de modelos de IA. O treinamento tradicional do modelo de IA geralmente depende de um único dispositivo de computação ou provedor de serviços em nuvem, mas combinado com Web3, recursos de computação distribuídos na rede global podem ser utilizados para fornecer suporte de poder de computação mais eficiente e elástico.
Compartilhamento de dados e proteção de privacidade:
Um dos conceitos centrais do Web3 é a descentralização e o poder dos usuários sobre os dados. Combinado com IA, o Web3 pode fornecer aos usuários mais oportunidades de controle e compartilhamento de dados, permitindo que eles participem do treinamento de modelos de IA e do compartilhamento de dados de maneira mais privada e segura.
Desenvolvimento e implantação de modelo descentralizado:
Os contratos inteligentes e a plataforma de computação distribuída da Web3 podem facilitar o desenvolvimento e a implantação de modelos de IA. Os contratos inteligentes podem fornecer uma maneira descentralizada de gerenciar e verificar o processo de treinamento do modelo, enquanto a plataforma de computação distribuída pode utilizar os recursos de computação na rede global para acelerar o treinamento e o raciocínio do modelo.
Melhore a qualidade e a diversidade dos dados:
O Web3 pode encorajar os usuários a fornecer dados mais diversificados e de alta qualidade por meio de um mecanismo de incentivo e um mercado de dados descentralizado, melhorando assim o problema de limitação de dados enfrentado pela IA tradicional.
Tomemos como exemplo a plataforma AIGC WaterWheel da Web3.0
No módulo de potência de computação:
A rede de poder de computação da Waterwheel combina tecnologia TEE e tecnologia blockchain para construir uma plataforma de compartilhamento de poder de computação credível, aberta e eficiente. . poder de computação.
No módulo de dados:
Waterwheel é uma plataforma descentralizada de compartilhamento de dados baseada em blockchain e computação de privacidade, constrói uma rede global de ativos de dados, oferece suporte a contribuidores de dados para registrar dados e participar de tarefas de crowdfunding de dados e resolve o processo de circulação de dados por meio da tecnologia de computação de privacidade para resolver a segurança questões de vazamento de dados no meio, com a premissa de garantir a segurança e privacidade dos dados, trará benefícios de valor para os contribuidores de dados.
Módulos de autoria em AIGC:
O AIGC tradicional também carece de proteção de privacidade. A maioria das ideias exclusivas dos usuários será divulgada diretamente por meio da entrada imediata. Diferentes métodos de fornecimento e cobrança de modelos de IA também fazem com que os usuários paguem custos mais altos. Como o processo de criação do AIGC é composto principalmente de Após o O modelo de IA está concluído, é difícil para os criadores obter uma renda razoável por meio de transações tradicionais de direitos autorais.
No módulo de veiculação do modelo:
Waterwheel integra blockchain, computação de privacidade e tecnologia AI para criar uma plataforma de treinamento de modelo segura e confiável. Ao usar a certificação remota e o ambiente de privacidade da tecnologia TEE de computação de privacidade, resolve a lacuna entre as partes de treinamento de modelo, provedores de dados e provedores de poder de computação. Desconfiança mútua e problemas de risco de vazamento de dados, garantindo que os dados e modelos estejam em um estado "disponível e invisível" durante todo o processo de treinamento do modelo, ajudando os treinadores de modelos de IA a obter mais dados de maneira segura e compatível, enquanto hospeda modelos de IA em In o ambiente de privacidade, a segurança e a privacidade do modelo são garantidas.
Ansioso para ver mais plataformas Web3.0 promoverem o desenvolvimento e a aplicação da indústria de IA!