No meio da jornada encontra um rival! Google AI pintando 4 vacas grandes inicia um negócio, experimenta a tecnologia Imagen gratuitamente e ganha 120 milhões de financiamento anjo
MidJourney, no trono da pintura de IA, finalmente introduziu um forte oponente.
O mais novo desafiante, Ideograma, nasceu do nada. No início, ele contava com cadastro gratuito para atrair muita atenção.
O recurso mais atraente: Gerar texto na imagem com precisão, o cientista da NVIDIA Fan Linxi usou-o diretamente para desenhar um "Acabou, meio da jornada".
A empresa por trás disso, Ideogram AI, é um projeto empreendedor da IA do Google que pinta quatro grandes vacas que partiram coletivamente, localizadas em Toronto, e arrecadadas com um financiamento inicial de US$ 16,5 milhões (cerca de 120 milhões de dólares). yuan).
Os primeiros quatro membros da equipe fundadora são todos autores do artigo Imagen de pesquisa gráfica do Google Vincent, formando uma equipe de pesquisa de ponta em modelos de difusão.
Os resultados da pesquisa avançada que o Google escondeu por tanto tempo e não foi reproduzido por todos foram finalmente divulgados por eles.
A rodada inicial do Ideogram AI foi liderada por a16z e Index Ventures.
Há também figuras bem conhecidas entre os investidores individuais, como o membro fundador da OpenAI Andrej Karpathy, o guru de aprendizagem por reforço Pieter Abbeel, o fundador do Node.js Ryan Dahl, o cofundador do GitHub ** Tom Preston-Werner** et al.
Até o antigo chefe da equipe, o ex-líder cerebral do Google Jeff Dean também participou.
Independentemente do facto de a equipa fundadora ter formação técnica, o Ideogram AI também é inequívoco em termos de publicidade e promoção, apelando directamente a todos para utilizarem a segunda etiqueta de criação em 𝕏, o que deu início a uma onda de marketing viral.
A IA aprende a desenhar texto com precisão
Sempre foi um problema permitir que a IA desenhasse texto com precisão. Embora as novas funções de redesenho parcial do SDXL e do Midjourney tenham melhorado, a taxa de sucesso do feedback dos internautas não foi muito alta e são necessárias tentativas repetidas.
Depois que o Ideogram resolveu esse problema, ele foi reproduzido diretamente pelos internautas.
Não há problema em deixar o texto aparecer na placa e se adaptar à luz e sombra do ambiente ao mesmo tempo.
Não há problema em fazer uma arte com leite.
Cartazes de estilo abstrato também podem apresentar fontes com estilos apropriados.
Em suma, o logotipo da marca está repleto de atributos de produtividade.
Também pode ser visto pelas palavras compartilhadas pelos internautas que o “feitiço” para aumentar a probabilidade de sucesso no desenho do texto também é muito simples, apenas uma palavra:
tipografia (composição tipográfica de impressão)
Mas é uma pena que não seja muito bom em dominar o chinês.
Além do texto, a capacidade de geração de imagem e a qualidade de saída do Ideogram são comparáveis ao MidJourney e Stable Diffusion.
Se você usar exatamente a mesma tecnologia do Imagen, usar o Google T5 em vez do OpenAI CLIP como modelo de codificação de linguagem significa que o Ideogram terá uma compreensão mais forte da descrição do relacionamento espacial nas palavras do prompt.
Alguém o usou com sucesso para gerar um conjunto de imagens com um estilo consistente.
Combinado com a ferramenta de geração de vídeo Pika Labs, pode produzir diretamente curtas-metragens no estilo de trailers de filmes.
Equipe de pesquisa principal do modelo de difusão
A equipe fundadora da Ideogram AI é composta por 7 pessoas, 4 das quais são coautores do Google Imagen.
Entre eles, o coautor Mohammad Norouzi é o CEO. Ele recebeu a bolsa de doutorado do Google ML durante seu doutorado em Ciência da Computação na Universidade de Toronto.
Após a formatura, ele ingressou no Google Brain por 7 anos. Além de gerar modelos, ele também foi membro original da equipe de tradução automática neural do Google e coautor da estrutura de aprendizagem contrastiva auto-supervisionada da equipe Hinton, SimCLR.
O coautor William Chan (Chen Junle) é o CTO da nova empresa e estudou na Universidade de Waterloo, no Canadá, e na Universidade Carnegie Mellon.
Quando ingressou no Google em 2012, ele primeiro fez um projeto de publicidade de aprendizado de máquina e depois foi transferido para o Google Brain para pesquisa em PNL.
O terceiro coautor Chitwan Saharia formou-se no Bombay Institute of Technology, ingressou no Google em 2019 e agora é cofundador do Ideogram.
O quarto cofundador, Dr. Jonathan Ho**, formou-se na UC Berkeley, trabalhou na OpenAI por um ano e depois ingressou no Google.
Além de ser um contribuidor principal do artigo Imagen, ele também é o trabalho fundamental do modelo de difusão de remoção de ruído "Denoising Diffusion Probabilistic Models". Pieter Abbeel, um dos co-autores deste artigo, também é um investidor em Ideograma AI.
As outras três pessoas da equipe fundadora, Shayaan Abdullah, era engenheiro de aprendizado de máquina no Twitter, saiu em abril deste ano e depois ingressou na Ideogram AI.
Jacob Lu é engenheiro de software que trabalhou na Amazon e em outras empresas antes de ingressar na Ideogram; Jenny Lei é estagiária de engenharia de software que trabalhou no Google antes de ingressar na Ideogram AI.
ainda preciso fazer a geração do vídeo
Os quatro criadores conjuntos do Ideogram AI também concluíram o trabalho de acompanhamento de geração de vídeo Imagen Video durante o Google.
Há um ano, realizou a geração de videoclipes de alta definição com resolução de 1280*768 e 24 quadros por segundo.
Na verdade, em março deste ano, Qubit aprendeu com o mercado de investimentos que sua avaliação da rodada anjo atingiu 100 milhões de dólares americanos, mais VCs queriam dar dinheiro, mas não conseguiram recuperar o atraso, não conseguiram investir, e mais notícias sobre seu empreendedorismo direção:
** Não apenas geração de imagens, mas também geração de vídeos no futuro. **
Independentemente de Imagen ou Imagen Video, o Google nunca lançou demonstrações, APIs ou códigos-fonte abertos devido a considerações éticas e de segurança.
Os resultados da pesquisa não podem ser transformados em aplicativos, um problema comum encontrado por muitos empreendedores que deixaram o Google nos últimos anos.
Por exemplo, entre os oito autores do Transformer no lado dos grandes modelos, Aidan Gomez, o fundador da Cohere, disse uma vez que o motivo da saída foi *"Não vi o verdadeiro poder do grande modelo no Google" *.
A razão pela qual Ashish Vaswani e Niki Parmar deixaram o Google para iniciar o Adept AI e o Essential AI também é "O Google quer usar o Transformer para otimizar produtos existentes e queremos criar novos produtos".
Mais tarde, o que estes investigadores temiam de facto aconteceu:
Embora maio de 2021 (antes do prazo de dados de treinamento do ChatGPT) o Google tenha desenvolvido um modelo de diálogo LaMDA e um chatbot, mas há muitas preocupações no lançamento do produto e, finalmente** 18 meses depois, foi aberto diretamente ao público na porta ao ladoChatGPT** e roubou os holofotes.
……
Tendo aprendido essas lições, o recém-criado Ideogram AI também adotou uma postura de ser o mais aberto possível e atrair primeiro os usuários para jogar.
Uma cota de testes de 1.000 pessoas foi anunciada inicialmente, mas foi preenchida rapidamente.
Parece que algumas cotas foram abertas hoje e os qubits não encontraram fila quando se registraram pela manhã.
Em suma, o número de vagas ainda deve ser limitado e os interessados devem se apressar.
Endereço de teste:
Link de referência:
[1] /lançar
[2]
[3]
[4]
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
No meio da jornada encontra um rival! Google AI pintando 4 vacas grandes inicia um negócio, experimenta a tecnologia Imagen gratuitamente e ganha 120 milhões de financiamento anjo
Fonte original: Qubit
MidJourney, no trono da pintura de IA, finalmente introduziu um forte oponente.
O mais novo desafiante, Ideograma, nasceu do nada. No início, ele contava com cadastro gratuito para atrair muita atenção.
O recurso mais atraente: Gerar texto na imagem com precisão, o cientista da NVIDIA Fan Linxi usou-o diretamente para desenhar um "Acabou, meio da jornada".
Os primeiros quatro membros da equipe fundadora são todos autores do artigo Imagen de pesquisa gráfica do Google Vincent, formando uma equipe de pesquisa de ponta em modelos de difusão.
Há também figuras bem conhecidas entre os investidores individuais, como o membro fundador da OpenAI Andrej Karpathy, o guru de aprendizagem por reforço Pieter Abbeel, o fundador do Node.js Ryan Dahl, o cofundador do GitHub ** Tom Preston-Werner** et al.
Até o antigo chefe da equipe, o ex-líder cerebral do Google Jeff Dean também participou.
A IA aprende a desenhar texto com precisão
Sempre foi um problema permitir que a IA desenhasse texto com precisão. Embora as novas funções de redesenho parcial do SDXL e do Midjourney tenham melhorado, a taxa de sucesso do feedback dos internautas não foi muito alta e são necessárias tentativas repetidas.
Depois que o Ideogram resolveu esse problema, ele foi reproduzido diretamente pelos internautas.
Não há problema em deixar o texto aparecer na placa e se adaptar à luz e sombra do ambiente ao mesmo tempo.
tipografia (composição tipográfica de impressão)
Se você usar exatamente a mesma tecnologia do Imagen, usar o Google T5 em vez do OpenAI CLIP como modelo de codificação de linguagem significa que o Ideogram terá uma compreensão mais forte da descrição do relacionamento espacial nas palavras do prompt.
Equipe de pesquisa principal do modelo de difusão
A equipe fundadora da Ideogram AI é composta por 7 pessoas, 4 das quais são coautores do Google Imagen.
Após a formatura, ele ingressou no Google Brain por 7 anos. Além de gerar modelos, ele também foi membro original da equipe de tradução automática neural do Google e coautor da estrutura de aprendizagem contrastiva auto-supervisionada da equipe Hinton, SimCLR.
Quando ingressou no Google em 2012, ele primeiro fez um projeto de publicidade de aprendizado de máquina e depois foi transferido para o Google Brain para pesquisa em PNL.
Além de ser um contribuidor principal do artigo Imagen, ele também é o trabalho fundamental do modelo de difusão de remoção de ruído "Denoising Diffusion Probabilistic Models". Pieter Abbeel, um dos co-autores deste artigo, também é um investidor em Ideograma AI.
Jacob Lu é engenheiro de software que trabalhou na Amazon e em outras empresas antes de ingressar na Ideogram; Jenny Lei é estagiária de engenharia de software que trabalhou no Google antes de ingressar na Ideogram AI.
ainda preciso fazer a geração do vídeo
Os quatro criadores conjuntos do Ideogram AI também concluíram o trabalho de acompanhamento de geração de vídeo Imagen Video durante o Google.
** Não apenas geração de imagens, mas também geração de vídeos no futuro. **
Independentemente de Imagen ou Imagen Video, o Google nunca lançou demonstrações, APIs ou códigos-fonte abertos devido a considerações éticas e de segurança.
Os resultados da pesquisa não podem ser transformados em aplicativos, um problema comum encontrado por muitos empreendedores que deixaram o Google nos últimos anos.
Por exemplo, entre os oito autores do Transformer no lado dos grandes modelos, Aidan Gomez, o fundador da Cohere, disse uma vez que o motivo da saída foi *"Não vi o verdadeiro poder do grande modelo no Google" *.
A razão pela qual Ashish Vaswani e Niki Parmar deixaram o Google para iniciar o Adept AI e o Essential AI também é "O Google quer usar o Transformer para otimizar produtos existentes e queremos criar novos produtos".
Mais tarde, o que estes investigadores temiam de facto aconteceu:
Embora maio de 2021 (antes do prazo de dados de treinamento do ChatGPT) o Google tenha desenvolvido um modelo de diálogo LaMDA e um chatbot, mas há muitas preocupações no lançamento do produto e, finalmente** 18 meses depois, foi aberto diretamente ao público na porta ao ladoChatGPT** e roubou os holofotes.
……
Tendo aprendido essas lições, o recém-criado Ideogram AI também adotou uma postura de ser o mais aberto possível e atrair primeiro os usuários para jogar.
Uma cota de testes de 1.000 pessoas foi anunciada inicialmente, mas foi preenchida rapidamente.
Em suma, o número de vagas ainda deve ser limitado e os interessados devem se apressar.
Link de referência: [1] /lançar [2] [3] [4]