Dados de Jinshi, 13 de agosto, a equipe da Alibaba continua a abrir código. A família Qwen2 adicionou o modelo de linguagem de áudio Qwen2-Audio. O Qwen2-Audio pode responder a perguntas por voz sem a necessidade de entrada de texto, compreendendo e analisando os sinais de áudio fornecidos pelos usuários, incluindo voz humana, sons naturais e música. Esse modelo superou significativamente os melhores modelos anteriores em várias avaliações autorizadas. A equipe da Alibaba também lançou simultaneamente uma nova avaliação de modelo de compreensão de áudio Referência, cujo artigo relacionado foi selecionado para a conferência internacional de ponta ACL2024 que está ocorrendo esta semana.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.