O que é DeepSeek e por que ele está agitando o setor de IA? | Empresas

O lançamento dos últimos modelos de Inteligência Artificial da startup chinesa DeepSeek, que ela diz estarem no mesmo nível ou melhores do que os modelos líderes do setor nos Estados Unidos por uma fração do custo, está ameaçando perturbar a ordem mundial da tecnologia.

A empresa atraiu a atenção nos círculos globais de IA após publicar um artigo no mês passado dizendo que o treinamento do DeepSeek-V3 exigiu poder de computação dos chips Nvidia H800 num valor abaixo de US$ 6 milhões.

O AI Assistant da DeepSeek, alimentado pelo DeepSeek-V3, ultrapassou o rival ChatGPT e se tornou o aplicativo gratuito mais bem avaliado disponível na App Store da Apple nos Estados Unidos.

Isso levantou dúvidas sobre o raciocínio por trás da decisão de algumas empresas de tecnologia dos EUA de prometer bilhões de dólares em investimentos em IA e as ações de vários grandes players de tecnologia, incluindo a Nvidia, foram atingidas.

Abaixo estão alguns fatos sobre a empresa que está sacudindo o setor de IA em todo o mundo:

Por que a DeepSeek está causando alvoroço?

O lançamento do ChatGPT da OpenAI no final de 2022 causou uma confusão entre as empresas de tecnologia chinesas, que correram para criar seus próprios chatbots movidos por inteligência artificial.

Mas após a estreia do primeiro equivalente chinês do ChatGPT, feito pelo gigante dos mecanismos de busca Baidu, houve uma decepção generalizada na China com a distância nas capacidades de IA entre as empresas dos EUA e da China.

A qualidade e a eficiência de custos dos modelos da DeepSeek inverteram essa narrativa. Os dois modelos que foram elogiados por executivos do Vale do Silício e engenheiros de empresas de tecnologia dos EUA, DeepSeek-V3 e DeepSeek-R1, estão no mesmo nível dos modelos mais avançados da OpenAI e da Meta, disse a startup chinesa.

Eles também são mais baratos de usar. O DeepSeek-R1, lançado na semana passada, é de 20 a 50 vezes mais barato de usar do que o modelo OpenAI o1, dependendo da tarefa, de acordo com uma postagem na conta oficial do WeChat da DeepSeek.

Mas alguns expressaram publicamente ceticismo sobre a história de sucesso da DeepSeek.

O CEO da Scale AI, Alexandr Wang, disse durante uma entrevista à CNBC na quinta-feira, sem fornecer evidências, que a DeepSeek tem 50 mil chips Nvidia H100, que ele alegou que não seriam divulgados porque isso violaria os controles de exportação de Washington que proíbem a venda de chips de IA avançados para empresas chinesas. A DeepSeek não respondeu imediatamente a um pedido de comentário sobre a alegação.

Analistas da consultoria Bernstein destacaram em uma nota de pesquisa que os custos totais de treinamento da DeepSeek para seu modelo V3 eram desconhecidos, mas eram muito maiores do que os US$ 5,58 milhões que a startup disse terem sido investidos em poder de computação. Os analistas também disseram que os custos de treinamento do modelo R1 igualmente aclamado não foram divulgados.

Quem está por trás da DeepSeek?

A DeepSeek é uma startup sediada em Hangzhou cujo acionista controlador é Liang Wenfeng, cofundador do fundo de hedge quantitativo High-Flyer, de acordo com registros corporativos chineses.

O fundo de Liang anunciou em março de 2023 em sua conta oficial do WeChat que estava “começando de novo”, concentrando recursos na criação de um “novo e independente grupo de pesquisa, para explorar a essência da AGI” (Inteligência Geral Artificial). O DeepSeek foi criado mais tarde naquele ano.

A OpenAI, criadora do ChatGPT, define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Não está claro quanto a High-Flyer investiu na DeepSeek. A High-Flyer tem um escritório localizado no mesmo prédio que a DeepSeek e também possui patentes relacionadas a clusters de chips usados ​​para treinar modelos de IA, de acordo com registros corporativos chineses.

A unidade de IA da High-Flyer disse em sua conta oficial do WeChat em julho de 2022 que possui e opera um cluster de 10 mil chips A100.

Como Pequim vê a DeepSeek?

O sucesso da DeepSeek já foi notado nos principais círculos políticos da China. Em 20 de janeiro, o dia em que o DeepSeek-R1 foi lançado ao público, o fundador Liang compareceu a um simpósio a portas fechadas para empresários e especialistas, organizado pelo premiê chinês Li Qiang, de acordo com a agência de notícias estatal Xinhua.

A presença de Liang no encontro é potencialmente um sinal de que o sucesso do DeepSeek pode ser importante para a meta política de Pequim de superar os controles de exportação de Washington e alcançar a autossuficiência em indústrias estratégicas como IA.

Um simpósio semelhante no ano passado contou com a presença do CEO da Baidu, Robin Li.

Fonte: Valor

Compartilhar esta notícia