Nova IA de código aberto Hermes 3 promete avanços significativos no processamento de linguagem natural

O Hermes 3 é um novo modelo de linguagem de IA lançado pela Nous Research em parceria com a Lambda Labs. Baseado no Llama 3.1 da Meta, está disponível em três tamanhos: 8, 70 e 405 bilhões de parâmetros. O modelo se destaca por suas capacidades avançadas de raciocínio, criatividade e processamento de linguagem natural, incluindo retenção de contexto de longo prazo, interpretação de papéis complexos e geração de código proficiente. Utiliza o formato de prompt ChatML para maior controle e oferece pesos abertos e não censurados. O Hermes 3 está disponível gratuitamente através da API da Lambda Labs, pode ser executado localmente em GPUs adequadas e é acessível via Discord para testes. Este modelo representa um avanço significativo em IA de código aberto, focando em alinhamento com o usuário e controle aprimorado.
August 20, 2024

O Hermes 3 é um novo modelo de linguagem de inteligência artificial lançado recentemente pela Nous Research em parceria com a Lambda Labs. Aqui estão os principais pontos sobre o Hermes 3:

Características principais

  • É baseado no modelo Llama 3.1 da Meta, sendo uma versão de código aberto e otimizada deste[1].
  • Disponível em três tamanhos: 8 bilhões, 70 bilhões e 405 bilhões de parâmetros[5].
  • Foca em capacidades avançadas de raciocínio, criatividade e processamento de linguagem natural[1].

Capacidades

  • Retenção de contexto de longo prazo e habilidade em conversas de múltiplos turnos[1].
  • Habilidades complexas de interpretação de papéis e monólogo interno[1].
  • Capacidades aprimoradas de função-calling e geração de saídas estruturadas[4].
  • Geração de código com alta proficiência, incluindo explicações detalhadas e documentação[5].

Diferenciais

  • Utiliza o formato de prompt ChatML, permitindo maior controle e direcionamento do modelo[4].
  • Pesos abertos e não censurados, oferecendo maior flexibilidade de customização[5].
  • Demonstra desempenho competitivo ou superior ao Llama 3.1 em benchmarks gerais[4].

Acesso e uso

  • Disponível gratuitamente através da API da Lambda Labs[5].
  • Pode ser instalado e executado localmente em máquinas com GPU adequada[6].
  • Acessível via interface Discord para testes e experimentações[3].

O Hermes 3 representa um avanço significativo em modelos de IA de código aberto, oferecendo capacidades avançadas de processamento de linguagem natural e resolução de problemas complexos, com foco em alinhamento com o usuário e controle aprimorado.

Citations:
[1] https://nousresearch.com/hermes3/
[2] https://github.com/bendudson/hermes-3
[3] https://www.aixploria.com/en/hermes-3-llm-model/
[4] https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B-GGUF
[5] https://siliconangle.com/2024/08/15/hermes-3-super-creative-version-open-source-llama-3-1-llm-struggles-inner-conflict/
[6] https://www.youtube.com/watch?v=8K9CflWOK2g
[7] https://www.youtube.com/watch?v=ODEQ-pnP4F4
[8] https://blog.saninternet.com/inteligencia-artificial

News