Tema: Nova metoda za učenje LLM-ov obljublja velike prihranke

Nova metoda za učenje LLM-ov obljublja velike prihranke

Raziskovalci pri Nvidia so naredili pomemben korak na področju usposabljanja velikih jezikovnih modelov (LLM). Razvili so nov pristop po imenu NVFP4, ki omogoča usposabljanje modelov z 4-bitno kvantizacijo, pri čemer ohranja stabilnost in natančnost modelov, primerljivi z 8-bitnim formatom FP8.