Czy jesteś nimi zainteresowany? OFERTY? Oszczędzaj dzięki naszym kuponom WhatsApp o TELEGRAM!

Lama 3 rzuca wyzwanie gigantom: oto nowy model AI Meta

Meta dodała dwa nowe modele językowe do jego serii: Lama 3 8B e Lama 3 70B. Obiecują one doskonałą wydajność w świecie sztucznej inteligencji. Najbardziej uderzająca wiadomość? Obecność odpowiednio 8 miliardów i 70 miliardów parametrów. Liczby te reprezentują złożoność i zdolność modelu do obsługi i przetwarzać informacja.

Llama 3 to nie tylko dwa modele: więcej materiału jest w drodze

Meta na tym się nie kończy; plany na wypuścić więcej modeli z serii Llama 3, ale bez określenia daty. Strategia ta budzi oczekiwania, a także pokazuje zaangażowanie firmy w ciągłe ulepszanie swojej oferty.

I nowe modele Lamy są opisane jako skok w stosunku do poprzednich modeli. Poprawa ta wynika częściowo z zastosowania dwa niestandardowe klastry GPU, każdy po 24.000 XNUMX jednostek, co umożliwiło skuteczniejsze i dokładniejsze szkolenie modeli. Meta twierdzi, że modele te ze względu na ilość posiadanych parametrów są takie wśród najlepszych dostępnych dziś o generatywnej sztucznej inteligencji.

Wydajność Lamy 3 mierzono za pomocą różnych testów porównawczych sztucznej inteligencji, które są ustandaryzowanymi testami używanymi do oceny możliwości modeli sztucznej inteligencji. Obejmują one MMLU dla wiedzy, ARC na nabycie umiejętności, tj DROP do rozumowania na temat bloków tekstu. Chociaż istnieją różne opinie na temat przydatności tych benchmarków, pozostają one powszechną metodą oceny i porównywania możliwości modeli sztucznej inteligencji.

W szczególności Llama 3 8B przewyższała podobne modele open source przy mniejszej liczbie parametrów, takie jak Mistral i Google Gemma, w co najmniej dziewięciu różnych benchmarkach. Obejmuje to testy sprawdzające wiedzę ogólną, rozumowanie i konkretne umiejętności z takich dziedzin, jak biologia, fizyka, chemia, a nawet generowanie kodu i problemy matematyczne. Które na przykład GPT-4 nie radzi sobie zbyt dobrze.

Największy model, Llama 3 70B, nie tylko konkuruje, ale w niektórych przypadkach przewyższa flagowe modele, takie jak Gemini 1.5 Pro od Google w różnorodnych testach, pokazując, że pomimo silnej konkurencji jest w stanie stawić czoła nawet gigantom branży. Należy jednak pamiętać, że choć przewyższa niektóre flagowe modele, takie jak Claude 3 Sonnet autorstwa Anthropic w kilku testach nie osiąga wydajności bardziej zaawansowanego modelu Claude 3 Opus.

tagi:

Gianluca Cobucci
Gianluca Cobucci

Pasjonat kodu, języków i języków, interfejsów człowiek-maszyna. Interesuje mnie wszystko, co jest ewolucją technologiczną. Staram się jak najdokładniej przekazywać swoją pasję, opierając się na rzetelnych źródłach, a nie „na pierwszym przejściu”.

Subskrybować
zawiadamiać
gość

0 Komentarze
Informacje zwrotne w linii
Wyświetl wszystkie komentarze
XiaomiToday.it
logo