this post was submitted on 08 May 2025
6 points (100.0% liked)
Teknologi
328 readers
1 users here now
For debat og nyheder omkring teknologi af alle former.
founded 2 years ago
MODERATORS
you are viewing a single comment's thread
view the rest of the comments
view the rest of the comments
Det virker allerede som om vi er i stadie 3 af LLM'er og den slags AIs. De er nødt til at finde på en fundamentalt anden måde at gøre dem bedre på, virker det som om (altså andet end bare at komme flere parametre og mere computerkraft efter modellerne).
Ja, du tænker på ligesom i udviklingen med Disketter -> CD'er -> DVD'er -> Bluray -> MicroSDXC osv.? Altså: hvor der skal ske noget radikalt nyt inden for teknologien, for at den ikke skal stagnere og ramme en mur?
Sprogmodeller er stadig baseret på Googles Transformer teknologi + Attention. Forklaret kort af 3Blue1Brown her: https://www.youtube.com/watch?v=LPZh9BOjkQs
Det seneste teknologispring må være Reasoning (ræsonnement, direkte oversat), der forbedrer outputs til f.eks. matematik og kodning. Men ikke ligefrem et "Diskette til CD"-spring.
Eksempel (Claude 3.7 Sonnet med og uden Reasoning):
Kilde: https://www.vellum.ai/llm-leaderboard#compare
Ja jeg tænker på transformere. Det var et paradigmeskifte da de kom frem, men jeg tror efterhånden teknologien er blevet strakt til sin kapacitet. Der skal en helt anden arkitektur til nu for at kunne gøre det anderledes.
Enig. Ræsonnerende sprogmodeller er et skridt fremad, men det er ikke nogen revolution. De vil nok mest være en hjælp til analysearbejde og andre former for mønstergenkendelse. Ikke særligt clickbait-egnet ...
Tilføjet:
Transformer+Attention paper er alligevel helt tilbage fra 2017, og det var først i slut-2022, at ChatGPT 3.5 udkom og blev populært:
Key Milestones in LLM Evolution
2017: Foundation Era2018-2019: Early Models
2020-2021: Scaling Revolution
2022: Alignment Breakthrough
2023: Multimodal Expansion
2024: Reasoning Emergence