Τα LLMs (Large Language Models – Μεγάλα Γλωσσικά Μοντέλα), όπως το ChatGPT, το Gemini ή το Claude, αποτελούν σήμερα την πιο δημοφιλή εφαρμογή της Τεχνητής Νοημοσύνης.
Η Ιεραρχική Θέση των LLMs
- Τεχνητή Νοημοσύνη (AI): Η γενική ομπρέλα.
- Μηχανική Μάθηση (Machine Learning): Τα LLMs δεν ακολουθούν κανόνες που έγραψε άνθρωπος, αλλά μαθαίνουν από δεδομένα.
- Βαθιά Μάθηση (Deep Learning): Χρησιμοποιούν τεράστια νευρωνικά δίκτυα (συγκεκριμένα την αρχιτεκτονική Transformer).
- Επεξεργασία Φυσικής Γλώσσας (NLP): Είναι ο κλάδος που εστιάζει στην κατανόηση και παραγωγή ανθρώπινης ομιλίας/κειμένου.
- Γεννητική ΤΝ (Generative AI): Εδώ ανήκουν τα LLMs, γιατί η δουλειά τους είναι να δημιουργούν νέο περιεχόμενο (κείμενο, κώδικα κ.λπ.) αντί να κάνουν απλώς μια ταξινόμηση.
Γιατί ονομάζονται έτσι;
- Large (Μεγάλα): Αναφέρεται στον τεράστιο αριθμό παραμέτρων (δισεκατομμύρια «συνδέσεις») και στον όγκο των δεδομένων στα οποία εκπαιδεύτηκαν (σχεδόν όλο το διαθέσιμο κείμενο από το internet και βιβλιοθήκες).
- Language (Γλωσσικά): Ο κύριος τομέας εξειδίκευσής τους είναι η γλώσσα.
- Models (Μοντέλα): Είναι μαθηματικά μοντέλα που προβλέπουν την πιθανότητα της επόμενης λέξης σε μια πρόταση.
Τα LLMs ανήκουν στην Ασθενή / Στενή ΤΝ (Narrow AI), καθώς είναι εξειδικευμένα στη γλώσσα, παρόλο που η ικανότητά τους να απαντούν σε σχεδόν τα πάντα μας δίνει συχνά την ψευδαίσθηση ότι πλησιάζουν τη Γενική ΤΝ (AGI).
Το Data Science (Επιστήμη Δεδομένων) είναι ένας ευρύτερος κλάδος που «συνομιλεί» με την Τεχνητή Νοημοσύνη, αλλά έχει διαφορετικό τελικό στόχο.
Ενώ η ΤΝ επικεντρώνεται στο να κάνει τη μηχανή να δράσει έξυπνα, το Data Science επικεντρώνεται στο να βγάλει νόημα από τα δεδομένα.
Η σχέση τους:
Φαντάσου το Data Science σαν μια μεγάλη εργαλειοθήκη. Η Μηχανική Μάθηση (ML) και η ΤΝ είναι κάποια από τα πιο ισχυρά εργαλεία μέσα σε αυτή την εργαλειοθήκη.
- Data Science (Επιστήμη Δεδομένων): Είναι η διαδικασία καθαρισμού, ανάλυσης και οπτικοποίησης δεδομένων για την εξαγωγή συμπερασμάτων. Χρησιμοποιεί Στατιστική, Μαθηματικά και Προγραμματισμό.
- Τεχνητή Νοημοσύνη (AI): Είναι ο στόχος του να δημιουργήσουμε συστήματα που εκτελούν εργασίες οι οποίες απαιτούν ανθρώπινη νοημοσύνη.
- Η τομή τους: Ένας Data Scientist χρησιμοποιεί συχνά αλγορίθμους ΤΝ και Μηχανικής Μάθησης για να προβλέψει μελλοντικές τάσεις (π.χ. «πόσες πωλήσεις θα κάνουμε τον επόμενο μήνα;»).
