Google: Η προσέγγισή μας στην ενεργειακή καινοτομία και το περιβαλλοντικό αποτύπωμα του AI

Google: Η προσέγγισή μας στην ενεργειακή καινοτομία και το περιβαλλοντικό αποτύπωμα του AI
Παρασκευή, 22/08/2025 - 08:36

Στις 21 Αυγούστου, η Google ανακοίνωσε μια νέα, ολοκληρωμένη μεθοδολογία για τη μέτρηση του αντίκτυπου της ενέργειας, των εκπομπών και του νερού που σχετίζονται με τις προτροπές Gemini.

Συντάκτης: Ben Gomes

Το AI αντιπροσωπεύει έναν από τους σημαντικότερους τεχνολογικούς μετασχηματισμούς της εποχής μας, ο οποίος θα γίνει πιο εμφανής την επόμενη δεκαετία. Εφαρμοσμένο σε τομείς όπως η ιατρική, η ενέργεια, τα αυτόνομα συστήματα και οι κβαντικοί υπολογιστές, το AI είναι έτοιμο να βοηθήσει τους ανθρώπους να αντιμετωπίσουν σημαντικές κοινωνικές προκλήσεις, είτε πρόκειται για τη βοήθεια των μαθητών στο να μάθουν, την έγκαιρη διάγνωση του καρκίνου, τη βελτίωση της ασφάλειας των σύνθετων συστημάτων μεταφοράς και κυβερνοασφάλειας ή ακόμα και την πρόβλεψη της πορείας των δασικών πυρκαγιών για τους διασώστες.

Η αξιοποίηση των δυνατοτήτων του AI θα απαιτήσει ισχυρές ενεργειακές υποδομές, πιο αποδοτική χρήση ενέργειας, καθώς και νέες καινοτόμες τεχνολογικές λύσεις. Προσεγγίζουμε αυτό το ζήτημα από πολλές πλευρές, επενδύοντας σε νέες υποδομές, σχεδιάζοντας πιο έξυπνα και ανθεκτικά δίκτυα και επεκτείνοντας τόσο τις ήδη καθιερωμένες όσο και τις νέες, καινοτόμες πηγές καθαρής ενέργειας. Ταυτόχρονα, εστιάζουμε, επίσης, στη μεγιστοποίηση της αποδοτικότητας σε κάθε επίπεδο των δραστηριοτήτων μας, από τον σχεδιασμό του ειδικά κατασκευασμένου εξοπλισμού μας έως το λογισμικό και τα μοντέλα που εκτελούνται στα κέντρα δεδομένων μας.

Προκειμένου να βελτιωθεί η ενεργειακή απόδοση του AI, είναι σημαντική η σαφής και ολοκληρωμένη κατανόηση του περιβαλλοντικού αποτυπώματος του AI. Μέχρι σήμερα, τα αναλυτικά δεδομένα σχετικά με την ενέργεια και τον περιβαλλοντικό αντίκτυπο του συμπερασμού AI ήταν περιορισμένα.

Σήμερα, συμβάλλουμε στη γεφύρωση αυτού του κενού, κυκλοφορώντας μια ολοκληρωμένη μεθοδολογία για τη μέτρηση της ενέργειας, του νερού και των εκπομπών διοξειδίου του άνθρακα των μοντέλων AI της Google. Είναι σημαντικό να σημειωθεί ότι η εργασία μας για την αποδοτικότητα των μοντέλων σημειώνει ταχεία πρόοδο. Σε μια περίοδο 12 μηνών, ενώ παρείχαμε απαντήσεις υψηλότερης ποιότητας, η μέση κατανάλωση ενέργειας και το αποτύπωμα άνθρακα ανά προτροπή κειμένου στις Εφαρμογές Gemini μειώθηκαν κατά 33 και 44 φορές, αντίστοιχα. Με βάση την πρόσφατη ανάλυσή μας, διαπιστώσαμε ότι η δουλειά μας για την αποδοτικότητα αποδεικνύεται αποτελεσματική και η ενέργεια που καταναλώνεται για το μέσο αίτημα ενός χρήστη ισοδυναμεί με την παρακολούθηση τηλεόρασης για λιγότερο από εννέα δευτερόλεπτα. Αυτές οι εξελίξεις βασίζονται στη μακροχρόνια δέσμευσή μας για την αποδοτικότητα των κέντρων δεδομένων. Το 2024, για παράδειγμα, μειώσαμε τις εκπομπές ενέργειας των κέντρων δεδομένων κατά 12%, παρόλο που η κατανάλωση ηλεκτρικής ενέργειας αυξήθηκε κατά 27% από έτος σε έτος, λόγω της επέκτασης της επιχείρησης και των υπηρεσιών μας.

Καθώς συνεχίζουμε να επενδύουμε στην τεχνολογία και την καινοτομία που απαιτούνται για την κάλυψη σημαντικών νέων ενεργειακών απαιτήσεων, η διαφάνεια είναι το κλειδί για την πρόοδο. Ελπίζουμε ότι αυτή η μελέτη θα συμβάλει στις συνεχιζόμενες προσπάθειες για την ανάπτυξη αποδοτικούAI σε αυτή την κρίσιμη στιγμή για την ενέργεια, τη βιωσιμότητα και την επιστημονική ανακάλυψη, προς όφελος όλων. Διαβάστε περισσότερα σχετικά με τον τρόπο με τον οποίο καταλήξαμε στους υπολογισμούς και την προσέγγισή μας πλήρους στοίβας στην ενεργειακή καινοτομία και εμβαθύνετε στην τεχνική μας αναφορά.

Πόση ενέργεια χρησιμοποιεί το Google AI; Κάναμε τους υπολογισμούς

Συντάκτες:

  1. Amin Vahdat, Αντιπρόεδρος/Γενικός Διευθυντής, Αντιπρόεδρος/Γενικός Διευθυντής, AI και υποδομή, Google Cloud
  2. Jeff Dean, επικεφαλής επιστήμονας, Google DeepMind και Google Research

Το AI ξεκλειδώνει επιστημονικές ανακαλύψεις, βελτιώνει την υγειονομική περίθαλψη και την εκπαίδευση και θα μπορούσε να προσθέσει τρισεκατομμύρια στην παγκόσμια οικονομία. Η κατανόηση του περιβαλλοντικού αποτυπώματος του AI είναι κρίσιμη, ωστόσο τα λεπτομερή δεδομένα σχετικά με την ενέργεια και τον περιβαλλοντικό αντίκτυπο του συμπερασμού AI, δηλαδή της χρήσης ενός εκπαιδευμένου μοντέλου AI για τη δημιουργία προβλέψεων ή τη δημιουργία κειμένου ή εικόνων, ήταν περιορισμένα. Καθώς περισσότεροι χρήστες χρησιμοποιούν συστήματα AI, η σημασία της αποδοτικότητας συμπερασμού αυξάνεται.

Αυτός είναι ο λόγος που κυκλοφορούμε μια τεχνική μελέτη που περιγράφει λεπτομερώς τη συνολική μεθοδολογία μας για τη μέτρηση των επιπτώσεων των προτροπών του Gemini στην ενέργεια, τις εκπομπές και το νερό. Χρησιμοποιώντας αυτή τη μεθοδολογία, υπολογίζουμε ότι η μεσαία προτροπή κειμένου των Εφαρμογών Gemini χρησιμοποιεί 0,24 βατ-ώρες (Wh) ενέργειας, εκπέμπει 0,03 γραμμάρια ισοδύναμου διοξειδίου του άνθρακα (gCO2e) και καταναλώνει 0,26 χιλιοστόλιτρα (ή περίπου πέντε σταγόνες) νερού[1]. Αυτοί οι αριθμοί είναι ουσιαστικά χαμηλότεροι από πολλούς δημόσιους υπολογισμούς. Η ενεργειακή επίδραση ανά προτροπή είναι ισοδύναμη με την παρακολούθηση τηλεόρασης για λιγότερο από εννέα δευτερόλεπτα.

Ταυτόχρονα, τα συστήματα AI μας γίνονται πιο αποδοτικά μέσω ερευνητικών καινοτομιών και βελτιώσεων στην απόδοση του λογισμικού και του εξοπλισμού. Για παράδειγμα, κατά τη διάρκεια μιας πρόσφατης περιόδου 12 μηνών, η ενέργεια και το συνολικό αποτύπωμα άνθρακα της μέσης προτροπής κειμένου των Εφαρμογών Gemini μειώθηκαν κατά 33 και 44 φορές, αντίστοιχα,[2] ενώ παράλληλα παρείχαν απαντήσεις υψηλότερης ποιότητας. Αυτά τα αποτελέσματα βασίζονται στις πιο πρόσφατες μειώσεις εκπομπών ενέργειας των κέντρων δεδομένων μας και στο έργο μας για την προώθηση της ενέργειας χωρίς άνθρακα και της αναπλήρωσης νερού. Αν και είμαστε περήφανοι για την καινοτομία που κρύβεται πίσω από τα κέρδη μας σε αποδοτικότητα μέχρι στιγμής, δεσμευόμαστε να συνεχίσουμε να κάνουμε ουσιαστικές βελτιώσεις. Ακολουθεί μια πιο προσεκτική ματιά σε αυτές τις συνεχιζόμενες προσπάθειες.

[οπτικοποίηση καθημερινών συγκρίσεων]

Υπολογισμός του περιβαλλοντικού αποτυπώματος του AI στην Google

Η λεπτομερής μέτρηση μάς επιτρέπει να κάνουμε συγκρίσεις μεταξύ διαφορετικών μοντέλων AI και του εξοπλισμού και της ενέργειας που χρησιμοποιούν, ενώ παράλληλα επιτρέπει τη βελτιστοποίηση της αποδοτικότητας σε επίπεδο συστήματος, από τον εξοπλισμό και τα κέντρα δεδομένων μέχρι τα ίδια τα μοντέλα. Με την κοινοποίηση της μεθοδολογίας μας, ελπίζουμε να αυξήσουμε τη συνέπεια στον υπολογισμό της κατανάλωσης πόρων και της αποδοτικότητας του AI σε ολόκληρο τον κλάδο.

Η μέτρηση του αποτυπώματος των εργασιών που εξυπηρετεί το ΑΙ δεν είναι απλή. Αναπτύξαμε μια ολοκληρωμένη προσέγγιση που λαμβάνει υπόψη τις πραγματικές συνθήκες λειτουργίας AI στην κλίμακα της Google, οι οποίες περιλαμβάνουν τα εξής:

  • Πλήρης δυναμική ισχύος συστήματος: Αυτό περιλαμβάνει όχι μόνο την ενέργεια και το νερό που χρησιμοποιεί το κύριο μοντέλο AI κατά τον ενεργό υπολογισμό, αλλά και την πραγματική αξιοποίηση της επεξεργαστικής ισχύος σε κλίμακα παραγωγής, η οποία μπορεί να είναι πολύ χαμηλότερη από τα θεωρητικά μέγιστα.
  • Αδρανείς μηχανές: Για να διασφαλιστεί η υψηλή διαθεσιμότητα και αξιοπιστία, τα συστήματα παραγωγής απαιτούν έναν βαθμό παρεχόμενης χωρητικότητας που είναι αδρανής, αλλά έτοιμη να διαχειριστεί αύξηση της επισκεψιμότητας ή ανακατεύθυνση σε περίπτωση σφάλματος ανά πάσα στιγμή. Η ενέργεια που καταναλώνεται από αυτά τα ανενεργά τσιπ πρέπει να συνυπολογίζεται στο συνολικό ενεργειακό αποτύπωμα.
  • CPU και RAM: Η εκτέλεση μοντέλων AI δεν γίνεται αποκλειστικά σε επιταχυντές μηχανικής μάθησης, όπως TPU και GPU. Ο CPU και η RAM του κεντρικού υπολογιστή παίζουν επίσης καθοριστικό ρόλο στην παροχή AI και χρησιμοποιούν ενέργεια.
  • Έμμεσο κόστος κέντρου δεδομένων: Η ενέργεια που καταναλώνεται από τον εξοπλισμό πληροφορικής που εκτελεί φόρτους εργασίας AI είναι μόνο ένα μέρος της ιστορίας. Η υποδομή που υποστηρίζει αυτούς τους υπολογισμούς, δηλαδή τα συστήματα ψύξης, η διανομή ενέργειας και άλλα έμμεσα έξοδα του κέντρου δεδομένων, καταναλώνει επίσης ενέργεια. Η βοηθητική ενεργειακή απόδοση μετριέται με μια μέτρηση που ονομάζεται Αποτελεσματικότητα χρήσης ισχύος (PUE).
  • Κατανάλωση νερού από κέντρα δεδομένων: Για τη μείωση της κατανάλωσης ενέργειας και των σχετικών εκπομπών, τα κέντρα δεδομένων καταναλώνουν συχνά νερό για ψύξη. Καθώς βελτιστοποιούμε τα συστήματα AI μας ώστε να είναι πιο ενεργειακά αποδοτικά, μειώνεται φυσικά και η συνολική κατανάλωση νερού τους.

Πολλοί τρέχοντες υπολογισμοί κατανάλωσης ενέργειας AI περιλαμβάνουν μόνο την ενεργή κατανάλωση μηχανών, παραβλέποντας αρκετούς από τους κρίσιμους παράγοντες που συζητήθηκαν παραπάνω. Ως αποτέλεσμα, αντιπροσωπεύουν τη θεωρητική απόδοση και όχι την πραγματική λειτουργική απόδοση σε κλίμακα. Όταν εφαρμόζουμε αυτή τη μη ολοκληρωμένη μεθοδολογία που λαμβάνει υπόψη μόνο την ενεργή κατανάλωση TPU και GPU, εκτιμούμε ότι η μέση προτροπή κειμένου Gemini χρησιμοποιεί 0,10 Wh ενέργειας, εκπέμπει 0,02 gCO2e και καταναλώνει 0,12 mL νερού. Το καλύτερο που μπορεί να πει κανείς γι’ αυτό είναι ότι πρόκειται για ένα αισιόδοξο σενάριο, που ωστόσο υποτιμά κατά πολύ το πραγματικό λειτουργικό αποτύπωμα του AI.

Οι εκτιμήσεις της ολοκληρωμένης μεθοδολογίας μας (0,24 Wh ενέργειας, 0,03 gCO2e, 0,26 mL νερού) λαμβάνουν υπόψη όλα τα κρίσιμα στοιχεία της παγκόσμιας παροχής υπηρεσιών AI. Πιστεύουμε ότι αυτή είναι η πιο ολοκληρωμένη άποψη του συνολικού αποτυπώματος του AI.

Η ολοκληρωμένη προσέγγισή μας στο AI και στην αποδοτικότητα AI

Τα εντυπωσιακά οφέλη από την αποδοτικότητα του Gemini προέρχονται από την προσέγγιση πλήρους στοίβας της Google στην ανάπτυξη AI, η οποία περιλαμβάνει προσαρμοσμένο εξοπλισμό και εξαιρετικά αποδοτικά μοντέλα, καθώς και τα ισχυρά συστήματα παροχής που επιτρέπουν τη χρήση αυτών των μοντέλων. Έχουμε ενσωματώσει την αποδοτικότητα σε κάθε επίπεδο του AI, συμπεριλαμβανομένων των εξής:

  • Πιο αποδοτικές αρχιτεκτονικές μοντέλων: Τα μοντέλα Gemini βασίζονται στην αρχιτεκτονική μοντέλου Transformer που αναπτύχθηκε από ερευνητές της Google και παρέχουν αύξηση αποδοτικότητας 10-100 φορές σε σχέση με τις προηγούμενες υπερσύγχρονες αρχιτεκτονικές για τη μοντελοποίηση γλωσσών. Σχεδιάζουμε μοντέλα με εγγενώς αποδοτικές δομές, όπως Mixture-of-Experts (MoE) και υβριδικό συλλογισμό. Τα μοντέλα MoE, για παράδειγμα, μας επιτρέπουν να ενεργοποιούμε ένα μικρό υποσύνολο ενός μεγάλου μοντέλου που απαιτείται ειδικά για την απάντηση σε ένα ερώτημα, μειώνοντας τους υπολογισμούς και τη μεταφορά δεδομένων κατά 10-100 φορές.
  • Αποδοτικοί αλγόριθμοι και κβάντωση: Βελτιώνουμε συνεχώς τους αλγόριθμους που υποστηρίζουν τα μοντέλα μας με μεθόδους όπως η Ακριβής κβαντισμένη εκπαίδευση (Accurate Quantized Training, AQT), για να μεγιστοποιήσουμε την αποδοτικότητα και να μειώσουμε την κατανάλωση ενέργειας για την παροχή υπηρεσιών, χωρίς συμβιβασμούς στην ποιότητα των απαντήσεων.
  • Βελτιστοποιημένη εξαγωγή συμπερασμάτων και παροχή υπηρεσιών: Βελτιώνουμε συνεχώς την παροχή μοντέλων AI για μεγαλύτερη ανταπόκριση και αποδοτικότητα. Τεχνολογίες όπως η εικαστική αποκωδικοποίηση εξυπηρετούν περισσότερες απαντήσεις με λιγότερα τσιπ, επιτρέποντας σε ένα μικρότερο μοντέλο να κάνει προβλέψεις που επαληθεύονται γρήγορα από ένα μεγαλύτερο μοντέλο. Αυτό είναι πιο αποδοτικό από το να κάνει το μεγαλύτερο μοντέλο πολλές διαδοχικές προβλέψεις μόνο του. Τεχνικές όπως η απόσταξη δημιουργούν μικρότερα, πιο αποδοτικά μοντέλα (Gemini Flash και Flash-Lite) για παροχή υπηρεσιών που χρησιμοποιούν τα μεγαλύτερα, πιο ικανά μοντέλα μας ως δασκάλους. Ο ταχύτερος εξοπλισμός και τα μοντέλα μηχανικής μάθησης μάς επιτρέπουν να χρησιμοποιούμε μεγαλύτερα μεγέθη παρτίδων κατά τον χειρισμό αιτημάτων, χωρίς να θυσιάζουμε τους στόχους καθυστέρησης.
  • Προσαρμοσμένος εξοπλισμός: Σχεδιάζουμε τις TPU μας από το μηδέν για πάνω από μια δεκαετία, ώστε να μεγιστοποιούμε την απόδοση ανά watt. Σχεδιάζουμε επίσης από κοινού τα μοντέλα AI και τα TPU, διασφαλίζοντας ότι το λογισμικό μας αξιοποιεί πλήρως το υλικό μας και ότι το υλικό μας θα μπορεί να εκτελεί αποτελεσματικά το μελλοντικό λογισμικό AI μας, όταν και τα δύο είναι έτοιμα. Το TPU τελευταίας γενιάς, Ironwood, είναι 30 φορές πιο ενεργειακά αποδοτικό από το πρώτο μας TPU που ήταν διαθέσιμο στο κοινό και πολύ πιο ενεργειακά αποδοτικό από τις CPU γενικής χρήσης για συμπερασματολογία.
  • Βελτιστοποιημένη αδράνεια: Η στοίβα εξυπηρέτησής μας χρησιμοποιεί τις CPU με εξαιρετικά αποδοτικό τρόπο και ελαχιστοποιεί την αδράνεια των TPU, μετακινώντας δυναμικά τα μοντέλα με βάση τη ζήτηση σε σχεδόν πραγματικό χρόνο, αντί να χρησιμοποιεί τηνπροσέγγιση "ρύθμισε το και ξέχασε το".
  • Στοίβα λογισμικού μηχανικής μάθησης: Ο μεταγλωττιστής XLA ML, οι πυρήνες Pallas και τα συστήματα Pathways επιτρέπουν στους υπολογισμούς μοντέλων που εκφράζονται σε συστήματα υψηλότερου επιπέδου, όπως το JAX, να εκτελούνται αποτελεσματικά στον εξοπλισμό TPU.
  • Εξαιρετικά αποδοτικά κέντρα δεδομένων: Τα κέντρα δεδομένων της Google συγκαταλέγονται στα πιο αποδοτικά του κλάδου, με μέση PUE 1,09 σε όλο τον εξοπλισμό.
  • Υπεύθυνες λειτουργίες κέντρων δεδομένων: Συνεχίζουμε να προσθέτουμε παραγωγή καθαρής ενέργειας στο πλαίσιο της φιλοδοξίας μας για 24ωρη λειτουργία χωρίς εκπομπές διοξειδίου του άνθρακα, ενώ προωθούμε τον στόχο μας για αναπλήρωση του 120% του γλυκού νερού που καταναλώνουμε κατά μέσο όρο στα γραφεία και τα κέντρα δεδομένων μας. Βελτιστοποιούμε, επίσης, τα συστήματα ψύξης μας, εξισορροπώντας την τοπική αντισταθμιστική σχέση μεταξύ ενέργειας, νερού και εκπομπών, διεξάγοντας αξιολογήσεις υγείας υδροκριτών που βασίζονται στην επιστήμη, για να καθοδηγήσουμε την επιλογή του τύπου ψύξης και να περιορίσουμε τη χρήση νερού σε τοποθεσίες υψηλής πίεσης.

Η δέσμευσή μας για αποδοτικό AI

Τα οφέλη από την αποδοτικότητα του Gemini είναι το αποτέλεσμα πολλών ετών εργασίας, αλλά αυτό είναι μόνο η αρχή. Αναγνωρίζοντας ότι η ζήτηση για το AI αυξάνεται, επενδύουμε σημαντικά στη μείωση του κόστους παροχής ενέργειας και του νερού που απαιτείται ανά προτροπή. Μοιραζόμενοι τα ευρήματα και τη μεθοδολογία μας, στοχεύουμε στην προώθηση της προόδου σε ολόκληρο τον κλάδο προς ένα πιο αποδοτικό AI. Αυτό είναι απαραίτητο για την υπεύθυνη ανάπτυξη του AI.

[1] Μια ανάλυση συγκεκριμένης χρονικής στιγμής ποσοτικοποίησε την ενέργεια που καταναλώνεται ανά μέση προτροπή δημιουργίας κειμένου της Εφαρμογής Gemini, λαμβάνοντας υπόψη δεδομένα από τον Μάιο του 2025. Οι εκπομπές ανά οδηγία εκτιμήθηκαν με βάση την ενέργεια ανά οδηγία και την εφαρμογή της μέσης έντασης διοξειδίου του άνθρακα του δικτύου της Google για το 2024. Η κατανάλωση νερού ανά οδηγία εκτιμήθηκε με βάση την ενέργεια ανά οδηγία και την εφαρμογή της μέσης αποτελεσματικότητας χρήσης νερού σε όλο τον στόλο της Google για το 2024. Αυτά τα ευρήματα δεν αντιπροσωπεύουν τον συγκεκριμένο περιβαλλοντικό αντίκτυπο για όλες τις οδηγίες δημιουργίας κειμένου των Εφαρμογών Gemini ούτε αποτελούν ένδειξη της μελλοντικής απόδοσης.

[2] Τα αποτελέσματα της παραπάνω ανάλυσης από τον Μάιο του 2025 συγκρίθηκαν με τα δεδομένα βάσης από τη μεσαία προτροπή δημιουργίας κειμένου της εφαρμογής Gemini τον Μάιο του 2024. Η ενέργεια ανά μέση προτροπή υπόκειται σε αλλαγές καθώς προστίθενται νέα μοντέλα, εξελίσσεται η αρχιτεκτονική μοντέλων AI και αναπτύσσεται η συμπεριφορά χρήστη chatbot AI. Τα δεδομένα και οι ισχυρισμοί δεν έχουν επαληθευτεί από ανεξάρτητο τρίτο μέρος.

Παρακολουθήσετε το σχετικό βίντεο, το οποίο παρέχει μία πλήρη εικόνα των αποτελεσμάτων.