Google: Νέες λειτουργίες στο Gemini
Σήμερα, η Google παρουσίασε νέες λειτουργίες, οι οποίες μάλιστα είχαν αναφερθεί για πρώτη φορά στο φετινό συνέδριο Google I/O. Συγκεκριμένα, τα Gems, μία νέα λειτουργία που επιτρέπει στους χρήστες να προσαρμόζουν το Gemini δημιουργώντας τους προσωπικούς τους συμβούλους Τεχνητής Νοημοσύνης, ειδικούς σε οποιοδήποτε θέμα επιθυμούν, είναι τώρα διαθέσιμα για τους χρήστες Gemini Advanced, Business και Enterprise. Αντίστοιχα, το νέο μοντέλο παραγωγής εικόνας της Google, το Imagen 3, είναι τώρα διαθέσιμο στα Gemini, Gemini Advanced, Business και Enterprise.
Δημιουργώντας Gems για εξατομικευμένη βοήθεια — από την ανάπτυξη κώδικα έως τις συμβουλές επαγγελματικής εξέλιξης
Τις επόμενες ημέρες, οι συνδρομητές των Gemini Advanced, Business και Enterprise μπορούν να ξεκινήσουν να δημιουργούν και να συνομιλούν με τα Gems, τις εξατομικευμένες εκδόσεις του Gemini που παρουσιάστηκαν για πρώτη φορά στο Google I/O. Οι χρήστες μπορούν να προσαρμόζουν τα Gems ώστε να ενεργούν ως ειδικοί σε συγκεκριμένα θέματα ή να τα βελτιώνουν με βάση συγκεκριμένους στόχους. Ο χρήστης μπορεί απλά να γράψει οδηγίες για το Gem του, να του δώσει ένα όνομα και στη συνέχεια να συνομιλήσει μαζί του όποτε ο ίδιος επιθυμεί.
Με τα Gems, οι χρήστες μπορούν να δημιουργήσουν μια ομάδα ειδικών που θα τους βοηθήσουν να διαχειριστούν ένα απαιτητικό project, να συγκεντρώσουν ιδέες για μια επερχόμενη εκδήλωση ή για να γράψουν την τέλεια λεζάντα σε μια ανάρτηση στα Social Media. Επίσης, το Gem μπορεί να θυμάται ένα λεπτομερές σύνολο οδηγιών, βοηθώντας τον χρήστη να εξοικονομήσει χρόνο από κουραστικές, επαναλαμβανόμενες ή δύσκολες εργασίες.
Για να βοηθήσει τους χρήστες να ξεκινήσουν τη χρήση των Gems, η Google λανσάρει μια σειρά από προπαρασκευασμένα Gems για διαφορετικές περιπτώσεις. Συγκεκριμένα:
- Ο βοηθός μάθησης βοηθά στην ανάλυση πολύπλοκων θεμάτων, καθιστώντας τα πιο κατανοητά.
- Ο βοηθός στη δημιουργία ιδεών προσφέρει έμπνευση - από φρέσκες ιδέες για ένα θεματικό πάρτι μέχρι το τέλειο δώρο για προσεχή γενέθλια.
- Ο οδηγός καριέρας “ξεκλειδώνει” τις δυνατότητες καριέρας του χρήστη με λεπτομερή σχέδια για τη βελτίωση των δεξιοτήτων και την επίτευξη των επαγγελματικών του στόχων.
- Ο επιμελητής κειμένων μπορεί να αναβαθμίσει τα γραπτά μέσω σαφούς, εποικοδομητικού feedback για τα πάντα, από τη γραμματική έως τη δομή.
- Ο συνεργάτης στον προγραμματισμό αναβαθμίζει τις δεξιότητες στον προγραμματισμό και μπορεί να βοηθήσει στη δημιουργία projects και στην γρήγορη εκμάθηση (εν κινήσει - on the go).
Τα Gems κυκλοφορούν τώρα σε επιτραπέζιες και κινητές συσκευές για τους χρήστες των Gemini Advanced, Gemini Business και Gemini Enterprise σε περισσότερες από 150 χώρες και στις περισσότερες γλώσσες.
Δημιουργώντας εικόνες υψηλής ποιότητας με το Imagen 3
Η Google έχει αναβαθμίσει τις δυνατότητες παραγωγής δημιουργικών εικόνων, και, τις επόμενες ημέρες, θα λανσάρει το τελευταίο μοντέλο παραγωγής εικόνων, το Imagen 3, στο Gemini , σε επιτραπέζιες και κινητές συσκευές, ενώ θα επεκτείνει τη διαθεσιμότητά του για τους χρήστες σε όλες τις γλώσσες.
Το Imagen 3 θέτει ένα νέο πρότυπο για την ποιότητα της εικόνας, δημιουργώντας εικόνες με λίγες μόνο λέξεις. Οι χρήστες μπορούν ακόμη και να ζητήσουν από το Gemini να δημιουργήσει εικόνες σε διάφορα στυλ - όπως φωτορεαλιστικά τοπία, ανάγλυφες ελαιογραφίες ή ευφάνταστες σκηνές animation με τη χρήση πλαστελίνης.
Το Imagen 3 προσφέρει προηγμένες δυνατότητες παραγωγής εικόνας, με ενσωματωμένα μέτρα προστασίας ευθυγραμμισμένα με τις αρχές σχεδιασμού των προϊόντων της Google. Σε ένα ευρύ φάσμα αξιολογήσεων, το Imagen 3 αποδίδει καλύτερα σε σύγκριση με άλλα διαθέσιμα μοντέλα παραγωγής εικόνας. Επιπλέον, όπως και με το Imagen 2, η εταιρεία χρησιμοποιεί το SynthID, το εργαλείο της Google για την υδατογράφηση εικόνων που παράγονται με Tεχνητή Nοημοσύνη.
Οι αρχές σχεδιασμού της Google είναι σαφείς: Από την αρχή έως το τέλος, ο χρήστης παραμένει στον έλεγχο της δημιουργικής διαδικασίας. Εάν η αρχική εικόνα που λάβει δεν ανταποκρίνεται στις προσδοκίες του, απλά μπορεί να πει στο Gemini τι θα ήθελε να αλλάξει και αυτό θα του προσφέρει μια νέα εικόνα.
Τις επόμενες ημέρες, η εταιρεία θα ξεκινήσει επίσης το λανσάρισμα της παραγωγής εικόνων με ανθρώπους, με μια έκδοση πρώιμης πρόσβασης (early access version) για τους χρήστες των Gemini Advanced, Business και Enterprise, ξεκινώντας από την αγγλική γλώσσα. Η Google έχει μεριμνήσει ώστε να γίνουν τεχνικές βελτιώσεις, αξιολογήσεις και ασκήσεις red-teaming στο προϊόν, ενώ κάνει σαφείς τις αρχές του προϊόντος.
Με το Imagen 3, έχει σημειωθεί σημαντική πρόοδος στην παροχή καλύτερης εμπειρίας για τον χρήστη κατά τη δημιουργία εικόνων ανθρώπων. Η Google δεν υποστηρίζει τη δημιουργία φωτορεαλιστικών, αναγνωρίσιμων ατόμων, απεικονίσεις ανηλίκων ή υπερβολικά αιματηρών, βίαιων ή σεξουαλικών σκηνών. Φυσικά, δεν θα είναι τέλειες όλες οι εικόνες που δημιουργεί το Gemini, αλλά η εταιρεία θα συνεχίσει να ακούει τα σχόλια των χρηστών με πρώιμη πρόσβαση στο Gemini Advanced, για να συνεχίζει να βελτιώνεται. Οι νέες αυτές δυνατότητες θα γίνονται διαθέσιμες σταδιακά, με στόχο το μοντέλο να είναι διαθέσιμο σύντομα σε περισσότερους χρήστες και γλώσσες.