OpenAI przenosi wideo do zaawansowanego trybu głosowego ChatGPT

OpenAI poczyniło ostatnio znaczny postęp w ulepszaniu możliwości ChatGPT, wprowadzając funkcje wejścia wideo i udostępniania ekranu do zaawansowanego trybu głosowego. To ogłoszenie było częścią trwającej kampanii OpenAI „12 dni OpenAI„, którego celem jest zaprezentowanie nowych funkcji i ulepszeń produktów AI.

Kluczowe funkcje aktualizacji

OpenAI przenosi wideo do zaawansowanego trybu głosowego ChatGPT

  • Interakcja wideo w czasie rzeczywistym: Użytkownicy mogą teraz wchodzić w interakcję z ChatGPT za pomocą wideo, dzięki czemu sztuczna inteligencja widzi i reaguje na dane wizualne w czasie rzeczywistym. Ta funkcja pozwala na bardziej dynamiczną interakcję, podczas której użytkownicy mogą skierować swoje kamery na obiekty, a ChatGPT zapewni wyjaśnienia lub informacje na ich temat. Na przykład w wersji demonstracyjnej prezes OpenAI Greg Brockman pokazał, jak ChatGPT może komentować rysunki wykonane przez Andersona Coopera, wskazując ważny krok w kierunku tworzenia bardziej ludzkich rozmów.
  • Możliwości udostępniania ekranu: Oprócz pisania wideo użytkownicy mogą udostępniać swoje ekrany za pomocą ChatGPT. Ta funkcja jest szczególnie przydatna w przypadku zadań zespołowych, w których istotny jest kontekst wizualny, takich jak rozwiązywanie problemów technicznych lub wspólne przeglądanie dokumentów. Aby uzyskać dostęp do tej funkcji, użytkownicy po prostu dotykają ikony głosowej aplikacji i wybierają z menu opcję udostępniania wideo lub ekranu
  • Dostępność: Nowe funkcje są udostępniane głównie abonentom ChatGPT Plus i Pro, z planami rozszerzenia dostępu na użytkowników edukacyjnych i biznesowych w styczniu 2025 r. Większość użytkowników w różnych krajach otrzyma te aktualizacje wkrótce, w UE, Szwajcarii, Islandii, Norwegii i Liechtensteinie mogą wystąpić opóźnienia.

Zabawny dodatek świąteczny: tryb Świętego Mikołaja

OpenAI przenosi wideo do zaawansowanego trybu głosowego ChatGPT

W świątecznym wydaniu OpenAI wprowadziło także tryb Świętego Mikołaja, zmieniając kulę głosową ChatGPT w śnieżną kulę i umożliwiając użytkownikom interakcję z świąteczną wersją sztucznej inteligencji. Ta funkcja jest dostępna na całym świecie do początku stycznia 2025 r. i dodaje zabawny element interakcjom użytkowników w okresie świątecznym.

Integracja udostępniania wideo i ekranu z zaawansowanym trybem głosowym ChatGPT stanowi kluczowy moment w technologii interakcji AI. Umożliwiając użytkownikom komunikację zarówno za pomocą języka mówionego, jak i sygnałów wizualnych, OpenAI poprawia użyteczność i wszechstronność swojego chatbota. W miarę ciągłego wdrażania tych funkcji otwierają one nowe możliwości kreatywności, rozwiązywania problemów i codziennego wsparcia dla użytkowników z różnych branż.

 

Autor

  • Boogie Beckmana

    Witaj w moim świecie, w którym ja, Boogie Backman, przewodzim jako dyrektor generalny ChatGPT Francais i ChatGPTXOnline. Posiadając długą i stymulującą ścieżkę kariery, jestem inżynierem rozwoju oprogramowania z ponad 10-letnim doświadczeniem, liderem z niezachwianą wizją i pasją.

Zostaw komentarz