OpenAI Memperkenalkan Kemampuan ChatGPT Baru : Melihat, Mendengar, dan Berbicara.
ChatGPT, yang dikembangkan oleh OpenAI, telah mengambil langkah baru yang luar biasa dalam kemajuan dunia kecerdasan buatan. Sekarang, ChatGPT tidak hanya dapat berkomunikasi melalui teks tetapi juga dapat mendengar, berbicara, dan mengenali gambar.
Pada hari Selasa, OpenAI membuat pengumuman resmi di situs web mereka yang memperkenalkan kemampuan baru untuk memasukkan gambar dan suara ke dalam ChatGPT. Kemampuan ini menambah antarmuka yang lebih mudah digunakan, memungkinkan pengguna berinteraksi dengan ChatGPT melalui percakapan suara atau dengan membagikan gambar.
Pengguna memiliki lebih banyak cara untuk menggunakan ChatGPT dalam kehidupan sehari-hari berkat kemampuan suara dan gambar ini. Misalnya, pengguna dapat mengambil foto isi dapur dan kulkas mereka, lalu bertanya kepada ChatGPT tentang resep atau menu makan malam yang mungkin mereka buat. Setelah makan malam, mereka bahkan dapat membantu anak-anak dengan tugas matematika mereka dengan mengambil foto soal-soalnya, melingkari yang diinginkan, dan meminta ChatGPT memberikan petunjuk tentang cara menyelesaikannya.
Selain itu, pengguna sekarang memiliki kemampuan untuk berkomunikasi secara verbal dengan ChatGPT dalam berbagai situasi, seperti berbicara saat bepergian, meminta cerita pengantar tidur untuk keluarga, atau bahkan menyelesaikan perdebatan di meja makan.
Untuk memulai interaksi dengan suara, pengguna hanya perlu membuka aplikasi seluler dan memilih “Fitur Baru”. Di sana, mereka akan melihat lima suara berbeda, yang dapat dipilih sesuai keinginan.
Model teks-ke-suara yang baru memungkinkan OpenAI bekerja sama dengan profesional pengisi suara untuk menghasilkan setiap suara, dan mereka juga dapat mengonversi ucapan menjadi teks dengan menggunakan sistem pengenalan ucapan terbuka mereka, Whisper.
ChatGPT dapat berinteraksi dengan gambar dan suara. ChatGPT memahami gambar dengan bantuan multimodal GPT-3.5 dan GPT-4, yang memungkinkannya untuk melakukan penalaran bahasa pada berbagai jenis gambar, seperti tangkapan layar, foto, dan dokumen yang mengandung teks dan gambar. Pengguna dapat mengambil atau memilih gambar dengan menekan tombol foto dan kemudian berbicara atau berbicara tentang gambar tersebut.
OpenAI mengakui bahwa mereka telah mengambil langkah-langkah teknis untuk melindungi privasi individu dengan membatasi kemampuan ChatGPT untuk menganalisis dan membuat pernyataan langsung tentang orang tertentu.
Gambar akan tersedia di semua platform, tetapi kemampuan suara akan tersedia di Android dan iOS. Selama dua minggu ke depan, kemampuan ini akan diberikan kepada pengguna Plus dan perusahaan oleh OpenAI, membuka era baru dalam interaksi manusia dengan kecerdasan buatan.