Di bawah, saya memberikan pengenalan ringkas kepada ChatGPT dan cabarannya, dan menjawab soalan, bolehkah ChatGPT menyalin audio?
ChatGPT: Gambaran Keseluruhan
ChatGPT ialah salah satu model AI paling popular yang digunakan untuk menjana kandungan secara automatik, menyelesaikan masalah dan melakukan pelbagai tugas melalui model soal/jawab. OpenAI ialah syarikat di sebalik ChatGPT dan mereka telah melatih model untuk berinteraksi dengan manusia dengan bertanya soalan.
Sebagai contoh, pembangun mungkin mempunyai masalah dengan beberapa kod pengaturcaraan. Mereka boleh menampal kod ke dalam ChatGPT dan bertanya soalan seperti "Mengapa kod ini tidak berfungsi seperti yang diharapkan?". Model AI kemudiannya akan menganalisis soalan dan kod yang disediakan dan membalas dengan jawapan. Ini boleh menjadi penyelesaian, atau ia boleh mengemukakan soalan tambahan jika pembangun tidak menyediakan konteks yang mencukupi.
Proses perbualan jenis ini sangat berguna kerana ia mewujudkan bolak-balik yang realistik dan membolehkan input mendapatkan apa yang mereka mahukan dengan syarat mereka boleh memberikan maklumat yang betul.
Kebolehan Transkripsi ChatGPT
Jadi, bolehkah ChatGPT menyalin audio? Ya! ChatGTP mempunyai fungsi transkripsi khusus yang juga OpenAI dibangunkan dipanggil Whisper API. Prosesnya agak mudah:
- Buka ChatGPT.
- Muat naik fail audio anda.
- ChatGPT kemudiannya akan menjalankannya melalui algoritma pengecaman pertuturan Whisper API .
- Ini memproses pertuturan dan mengeluarkan output teks.
- Anda boleh menyimpan output teks dalam pelbagai format fail.
Format fail audio yang disokong pada masa ini termasuk MP3, MP4, MPEG, M4A, WAV, WebMdan MPGA dan ia juga menyokong pelbagai format output.
Dari segi sokongan bahasa, ChatGPT kini menyokong kira-kira 50 bahasa termasuk Hindi, Yunani, Arab, Poland, Urdu dan Swahili sebagai contoh.
Ketepatan dan Prestasi
ChatGPT boleh menukar audio kepada teks dan ia agak tepat tetapi pengecaman pertuturan boleh goyah bergantung pada kualiti audio, tetapi ini berlaku untuk mana-mana perkhidmatan transkripsi.
Masa pemprosesan juga agak cepat dan ia pastinya sebahagiannya dengan perkhidmatan transkripsi lain dari segi masa yang diperlukan untuk menganalisis fail audio dan menjana output teks
Kelemahan vs Perkhidmatan Transkripsi Lain
Kelemahan utama berbanding perkhidmatan transkripsi lain seperti Transkriptor ialah keluk pembelajaran. ChatGPT ialah model AI pakar dan ia mempunyai keluk pembelajaran yang lebih curam berbanding dengan sesuatu yang sangat mudah digunakan seperti Transkriptor, lihat Transkriptor lwn Microsoft Copilot .
Sebaik-baiknya, anda perlu mempunyai pemahaman tentang cara model AI berfungsi dan keupayaannya, tetapi juga format soal jawab. Ini bermakna ia lebih sesuai untuk profesional dan mereka yang mempunyai pengetahuan awal tentang model AI atau mereka yang pernah menggunakan ChatGPT sebelum ini.
Untuk meningkatkan kualiti transkripsi audio, anda perlu bertanya soalan kepada model Whisper API yang juga memerlukan pembelajaran tambahan. Sebaik sahaja anda membiasakan diri dengan cara ia berfungsi dan jenis soalan untuk ditanya, ia menjadi intuitif, tetapi jika anda mahukan transkripsi yang cepat dan berkualiti, ChatGPT bukanlah pilihan terbaik yang tersedia pada masa ini.
Berbanding dengan perkhidmatan transkripsi audio-ke-teks dalam talian tradisional, ChatGPT terhad dari segi bahasa, kerumitan pengecaman pertuturan dan fail input/output, yang menjadikan perkhidmatan transkripsi khusus pilihan yang lebih dipercayai, terutamanya apabila mempertimbangkan faedah tambahan perkhidmatan transkripsi untuk SEO , meningkatkan kebolehcarian kandungan anda dan kehadiran dalam talian. Pada masa ini, ia tidak boleh dibandingkan secara serupa dengan perkhidmatan transkripsi khusus dan ia mempunyai lebih sedikit untuk ditawarkan.
Akhir sekali, kelemahan utama ialah had saiz fail audio maksimum iaitu 25MB. Transkripsi yang lebih panjang bagi perkara seperti temu bual dan mesyuarat boleh melebihi ini dengan mudah dari segi saiz fail supaya anda terhad dalam jenis audio yang boleh anda transkripsi. Anda boleh menggunakan perkhidmatan pemampatan audio untuk mengurangkan saiz fail mesyuarat yang lebih panjang sebagai contoh, tetapi ini boleh mengurangkan kualiti audio dan mengakibatkan transkripsi berkualiti rendah.
ChatGPT Boleh Mentranskripsi Audio Tetapi Dengan Had
Untuk menjawab soalan asal, bolehkah ChatGPT menyalin audio? Ya ia boleh, tetapi ia sama sekali bukan perkhidmatan yang digilap, dan dalam lelaran semasanya terdapat pelbagai kelemahan. Keluk pembelajaran yang lebih curam dan keperluan untuk memahami model Soal Jawab Whisper API bermakna mendapatkan transkripsi audio-ke-teks yang berkualiti boleh menjadi proses yang lebih perlahan.
Selain itu, model AI masih dibangunkan jadi berbanding dengan perkhidmatan transkripsi tradisional, ia tidak boleh dibandingkan dari segi ciri, ketepatan dan sokongan bahasa. Had saiz fail audio 25MB juga perlu dipertimbangkan dan boleh mengehadkan jika anda mempunyai fail audio yang lebih besar untuk ditranskripsi.
Ini semua boleh berubah pada masa hadapan dan dari masa ke masa ChatGPT boleh menjadi salah satu perkhidmatan transkripsi audio-ke-teks yang terkemuka. Walau bagaimanapun, seperti sedia ada, menggunakan perkhidmatan transkripsi khusus yang mempunyai rekod prestasi yang terbukti adalah pilihan yang lebih baik.