Ci-dessous, je donne une introduction simple à ChatGPT et à ses défis, et je réponds à la question, puis- ChatGPT transcrire de l’audio ?
ChatGPT: Vue d’ensemble
ChatGPT s’agit de l’un des modèles de AI les plus populaires qui est utilisé pour générer automatiquement du contenu, résoudre des problèmes et effectuer une variété de tâches via un modèle de questions/réponses. OpenAI 'est l’entreprise derrière ChatGPT et ils ont entraîné le modèle à interagir avec les humains en lui posant des questions.
Par exemple, un développeur peut avoir un problème avec du code de programmation. Ils peuvent coller le code dans ChatGPT et poser une question comme « Pourquoi ce code ne fonctionne-t-il pas comme prévu ? ». Le modèle AI analyserait ensuite la question et le code fournis et répondrait par une réponse. Il peut s’agir d’une solution, ou d’une question supplémentaire si le développeur n’a pas fourni suffisamment de contexte.
Ce type de processus conversationnel est incroyablement utile car il crée un va-et-vient réaliste et permet à l’entrée d’obtenir exactement ce qu’elle veut, à condition qu’elle puisse donner les bonnes informations.
ChatGPTCapacités de transcription
Alors, puis-ChatGPT transcrire de l’audio ? Oui! ChatGTP dispose d’une fonction de transcription dédiée qui OpenAI également développée appelée Whisper API . Le processus est relativement simple :
- Ouvrez ChatGPT.
- Téléchargez votre fichier audio.
- ChatGPT l’exécutera ensuite par l’algorithme de reconnaissance vocale Whisper API .
- Cela permet de traiter la parole et de cracher une sortie texte.
- Vous pouvez enregistrer la sortie texte dans une variété de formats de fichiers.
Les formats de fichiers audio actuellement pris en charge incluent MP3, MP4, MPEG, M4A, WAV, WebMet MPGA, et il prend également en charge une gamme de formats de sortie.
En termes de prise en charge linguistique, ChatGPT prend actuellement en charge environ 50 langues, dont l’hindi, le grec, l’arabe, le polonais, l’ourdou et le swahili par exemple.
Précision et performance
ChatGPT pouvez convertir l’audio en texte et c’est relativement précis, mais la reconnaissance vocale peut faiblir en fonction de la qualité audio, mais cela vaut pour tout service de transcription.
Le temps de traitement est également relativement rapide et il est certainement comparable à celui d’autres services de transcription en termes de temps nécessaire à l’analyse des fichiers audio et à la génération de la sortie texte
Inconvénients par rapport aux autres services de transcription
Le principal inconvénient par rapport à d’autres services de transcription tels que Transkriptor est la courbe d’apprentissage. ChatGPT 'est un modèle de AI spécialisé et il a une courbe d’apprentissage beaucoup plus raide par rapport à quelque chose d’incroyablement facile à utiliser comme Transkriptor.
Idéalement, vous devez comprendre le fonctionnement du modèle AI et ses capacités, mais aussi le format des questions et réponses. Cela signifie qu’il est mieux adapté aux professionnels et à ceux qui ont une certaine connaissance préalable des modèles AI ou à ceux qui ChatGPT ont déjà utilisé.
Pour améliorer la qualité de la transcription audio, vous devez poser des questions au modèle Whisper API , ce qui nécessite également un apprentissage supplémentaire. Une fois que vous vous êtes habitué à son fonctionnement et aux types de questions à poser, cela devient intuitif, mais si vous voulez une transcription rapide et de qualité, ChatGPT n’est actuellement pas la meilleure option disponible.
Par rapport aux services traditionnels de transcription audio-texte en ligne, ChatGPT est limité en termes de langues, de complexité de reconnaissance vocale et de fichiers d’entrée/sortie. À l’heure actuelle, il ne peut tout simplement pas être comparé à l’identique avec des services de transcription dédiés et il a moins à offrir.
Enfin, un inconvénient majeur est la limite de taille maximale des fichiers audio qui est de 25 Mo. Les transcriptions plus longues d’éléments tels que les entretiens et les réunions peuvent facilement dépasser cela en termes de taille de fichier, de sorte que vous êtes limité dans les types d’audio que vous pouvez transcrire. Vous pouvez utiliser un service de compression audio pour réduire la taille du fichier lors de réunions plus longues, par exemple, mais cela pourrait réduire la qualité audio et entraîner une transcription de moins bonne qualité.
ChatGPT peut transcrire l’audio, mais avec des limitations
Pour répondre à la question initiale, puis- ChatGPT transcrire de l’audio ? Oui, c’est possible, mais ce n’est en aucun cas un service raffiné, et dans son itération actuelle, il y a une série d’inconvénients. La courbe d’apprentissage plus raide et la nécessité de comprendre le modèle Q&R de Whisper API signifient que l’obtention d’une transcription audio-texte de qualité peut être un processus plus lent.
De plus, le modèle AI est encore en cours de développement, de sorte que, comparé aux services de transcription traditionnels, il ne peut pas être comparé en termes de fonctionnalités, de précision et de prise en charge linguistique. La limite de taille des fichiers audio de 25 Mo est également un élément à prendre en compte et peut être limitative si vous avez des fichiers audio plus volumineux à transcrire.
Tout cela pourrait changer à l’avenir et, au fil du temps, ChatGPT pourrait devenir l’un des principaux services de transcription audio-texte. Cependant, dans l’état actuel des choses, l’utilisation d’un service de transcription dédié qui a fait ses preuves est la meilleure option.