Подолу, јас давам едноставен интро за ChatGPT и неговите предизвици, и одговори на прашањето, може ли ChatGPT транскрибира аудио?
ChatGPT: Преглед
ChatGPT е еден од најпопуларните AI модели кои се користат за автоматско генерирање на содржини, решавање на проблеми и извршување на најразлични задачи преку модел на прашање/одговор. OpenAI е компанијата која стои зад ChatGPT и тие го обучуваат моделот за интеракција со луѓето со поставување прашања.
На пример, некој програмер може да има проблем со некој програмски код. Тие би можеле да го стават кодот во ChatGPT и да поставам прашање како "Зошто овој код не функционира според очекуваното?". Потоа AI модел ќе го анализира прашањето и кодот обезбедени и ќе одговори со одговор. Ова би можело да биде решение, или би можело да постави дополнителни прашања ако програмерот не обезбеди доволно контекст.
Овој тип на разговорен процес е неверојатно корисен бидејќи создава реалистичен назад и назад и овозможува влезот да го добие токму она што го сакаат обезбедувајќи може да даде вистинска инфо.
ChatGPTтранскрипциски способности
Па , може ли ChatGPT препиша аудио? Да! ChatGTP има наменска транскрипциска функција која OpenAI развила и наречена Whisper API . Процесот е релативно едноставен:
- Отвори ChatGPT.
- Качете го вашиот аудио фајл.
- ChatGPT тогаш ќе го помине низ алгоритамот за препознавање API говор.
- Ова го обработува говорот и плука излез на текст.
- Можете да го зачувате излезот на текст во најразлични датотечни формати.
Аудио датотечни формати поддржани моментално вклучуваат MP3, MP4, MPEG, M4A, WAV, WebM, и MPGA и тој поддржува опсег на излезни формати исто така.
Во однос на јазичната поддршка, ChatGPT моментно поддржува околу 50 јазици вклучувајќи ги хиндите, грчките, арапските, полските, урду и свахилите на пример.
Точност и перформанси
ChatGPT може да го конвертира аудиото во текст и тоа е релативно точно, но препознавањето на говорот може да се поколеба во зависност од квалитетот на аудиото, но ова важи за било која транскрипциска услуга.
Времето за обработка е релативно брзо и сигурно е делумно со други транскрипциски сервиси во однос на времето потребно за да се анализираат аудио датотеките и да се генерира излезот на текст
Недостатоци против други услуги за транскрипција
Главниот недостаток во споредба со другите транскрипциски услуги како Transkriptor е кривата на учење. ChatGPT е специјалист AI модел и има многу поостра крива на учење во споредба со нешто неверојатно лесно за користење како Transkriptor.
Идеално, мора да имате разбирање за тоа како функционира AI модел и неговите можности, но и форматот на прашањето и одговорот. Ова значи дека е подобро одговара за професионалци и оние со некои претходни познавања за AI модели или оние кои користеле ChatGPT претходно.
За да го подобрите квалитетот на аудио транскрипцијата морате да поставувате прашања до моделот Whisper API кој исто така зема дополнително учење. Откако ќе се навикнете на тоа како функционира и видовите прашања кои треба да ги поставите, станува интуитивен, но ако сакате брза, квалитетна транскрипција, ChatGPT моментално не е најдобрата опција на располагање.
Во споредба со традиционалните онлајн услуги за транскрипција на аудио-текст, ChatGPT е ограничена во однос на јазиците, комплексноста на препознавање на говор и влезните/излезните датотеки. Во моментов, едноставно не може да се спореди на слична основа со наменски транскрипциски услуги и има помалку да понуди.
На крајот, голем недостаток е максималната граница на големината на аудио датотеката која е 25MB. Подолги транскрипции на нешта како интервјуа и состаноци можат лесно да го надминат ова во однос на големината на датотеките, така што сте ограничени во кои видови на аудио можете да транскрибирате. Може да користите услуга за аудио компресија за да ја намалите големината на датотеките на подолги состаноци на пример, но ова би можело да го намали квалитетот на аудиото и да резултира со транскрипција со полош квалитет.
ChatGPT може да транскрибира аудио но со ограничувања
За да одговорите на оригиналното прашање, може ли ChatGPT транскрибирате аудио? Да тоа може, но тоа никако не е полиран сервис, и во нејзината сегашна итерација има низа недостатоци. Потомната крива на учење и потребата за разбирање на Q&A моделот на Whisper API значи добивање на квалитетна транскрипција од аудио до текст може да биде побавен процес.
Дополнително, AI модел сé уште се развива така во споредба со традиционалните транскрипциски услуги, не може да се спореди во однос на карактеристиките, точноста и јазичната поддршка. 25MB лимитот за големина на аудио датотеки е нешто што треба да се разгледа и може да биде ограничувачки ако имате поголеми аудио датотеки за транскрипција.
Сето ова би можело да се промени во иднината и со текот на времето ChatGPT би можело да стане една од водечките сервиси за транскрипција од аудио-текст. Меѓутоа, како што стои, користејќи наменски транскрипциски сервис кој има докажан рекорд е подобра опција.