Skrifaðu upp, þýddu og drógu saman á nokkrum sekúndum
Skrifaðu upp, þýddu og drógu saman á nokkrum sekúndum
Getur ChatGPT umritað hljóð?
Hér að neðan gef ég einfalda kynningu á ChatGPT og áskorunum þess, og svara spurningunni, getur ChatGPT umritað hljóð?
Kannaðu möguleika ChatGPT til að umbylta hljóðumritunarverkefnum með skilvirkni gervigreindar.

ChatGPT: Yfirlit
ChatGPT er eitt vinsælasta gervigreindarlíkanið sem notað er til að búa sjálfkrafa til efni, leysa vandamál og framkvæma ýmis verkefni í gegnum spurninga/svara módel. OpenAI er fyrirtækið á bak við ChatGPT og þeir hafa þjálfað líkanið til að eiga samskipti við menn með því að spyrja það spurninga.
Til dæmis gæti forritari lent í vandamáli með einhvern forritunarkóða. Þeir gætu límt kóðann inn í ChatGPT og spurt spurningu eins og „Af hverju virkar þessi kóði ekki eins og búist var við?". Gervigreindarlíkanið myndi þá greina spurninguna og kóðann sem gefinn var og svara með lausn. Þetta gæti verið lausn, eða það gæti spurt viðbótarspurninga ef forritarinn gaf ekki nægar upplýsingar.
Þessi tegund af samtalsferli er ótrúlega gagnleg þar sem hún skapar raunverulegt samtal fram og til baka og gerir notandanum kleift að fá nákvæmlega það sem hann vill að því gefnu að hann geti gefið réttar upplýsingar.
Upplifðu samvirkni ChatGPT og Whisper API í þessari gagnvirku vélmennademo fyrir hljóðumritun.

Umritunarhæfileikar ChatGPT
Svo, getur ChatGPT umritað hljóð? Já! ChatGPT hefur sérstaka umritunareiginleika sem OpenAI þróaði einnig, kallaðan Whisper API. Ferlið er tiltölulega einfalt:
- Opnaðu ChatGPT.
- Hladdu upp hljóðskránni þinni.
- ChatGPT mun þá keyra hana í gegnum Whisper API raddgreiningaralgrímið.
- Þetta vinnur úr talinu og skilar texta.
- Þú getur vistað textaútkomuna í ýmsum skráarsniðum.
Hljóðskrársnið sem nú eru studd eru meðal annars MP3, MP4, MPEG, M4A, WAV, WEBM og MPGA og það styður einnig fjölbreytt úttakssnið.
Hvað varðar tungumálastuðning, styður ChatGPT nú um 50 tungumál, þar á meðal hindí, grísku, arabísku, pólsku, úrdú og svahílí til dæmis.
Nákvæmni og frammistaða
ChatGPT getur breytt hljóði í texta og er tiltölulega nákvæmt en raddgreiningin getur verið ónákvæm eftir hljóðgæðum, en þetta á við um alla umritunarþjónustu.
Vinnslutíminn er líka tiltölulega fljótur og er vissulega sambærilegur við aðra umritunarþjónustu hvað varðar þann tíma sem það tekur að greina hljóðskrár og búa til textaútkomuna.
Gallar samanborið við aðra umritunarþjónustu
Aðalgallinn samanborið við aðra umritunarþjónustu eins og Transkriptor er lærdómskúrfan. ChatGPT er sérhæft gervigreindarlíkan og það hefur mun brattari lærdómskúrfu samanborið við eitthvað ótrúlega auðvelt í notkun eins og Transkriptor, sjá Transkriptor vs Microsoft Copilot.
Helst þarftu að hafa skilning á því hvernig gervigreindarlíkanið virkar og getu þess, en einnig spurninga- og svaraformið. Þetta þýðir að það hentar betur fyrir fagfólk og þá sem hafa einhverja fyrri þekkingu á gervigreindarlíkönum eða þá sem hafa notað ChatGPT áður.
Til að bæta gæði hljóðumritunarinnar þarftu að spyrja spurninga til Whisper API líkansins sem krefst einnig viðbótarnáms. Þegar þú venst því hvernig það virkar og hvaða tegundir spurninga á að spyrja, verður það innsætt, en ef þú vilt hraða, gæða umritun, er ChatGPT ekki besti kosturinn sem er í boði eins og er.
Samanborið við hefðbundna hljóð-í-texta umritunarþjónustu á netinu, er ChatGPT takmarkað hvað varðar tungumál, flækjustig raddgreiningar og inntak/úttak skráa, sem gerir sérhæfða umritunarþjónustu að áreiðanlegri valkosti, sérstaklega þegar tekið er tillit til viðbótarkosta umritunarþjónustu fyrir SEO, sem eykur leitarhæfni efnisins og veru á netinu. Eins og er getur það einfaldlega ekki borið sig saman við sérhæfða umritunarþjónustu og hefur minna að bjóða.
Að lokum er stór galli hámarksstærð hljóðskráa sem er 25MB. Lengri umritanir á hlutum eins og viðtölum og fundum geta auðveldlega farið yfir þessi mörk hvað varðar skráarstærð, svo þú ert takmarkaður í því hvaða tegundir hljóðs þú getur umritað. Þú gætir notað hljóðþjöppunarþjónustu til að minnka skráarstærð lengri funda til dæmis, en þetta gæti dregið úr hljóðgæðum og leitt til lakari gæða umritunar.
Sjáðu fyrir þér hæfni gervigreindar í að umbreyta töluðum orðum í skriflegan texta með þróaðri hljóðumritun.

ChatGPT getur umritað hljóð en með takmörkunum
Til að svara upphaflegu spurningunni, getur ChatGPT umritað hljóð? Já, það getur það, en það er alls ekki fullkomin þjónusta, og í núverandi mynd eru ýmsar takmarkanir. Brattari lærdómskúrfan og þörfin á að skilja spurninga- og svaralíkan Whisper API þýðir að það að fá gæða hljóð-í-texta umritun getur verið hægara ferli.
Að auki er gervigreindarlíkanið enn í þróun, svo samanborið við hefðbundna umritunarþjónustu getur það ekki borið sig saman hvað varðar eiginleika, nákvæmni og tungumálastuðning. 25MB takmörk á stærð hljóðskráa er líka eitthvað til að hafa í huga og getur verið takmarkandi ef þú ert með stærri hljóðskrár til að umrita.
Þetta gæti allt breyst í framtíðinni og með tímanum gæti ChatGPT orðið ein af leiðandi hljóð-í-texta umritunarþjónustum. Hins vegar, eins og staðan er núna, er betri kostur að nota sérhæfða umritunarþjónustu sem hefur sannað sig.