Hér að neðan gef ég einfaldan inngang að ChatGPT og áskorunum þess og svara spurningunni, getur ChatGPT umritað hljóð?
ChatGPT: Yfirlit
ChatGPT er eitt vinsælasta AI líkanið sem er notað til að búa til efni sjálfkrafa, leysa vandamál og gera margvísleg verkefni í gegnum spurninga-/svarlíkan. OpenAI er fyrirtækið á bak við ChatGPT og þeir hafa þjálfað líkanið í að hafa samskipti við menn með því að spyrja það spurninga.
Til dæmis gæti verktaki átt í vandræðum með einhvern forritunarkóða. Þeir gætu límt kóðann inn í ChatGPT og spurt spurningar eins og "Af hverju virkar þessi kóði ekki eins og búist var við?". AI líkanið myndi síðan greina spurninguna og kóðann sem gefinn er upp og svara með svari. Þetta gæti verið lausn, eða það gæti spurt viðbótarspurninga ef verktaki gaf ekki nægilegt samhengi.
Þessi tegund af samtalsferli er ótrúlega gagnlegt þar sem það skapar raunhæft fram og til baka og gerir inntakinu kleift að fá nákvæmlega það sem þeir vilja að því tilskildu að þeir geti gefið réttar upplýsingar.
Umritunarhæfileikar ChatGPT
Svo, getur ChatGPT umritað hljóð? Já! ChatGTP er með sérstaka umritunaraðgerð sem OpenAI einnig þróuð sem kallast Whisper API. Ferlið er tiltölulega einfalt:
- Opnaðu ChatGPT.
- Hladdu upp hljóðskránni þinni.
- ChatGPT mun síðan keyra það í gegnum Whisper API talgreiningaralgrímið.
- Þetta vinnur ræðuna og spýtir út textaúttaki.
- Þú getur vistað textaúttakið á ýmsum skráarsniðum.
Hljóðskráarsnið sem studd eru eins og er eru MP3, MP4, MPEG, M4A, WAV, WebMog MPGA og það styður líka úrval af úttakssniðum.
Hvað varðar tungumálastuðning styður ChatGPT nú um 50 tungumál, þar á meðal hindí, grísku, arabísku, pólsku, úrdú og svahílí til dæmis.
Nákvæmni og árangur
ChatGPT getur umbreytt hljóði í texta og það er tiltölulega nákvæmt en talgreiningin getur brugðist eftir hljóðgæðum, en þetta gildir fyrir hvaða umritunarþjónustu sem er.
Vinnslutíminn er líka tiltölulega fljótur og það er vissulega að hluta til með annarri umritunarþjónustu hvað varðar þann tíma sem það tekur að greina hljóðskrár og búa til textaúttakið
Gallar á móti annarri umritunarþjónustu
Helsti gallinn miðað við aðra umritunarþjónustu eins og Transkriptor er námsferillinn. ChatGPT er sérfræðingur AI líkani og það hefur mun brattari námsferil miðað við eitthvað ótrúlega auðvelt í notkun eins og Transkriptor, sjá Transkriptor vs Microsoft Copilot .
Helst verður þú að hafa skilning á því hvernig AI líkanið virkar og getu þess, en einnig spurninga- og svarsniðið. Þetta þýðir að það hentar betur fagfólki og þeim sem hafa einhverja fyrri þekkingu á AI gerðum eða þeim sem hafa notað ChatGPT áður.
Til að bæta gæði hljóðuppskriftarinnar þarftu að spyrja spurninga til Whisper API líkansins sem krefst einnig viðbótarnáms. Þegar þú hefur vanist því hvernig það virkar og hvers konar spurningar þú átt að spyrja verður það leiðandi, en ef þú vilt skjóta, vandaða uppskrift er ChatGPT ekki besti kosturinn sem völ er á eins og er.
Í samanburði við hefðbundna hljóð-í-texta umritunarþjónustu á netinu er ChatGPT takmarkað hvað varðar tungumál, talgreiningu og inntaks-/úttaksskrár, sem gerir sérstaka umritunarþjónustu að áreiðanlegra vali, sérstaklega þegar hugað er að auknum ávinningi umritunarþjónustu fyrir SEO , sem eykur leitarhæfni efnisins þíns og viðveru á netinu. Eins og er getur það einfaldlega ekki borið saman á sambærilegum grundvelli við sérstaka umritunarþjónustu og það hefur minna upp á að bjóða.
Að lokum er stór galli hámarks hljóðskráarstærðarmörk sem eru 25MB. Lengri uppskriftir af hlutum eins og viðtölum og fundum geta auðveldlega farið yfir þetta hvað varðar skráarstærð svo þú ert takmarkaður í hvaða tegundum hljóðs þú getur umritað. Þú gætir notað hljóðþjöppunarþjónustu til að minnka skráarstærð lengri funda til dæmis, en það gæti dregið úr hljóðgæðum og leitt til lakari umritunar.
ChatGPT getur umritað hljóð en með takmörkunum
Til að svara upprunalegu spurningunni, getur ChatGPT umritað hljóð? Já það getur það, en það er alls ekki fáguð þjónusta og í núverandi endurtekningu eru ýmsir gallar. Brattari námsferillinn og þörfin á að skilja Q&A líkanið af Whisper API þýðir að það getur verið hægara ferli að fá vandaða hljóð-í-texta umritun.
Að auki er enn verið að þróa AI líkanið þannig að miðað við hefðbundna umritunarþjónustu getur það ekki borið saman hvað varðar eiginleika, nákvæmni og tungumálastuðning. 25MB hljóðskráarstærðarmörkin eru líka eitthvað sem þarf að hafa í huga og geta verið takmarkandi ef þú ert með stærri hljóðskrár til að umrita.
Þetta gæti allt breyst í framtíðinni og með tímanum gæti ChatGPT orðið ein af leiðandi umritunarþjónustum hljóð-í-texta. Hins vegar, eins og staðan er, er betri kosturinn að nota sérstaka umritunarþjónustu sem hefur sannað afrekaskrá.