Hér að neðan gef ég einfalda kynningu á ChatGPT og áskorunum þess og svara spurningunni, getur ChatGPT umritað hljóð?
ChatGPT: Yfirlit
ChatGPT er ein vinsælasta AI gerðin sem er notuð til að búa sjálfkrafa til efni, leysa vandamál og vinna margvísleg verkefni með spurningu / svarlíkani. OpenAI er fyrirtækið á bak við ChatGPT og þeir hafa þjálfað líkanið til að hafa samskipti við menn með því að spyrja það spurninga.
Til dæmis gæti verktaki átt í vandræðum með einhvern forritunarkóða. Þeir gætu límt kóðann inn í ChatGPT og spurt spurningar eins og "Hvers vegna virkar þessi kóði ekki eins og búist var við?". AI líkanið myndi síðan greina spurninguna og kóðann sem gefinn er upp og svara með svari. Þetta gæti verið lausn, eða það gæti spurt viðbótarspurninga ef verktaki veitti ekki nóg samhengi.
Þessi tegund af samtalsferli er ótrúlega gagnlegt þar sem það skapar raunhæft fram og til baka og gerir inntakinu kleift að fá nákvæmlega það sem þeir vilja að því tilskildu að þeir geti gefið réttar upplýsingar.
Umritunarhæfileikar ChatGPT
Svo, getur ChatGPT umritað hljóð? Já! ChatGTP er með sérstaka umritunaraðgerð sem OpenAI einnig þróað sem kallast Whisper API . Ferlið er tiltölulega einfalt:
- Opnaðu ChatGPT.
- Hladdu upp hljóðskránni þinni.
- ChatGPT mun síðan keyra það í gegnum Whisper API talgreiningaralgrímið.
- Þetta vinnur úr ræðunni og spýtir út textaúttaki.
- Þú getur vistað textaúttakið á ýmsum skráarsniðum.
Hljóðskráarsnið sem studd eru eru MP3, MP4, MPEG, M4A, WAV, WebMog MPGA og það styður einnig ýmis framleiðslusnið.
Hvað varðar tungumálastuðning styður ChatGPT nú um 50 tungumál, þar á meðal hindí, grísku, arabísku, pólsku, úrdú og svahílí til dæmis.
Nákvæmni og frammistaða
ChatGPT getur umbreytt hljóði í texta og það er tiltölulega nákvæmt en talgreiningin getur breyst eftir hljóðgæðum, en þetta gildir um hvaða umritunarþjónustu sem er.
Vinnslutíminn er tiltölulega fljótur líka og hann er vissulega hluti af annarri umritunarþjónustu hvað varðar þann tíma sem það tekur að greina hljóðskrár og búa til textaúttakið
Gallar vs önnur umritunarþjónusta
Helsti gallinn miðað við aðra umritunarþjónustu eins og Transkriptor er námsferillinn. ChatGPT er sérfræðingur AI líkan og það hefur miklu brattari námsferil miðað við eitthvað ótrúlega auðvelt í notkun eins og Transkriptor.
Helst verður þú að hafa skilning á því hvernig AI líkanið virkar og getu þess, en einnig spurninga- og svarsniðið. Þetta þýðir að það hentar betur fagfólki og þeim sem hafa einhverja fyrri þekkingu á AI módelum eða þeim sem hafa notað ChatGPT áður.
Til að bæta gæði hljóðuppskriftarinnar þarftu að spyrja spurninga í Whisper API líkanið sem krefst einnig viðbótarnáms. Þegar þú hefur vanist því hvernig það virkar og hvers konar spurninga þarf að spyrja verður það leiðandi, en ef þú vilt skjóta, vandaða uppskrift er ChatGPT ekki besti kosturinn sem völ er á eins og er.
Í samanburði við hefðbundna hljóð-til-texta umritunarþjónustu á netinu er ChatGPT takmörkuð hvað varðar tungumál, flækjustig talgreiningar og inntaks-/úttaksskrár. Eins og er getur það einfaldlega ekki borið saman á svipuðum grundvelli við sérstaka umritunarþjónustu og það hefur minna að bjóða.
Loksins, a majór galli er the hámark hljómflutnings- skrá stærð takmörk hver er 25MB. Lengri uppskriftir af hlutum eins og viðtölum og fundum geta auðveldlega farið yfir þetta hvað varðar skráarstærð, svo þú ert takmarkaður í hvaða tegundir hljóðs þú getur afritað. Þú gætir til dæmis notað hljóðþjöppunarþjónustu til að minnka skráarstærð lengri funda, en það gæti dregið úr hljóðgæðum og leitt til lakari gæða umritunar.
ChatGPT getur afritað hljóð en með takmörkunum
Til að svara upprunalegu spurningunni, getur ChatGPT umritað hljóð? Já það getur það, en það er alls ekki fáguð þjónusta og í núverandi endurtekningu hennar eru ýmsir gallar. Brattari námsferillinn og þörfin fyrir að skilja Q & A líkanið af Whisper API þýðir að það getur verið hægara ferli að fá góða hljóð-til-texta umritun.
Að auki er AI líkanið enn í þróun þannig að miðað við hefðbundna umritunarþjónustu getur það ekki borið saman hvað varðar eiginleika, nákvæmni og tungumálastuðning. 25MB hljóðskráarmörkin eru líka eitthvað sem þarf að hafa í huga og geta verið takmarkandi ef þú ert með stærri hljóðskrár til að afrita.
Þetta gæti allt breyst í framtíðinni og með tímanum gæti ChatGPT orðið ein leiðandi hljóð-til-texta umritunarþjónusta. Hins vegar, eins og staðan er, er betri kosturinn að nota sérstaka umritunarþjónustu sem hefur sannað afrekaskrá.