Korvaus Horoskooppimerkistä
Varallisuus C Kuuluisuudet

Selvitä Yhteensopivuus Horoskooppimerkistä

Parhaat automaattiset tekstinkirjoitustyökalut toimittajille

Tekniikka Ja Työkalut

Siri täytti juuri kuusi vuotta. Alexa täytti juuri kolme. Jos voimme kysyä puhelimiltamme Albuquerquen säätä ja pakottaa olohuoneemme muovisylinterin lukemaan Washington Postia ääneen, miksi kirjoitamme edelleen haastatteluja käsin?

No, käy ilmi, että meidän ei todellakaan tarvitse. Automaattiset transkriptiotyökalut ovat olleet markkinoilla jo jonkin aikaa, ja ne ovat vihdoinkin alkamassa. Äänen tai videon lataaminen sivustolle ja melko kattavan tekstin saaminen vie nyt vain muutaman minuutin ja muutaman dollarin.

Mutta kuten kaikki työkalut, jotkut ovat parempia kuin toiset. Testasimme (tai yritimme testata - siitä lisää myöhemmin) kahdeksan suosituinta toimittajille suunnattua transkriptiotyökalua, mukaan lukien Lohikäärmeen sanelu , Onnellinen kirjanoppinut , oLitteroi , ennätyksellisesti , Rev , Sonix , Trint ja YouTube. Käytimme jokaista työkalua useiden tosielämän skenaarioiden läpi ja kokeilimme, kuinka kukin niistä pärjäsi toimittajan tyypilliseen käyttöön.

Vaikka mikään työkaluista ei ollut täydellinen, yksi syrjäytti muut luokan parhaana.

Meidän valintamme
Tarkkuuden, ominaisuuksien ja helppokäyttöisyyden yhdistelmä tekee Trintistä parhaan vaihtoehdon toimittajien automaattiseen transkriptioon. Vaikka se ei ollutkaan tarkin, rikkain tai halvin työkalu, jota kokeilimme, sen tekstien muokkaustyökalut ja kyky sovittaa hieman saumattomasti toimittajan työnkulkuun auttavat sitä nousemaan kilpailijoistaan. Lue lisää miksi.

Koe
Kuten näet, näiden työkalujen tarkkuusaste on alhainen. Tämä johtuu siitä, että yritimme kaikkemme hämmentää heidät.

Ensinnäkin, jotta voimme heijastaa monenlaisia ​​ihmisiä, ääniä ja aksentteja, äänitimme näyteäänen neljällä osallistujalla. Niihin kuuluivat:

  • Alexios Mantzarlis , Poynterin tiedekunta ja International Fact-Checking Networkin johtaja, joka on kotoisin Roomasta ja kuvaili itseään pirteäksi ja 'joitakin hauskoja sanoja, joissa yhdistyvät brittiläinen, italialainen ja outo amerikkalainen aksentti'.
  • makeita kukkakimppuja , International Fact-Checking Networkin ohjelmapäällikkö, joka tuli Poynteriin Mexico Citystä syyskuussa
  • Kristen Hare , Poynterin toimittaja, jonka mielestä hän kuulostaa 'hieman laakson tyttömäiseltä', kun hän kuuntelee itseään nauhoitteilla
  • Minä, ja vaikka Kristen sanoi, että minulla on 'puhveliaksentti', uskon, että taipumukseni mutista, puhua liian nopeasti ja ohittaa sanojen osia on luultavasti haastavampaa litteroinnissa (itsensä nauhoittaminen ennakoiden, että tullaan litteroimaan, johtaa selvästi pieneen itsekkyyteen). heijastus.)

Kristen liittyi meihin Google Hangoutsin/YouTube Liven kautta ( paljastaminen: Google News Labin apuraha rahoittaa osittain asemani ), josta useimmat automaattiset transkriptiotyökalut varoittavat avoimesti. Puhelimen tai videokeskustelun ääni näyttää olevan heille yleisesti vaikea käsitellä.

Algoritmien kiduttamiseksi luimme myös kohdat paljon nopeammin kuin tavallisesti puhumme, Dulce ja Alexios puhuivat useita vieraita kieliä (italia, espanja, ranska ja kreikka), lausuimme mahdollisimman monta erisnimeä (Apalachicola) , Michael Oreskes ja useat Kreikan saaret, muutamia mainitakseni), ryhtyivät luoviksi Urban Dictionaryn (a portmanteau Paul Manafortin ja hänen oikeudellisen tilanteensa tilaa kuvaavan karkean sanan) ja keskustelivat toisistaan ​​jonkin verran.

Nauhoitimme 14 minuutin testimme Poynterin webinaaristudiossa, ja meidät keskeytti ainakin yhden kovaäänisen lentokoneen ääni (muutaman korttelin päässä on lentokenttä), hätäajoneuvo ja Kristenin puhelimen huuto.

Tallensimme äänen kolmella tavalla:

  • Kanssa Zoom H4nPro kämmenmikrofoni, asetettu väliimme
  • IPhone 6S Plus -puhelimellani, käyttämällä Recordly-sovellusta tallentamiseen, sijoitettu Zoomin viereen
  • Yksityisellä YouTube-livellä, jolla Kristen liittyi meihin

Latasimme sitten äänen jokaiseen työkaluun ja seurasimme, kuinka kauan kunkin litterointi kesti. Normalisoimme tuloksena saadut transkriptit Microsoft Wordilla, poistamalla aikaleimat ja varmistamalla, että puhujien nimet ovat yhteneviä. Kontrollina litteroin äänen itse (oTranscriben avulla) ja kuuntelin sitten useita kertoja tarkistaakseni täydellisen tarkkuuden. Kokeilimme myös Reviä, maksullista palvelua, joka käyttää ihmistranskriptoreita algoritmien sijaan, nähdäksemme, kuinka se pinoutuu.

Testasimme erilaisia ​​asiakirjojen vertailutyökaluja nähdäksemme, mikä toimi parhaiten Copyscape äänekkäimpänä vaihtoehtona. Vertasimme työkalujen ja palveluiden luomia transkriptioita 100-prosenttisesti oikeaan, jonka loin oTranscribella.

Muutama lisähuomautus:

  • Zoomin ääni osoittautui parhaaksi laaduksi, joten käytimme sitä useimmissa testeissämme. Recordly-sovellus ei näytä hyväksyvän muista lähteistä tallennettua ääntä, joten se on yksi poikkeus tästä prosessista. Emme myöskään ladanneet Zoom-ääntä YouTubeen, vaan luotimme sen sijaan YouTube Live -tallenteen ääneen. Omenoiden ja appelsiinien vertailu tekee tästä kokeesta vähemmän tieteellistä, mutta vastaa paremmin sitä, kuinka toimittajat todella käyttäisivät näitä työkaluja todellisessa maailmassa.
  • Vaikka se on suosittu työkalu, emme voineet testata Dragon Dictationia, koska se ei toimi iOS 11:ssä. Päivitämme tämän arvostelun, kun ja jos sen kehittäjä korjaa tämän ongelman.
  • Emme ottaneet yhteyttä mihinkään näistä yrityksistä ennen testausta, joten transkriptioihin ei ollut erityistä käsittelyä tai taustan viimeistelyä. Trint, Sonix ja Recordly tarjoavat rajoitettuja ilmaisia ​​minuutteja uusille käyttäjille, joten hyödynsimme niitä kokeilussa. Käytimme Happy Scribelle ei-toimittajakollegan luottokorttia, emmekä maininneet Poynteria, koska olen aiemmin ollut kirjeenvaihdossa sen perustajien kanssa. Ja maksoimme täyden hinnan Revin ihmisen transkriptiosta. YouTuben tekstityspalvelu ja oTranscribe ovat aina ilmaisia.
  • On monia, monia muita automaattisia transkriptiotyökaluja, joita emme sisällyttäneet tähän arvosteluun. Yritimme keskittyä niihin, joista toimittajat ovat kysyneet meiltä. Jos uskot, että ohitimme yhden epäoikeudenmukaisesti, ilmoita siitä meille, niin päivitämme arvostelun.

Transkription laatu (voittaja: Happy Scribe)

Tarkkuuskaavio

Vaikuttaa siltä, ​​että tekoälyn kapinasta huolissaan olevilla ihmisillä on vielä ainakin muutama vuosi valmistautua, sillä yksi testaamamme ihmistranskriptiopalvelu päihitti automaattiset transkriptiot reilusti.

Rev ansaitsi 82 ​​prosentin tarkkuusluokituksen, kun ihmiskääntäjä ei useimmiten pystynyt saamaan kiinni vieraista kielistä (joka on rehellisyyden nimissä erillinen palvelu), muutamaa oikeaa substantiivia, ylikuulumista, muutamia slangisanoja ja muminan palasia. Vaikka muissakin työkaluissa nämä asiat enimmäkseen puuttuivat, Revin ihmiskirjoittajat huomasivat ainakin asiat, kuten '[ei kuulu]' ja '[ristipiippi]' ja '[vieras kieli]', jotka olivat hyödyllisiä paikkamerkkejä myöhempiä korjauksia varten.

Jopa puuttuvien bittien kanssa Rev-transkriptio on täysin luettavissa ja johdonmukainen. Jos et ollut paikalla alustavassa keskustelussa, voit saada ytimen siitä, mistä puhuimme, vain lukemalla sen.

Seuraavaksi tarkin transkriptio oli YouTube. Videon isännöintisivusto loi automaattisesti YouTube-suoralle videollemme tekstitykset, jotka olivat 72 prosentin tarkkuudella. Mutta vaikka kokonaislaatu heikkenisi vain 10 prosenttia, transkriptio on huomattavasti huonommin luettavissa kuin Rev:n, koska YouTube ei sisällä välimerkkejä tai puhujien segmentointia. Kuvatekstit ovat massiivisena tekstilohkona. Ilman sitä pariliitosta äänen kanssa jonkun, joka ei ollut mukana keskustelussa, olisi lähes mahdotonta ymmärtää keskusteluamme.

YouTuben tarjonnassa on muitakin huonoja puolia, mutta puhumme niistä, kun käsittelemme ominaisuuksia.

Happy Scribe osoittautui tarkimmaksi ei-ihmisille tarkoitetuksi transkriptiotyökaluksi 62 prosentin tarkkuudella kokeessamme. Työkalu varoittaa lataussivullaan 'vältä voimakasta taustamelua, 'vältä voimakkaita aksentteja', 'vältä Skype- ja puhelinhaastatteluja' ja 'pidä mikrofoni lähellä kaiutinta', jotka kaikki jätimme huomiotta.

Literaatti on lähellä tarkkaa paikoissa, joissa puhuin, varsinkin kun ei ollut ylikuulumista enkä käyttänyt oikeita substantiivija, mutta ponnistelin melko paljon Dulcen, Kristenin ja Alexioksen litteroinnissa. Se rikkoi eri puhujat uusiksi kappaleiksi joissain paikoissa, mutta epäonnistui toisissa. Kokonaistranskriptio vaihtelee välillä täysin johdonmukaisen joissain paikoissa ja omituisen epäjohdonmukaisen toisissa, kuten silloin, kun Alexios sanoi: 'anna minun avata Urban Dictionary, niin voimme käydä läpi joitakin niistä' koska 'Tarkoitan, että jopa kaupunkisanakirjassa tytöt ovat lähellä. .”

Trint tarjosi samanlaisia ​​tuloksia 61 prosentin tarkkuudella. Se meni sekaisin monissa samoissa paikoissa, sekaisin aksenttien, YouTuben äänen ja ylikuulumisen tai hiljaisen puhumisen kanssa. Se ei kuitenkaan tulkinnut väärin samalla tavalla kuin Happy Scribe. Urban Dictionary -lause ylhäältä ilmestyi seuraavasti: 'Tarkoitan, että jopa kaupunkisanakirjassa voimme käydä ne läpi.'

Kaiken kaikkiaan Trintin teksti on hieman helpompi lukea kuin Happy Scriben, koska se erottaa puhujat paremmin ja jakaa ne uusiin kappaleisiin. Se ei ole täydellinen, mutta se lisää paljon selkeyttä, kun se toimii.

Sonix osoittautui seuraavaksi tarkimmaksi 50 prosentilla. Sonix toimi hieman paremmin kuin Happy Scribe ja Trint, kun yksi kaiutin puhui äänekkäästi. Mutta mikä tahansa määrä ylikuulumista, taustamelua tai jopa naurua – kaikki asiat, jotka todennäköisesti ilmenevät missä tahansa työkalun todellisessa käytössä – näytti hämmentävän sitä enemmän kuin muut. Se tallensi Urban Dictionaryn lauseen seuraavasti: 'Avaa kaupunkisanakirjassa ja voimme käydä läpi joitakin niistä.'

Kuten muutkin työkalut, Sonix yritti jakaa kaiuttimet eri kappaleisiin, mutta se näytti olevan hieman huonompi siinä.

Recordly oli vähiten tarkka automaattisista transkriptiotyökaluista 48 prosentin tarkkuudella. Se tallensi Urban Dictionary -lauseen seuraavasti: 'Avaa minun tuo kaupunkisanakirja, niin voimme. Käy läpi joitakin', mikä ei ole huono, mutta tämä tekstipala ei edusta muuta transkriptiota. Kuten YouTube, Recordlyn transkriptio on yksi jättimäinen tekstilohko. Toisin kuin YouTube, se lisää välimerkkejä, vaikkakin harvemmin ja pienemmällä tarkkuudella kuin muut työkalut.

Recordly-transkriptio on vähiten hyödyllinen kontekstista irrallaan.

Kaiken kaikkiaan paras transkriptio tuli omasta kädestäni oTranscriben avulla. Revistä tuli paras transkriptio, jota minun ei tarvinnut litteroida itse. Mutta tämä on katsaus automaattisista transkriptiotyökaluista, ja siinä kategoriassa Happy Scribe vain tuskin päätti Trintistä noustakseen kärkeen.

Ominaisuudet (Voittaja: Sonix)
Jotkut asiat näyttävät olevan automaattisten transkriptiotyökalujen alan standardeja. Mahdollisuus toistaa ladattua ääntä on ilmeinen. Kaikkien työkalujen avulla käyttäjät voivat viedä transkriptioita eri muodoissa.

Selainpohjaiset työkalut (mikä tarkoittaa kaikkia paitsi Recordlyä) tarjoavat myös yhteisen sarjan. Kaikki käyttäjät voivat napsauttaa tekstin eri kohtia ja siirtyä suoraan kyseiseen nauhoituksen osaan. Niillä kaikilla on vaihtoehtoja toistaa ääntä hitaammin (pikanäppäimillä tai asetuksia selaamalla), muokata transkriptioita manuaalisesti, ladata äänen lisäksi videota ja tallentaa transkriptioita myöhempää käyttöä varten.

Trint menee askeleen pidemmälle ja sisältää äänen visualisoidun aaltomuodon transkription alaosassa, jonka käyttäjät voivat ohittaa halutessaan. Siinä on myös sisäänrakennetut työkalut tekstin etsimiseen ja korvaamiseen, korostamiseen tai yliviivaamiseen. Käyttäjät voivat lisätä kaiuttimien luettelon työkaluun ja liittää nimensä jokaiseen kappaleeseen. Siinä on myös kätevä ominaisuus lähettää transkriptio sähköpostitse yhdellä napsautuksella.

Sonix sisältää kaikki nämä työkalut (paitsi interaktiivinen aaltomuoto) ja muutama muu. Hyödyllisimmät ovat 'luottamusvärit', jotka antavat eri värejä sanoille, joihin Sonix on vähemmän luottavainen; äänenlaadun arvioinnin, joka kertoo, kuinka varma Sonix on transkriptiosta; ja automaattinen kaiuttimien tunnistus, beta-ominaisuus, joka yrittää tunnistaa eri kaiuttimet ja määrittää niille tunnukset.

Testissämme Sonix tunnisti vain kaksi erilaista kaiutinta, joten tämä työkalu vaatii hieman työtä, mutta se on silti valtavan hyödyllinen.

Recordly, joukon ainoa sovellus (vain iOS), tarjoaa vähiten ominaisuuksia. Se on melko pitkälti ennätys ja odota -kokemus. Transkriptio toimitetaan muodossa, joka muistuttaa Applen sisäänrakennettua muistiinpanosovellusta, ja siinä on rajoitettu muokkaustoiminto. Sen avulla käyttäjät voivat myös viedä ääntä tai tekstiä toiseen sovellukseen.

Vaikka Trintin etsi-ja-korvaa- ja aaltomuoto-ominaisuudet ovat hyödyllisiä transkriptien korjaamisessa, Sonixin ominaisuudet lisäävät tärkeää läpinäkyvyyttä transkriptioprosessiin. Ja vaikka kaiuttimen tunnistusbeta ei ole täysin luotettava, se on kunnianhimoinen työkalu, jonka pitäisi vain kehittyä täältä.

Ajoitus (Voittaja: Happy Scribe, Trint ja ennätyksellisen)

ajoituskaavio

Täällä automaattinen transkriptio loistaa. Kaikki työkalut toimittivat transkription lyhyemmässä minuutissa kuin lähettämämme äänitiedoston pituus. Ero Happy Scriben (viisi minuuttia), Trintin (kuusi minuuttia) ja Recordlyn (kuusi minuuttia) välillä oli mitätön, mutta Sonix kesti hieman kauemmin (11 minuuttia). (Päivitys: Sonixin edustaja ilmoitti, että sen nopeus on linjassa muiden työkalujen kanssa, kun kaiuttimen tunnistusominaisuus on poistettu käytöstä.) Tosimaailmassa tämä voi olla ratkaiseva ero, etenkin pidempien transkriptioiden yhteydessä.

YouTube on tässä hieman mysteeri. Kesti vain muutaman minuutin, ennen kuin automaattiset tekstitykset tulivat näkyviin. Aiempien kokemusten perusteella olemme havainneet, että niiden ilmestymiseen kuluva aika voi vaihdella melkoisesti. Koska YouTubea ei todellakaan ole tarkoitettu käytettäväksi tällä tavalla, emme ole varmoja, kuinka kauan se yleensä kestää.

Kesti noin neljä tuntia ja 15 minuuttia, ennen kuin Revin ihmiskirjoittajat saivat tekstinsä valmiiksi. Kesti noin puolet siitä, että tein sen itse oTranscribella, mutta ei ilman useita taukoja, Spotifyn Deep Focus soittolista ja kaksi gallonaa kahvia.

Hinnoittelu (voittaja: ennätyksellisesti)

kustannuskaavio

Et voi voittaa ilmaisia ​​(YouTube, oTranscribe), mutta kun kyse on omistetuista automaattisista transkriptiotyökaluista, hinta vaihtelee suuresti. Parhaan hinnan määrittämiseksi sinun on harkittava, kuinka usein käytät työkalua.

Sonix on kallein, ja sen perussuunnitelma alkaa 15 dollarista kuukaudessa plus 8 dollaria jokaiselta transkriboidun äänen tunnilta. Mutta työkalu tarjoaa mojovan 33 prosentin alennuksen vuosittain maksamisesta kuukausittaisen sijaan.

Trint tarjoaa myös suunnitelmia, jotka alkavat 15 dollarista tunnissa maksullisista transkriptioista tai 40 dollarista kuukaudessa jopa kolmen tunnin litteroitua ääntä varten. Ylimääräiset transkriptiot maksavat hieman pohjoispuolella 13 dollaria tunnissa.

Happy Scribe maksaa tasaiset 10 senttiä minuutilta ladatusta äänestä. Vähemmän matemaattisille tyypeille se on 6 dollaria tunnissa.

Pienellä 2 dollarilla tunnissa, ja ensimmäinen tunti on ilmainen, Recordly on ylivoimaisesti halvin automaattinen transkriptiovaihtoehto.

Ei ole yllättävää, että Revin ihmiskirjoittajat maksavat enemmän kuin muut työkalut. 13 minuutin leikeemme litteroiminen maksoi 14 dollaria, ja aikaleimoista maksoimme 3,50 dollaria enemmän. Silti työtuntien halvat suhteelliset kustannukset saavat meidät ihmettelemään, missä Revin transkriptoijat ovat maailmassa ja kuinka hyvin heille maksetaan.

Helppokäyttöisyys (voittaja: Trint)
Mikään näistä työkaluista ei ole vaikea käyttää. Lataat kuhunkin tiedoston (tai tallennat sen kanssa ääntä, Recordlyn tapauksessa), ja jonkin ajan kuluttua se lähettää sinulle linkin muokattavaan transkriptioon.

Trint ottaa ison askeleen tiedostojen lataamista pidemmälle ja hyväksyy äänen tai videon useista lähteistä, kuten Dropboxista, Google Drivesta ja FTP:stä, ja antaa käyttäjien jopa antaa vain linkin. Tämä on ainutlaatuinen testaamiemme työkalujen joukossa. Trint kysyy myös muutamia hyödyllisiä kysymyksiä taustamelusta, ylipuhumisesta ja muusta ennen latauksen alkamista. Se ei korjaa nauhoitusta, mutta on hyödyllinen UX-näyttö, joka opettaa käyttäjille, kuinka tulevaisuudessa voidaan tallentaa enemmän transkriboitavaa ääntä.

Happy Scribe, Rev, Sonix ja Trint lähettävät sähköpostiviestejä, kun transkriptio on valmis, joten sinun ei tarvitse istua ja tuijottaa näyttöä.

Bottom Line
Se ei ole halvin eikä tarkin saatavilla oleva kokonaistranskriptiovaihtoehto, mutta Trint voitti parhaana monipuolisena työkaluna testaamistamme.

Hieman yli vuoden vanha yritys, joka on saanut rahoitusta Knight Foundationilta (vastuuvapauslauseke: Poynter myös saa Knightin rahoitus) ja Googlen Digital News Initiative tarjoaa parhaan yleisen yhdistelmän toimivuutta, tarkkuutta ja helppokäyttöisyyttä.

Vain YouTuben automaattinen tekstitysominaisuus, jonka tarkkuus oli 72 prosenttia, menestyi huomattavasti paremmin kuin Trint algoritmiohjatussa transkriptiossa. YouTubea ei kuitenkaan ole suunniteltu sellaiseen litterointiin, jota toimittajat tarvitsevat päivittäin, eikä se tarjoa minkäänlaisia ​​muokkaustoimintoja.

Vaikka nuori startup Happy Scribe menestyi tarkkuustesteissämme hieman paremmin 62 prosentin osuudella ja on noin kolmanneksen Trintin hinnasta, siitä puuttuu monia lisäominaisuuksia, jotka tekevät Trintistä hyödyllisen. Mahdollisuus ladata monista lähteistä, etsiä ja korvata tekstiä ja puhujan tunnistus ovat pieniä mutta tärkeitä työnkulun työkaluja. Jos etsit vain nopeaa ja likaista transkriptiota, Happy Scribe voi olla oikea tapa.

Ja vaikka on totta, että sen 61 prosenttia on kaukana täydellisestä, testimme olivat hieman vaikeampia kuin useimmat todelliset käyttötavat.

Testasimme myös Rev, ihmiskäännöspalvelu, ja oTranscribe, joka tarjoaa toimittajille käteviä työkaluja äänen litteroimiseen itse. Huomasimme, että Rev oli 1 dollari/minuutti litteroitua ääntä tavalliselle toimittajalle liian kalliiksi käytettäväksi säännöllisesti. Ja vaikka oTranscribe oli kätevä, se ei ratkaise litteroinnin tylsää ja aikaa vievää.

Tyypillisiä käyttötarkoituksia silmällä pitäen Trint on paras monipuolinen automaattinen tekstinkirjoitustyökalu toimittajille.

Korjaus: Ilmoitimme aiemmin, että Sonix ei tarjous etsi ja vaihda työkalu, mutta se todella tekee. Pahoittelemme sen puuttumista.

Lue lisää journalismin työkaluista Kokeile tätä! — Journalismin työkalut. Kokeile tätä! saa virtansa Google News Lab . Sitä tukevat myös American Press Institute ja John S. ja James L. Knight Foundation