MacWhisper е безплатният софтуер за транскрипция, който чаках

Търсите ли софтуер за Mac за транскрибиране на аудио файлове в писмени текстови файлове? Има много платени инструменти, като Otter.ai и Trint, които могат да струват истински пари, когато започнете да ги използвате твърде много. Но MacWhisper е безплатното решение, което интернет чакаше. Или поне тази, която чаках.

OpenAI пусна невероятно мощна безплатна програма през септември 2022 г., която позволи на хората с известни технически познания да конвертират своите аудио и видео файлове в невероятно точни преписи. Проблемът беше, че не беше много достъпен за обикновения потребител, тъй като трябваше да сте запознати с използването на команди в приложението Terminal.

Но с MacWhisper, който беше забелязан за първи път от 9to5Mac, някой най-накрая е разработил GUI или графичен потребителски интерфейс, който се основава на Whisper на OpenAI и оставя всички объркващи технически неща под капака, като ви позволява просто да плъзнете и пуснете своя аудио файл и да получите транскрипция много бързо. А MacWhisper е изключително точен, защото Whisper на OpenAI е обучен 680,000 часа на аудио данни в мрежата.

Едно от хубавите неща на MacWhisper е, че не качвате в интернет аудио или видео файла, който искате да бъде транскрибиран. Това е важно за журналисти, които може да работят върху чувствителна история, или за всеки, който обикновено се притеснява да качва личните си файлове в облака. Файлът остава на вашия работен плот, което означава, че няма шанс някой да прихване аудиото ви.

Отново, MacWhisper е просто нов потребителски интерфейс за безплатна програма, която беше представена от OpenAI в края на миналата година, но наистина ще направи аудио транскрипцията лесна за почти всеки. Защото използвам Whisper и го намирам за изключително полезен, откакто беше пуснат. И дори сега ще използвам MacWhsiper, защото със сигурност ще ускори работния ми процес.

Като само един пример, след новината за колапса на крипто компанията FTX, използвах Whisper, за да транскрибирам десетки часове стари интервюта в YouTube с основателя на компанията Сам Банкман-Фрайд. Оттам успях да потърся преписите и да намеря странни и интересни идеи за статии, които да напиша, като например когато SBF каза през юни 2021 г., че блокчейн щеше да поправи Enron. Сравнението на SBF с Enron беше странно съвпадение, като се има предвид всичко, което сега знаем за това как FTX се срина. Но никога не бих открил този момент в старо неясно интервю, без да разполагам с десетки преписи, които мога да търся. И този процес, макар и по-лесен от слушането на часове и часове касети, все още беше тромав и не много автоматизиран.

След като инсталирах Whisper на моята машина, използвах да въвеждам „whisper audiofilename.mp3 —model tiny.en“ в терминалното приложение на Mac всеки път, когато исках да транскрибирам файл. С WhisperMac мога просто да плъзгам и пускам моя аудио файл и той прави своята магия без допълнително въвеждане.

Тествах MacWhisper с епизод от NBC Nightly News, който изтеглих от YouTube. И освен няколко грешки, като тълкуването на думата „windchills“ като „windshills“ и чуването на Lester Holt като „Lester Hold“, преписът беше много точен. MacWhisper е безплатен, но има платено ниво на софтуера, което може да бъде малко по-точно, защото използва по-интензивните модели на обучение на OpenAI, но безплатната версия ще работи чудесно за повечето хора.

MacWhisper ви позволява да експортирате транскрибираната дума в няколко различни формата, включително обикновен текст, CSV или дори файлов формат на субтитри като SRT и VTT.

И MacWhisper не е само за английски. Можете да транскрибирате аудио на 100 различни езика, което е невероятно удобно. Единствената функция, която MacWhisper няма и с която ми беше приятно да си играя на Whisper в приложението Terminal, е езиков превод. Превеждах вирусни видеоклипове на руски и китайски и ми казаха хора, които говорят езиците в Twitter, че преводите са точен.

Другата функция, която MacWhisper няма, въпреки че също не е налична от Whisper на OpenAI, е възможността за разграничаване на високоговорителите. Например, ако транскрибирате интервю с двама говорители, няма ясни маркировки, които да показват кога един говорител е спрял и друг е започнал. Но подозирам, че някой ще изгради тази способност в крайна сметка. Платените услуги като Trint правят това автоматично и би било чудесно да имате безплатно в крайна сметка, но получавате това, за което плащате.

Има и функция с MacWhisper, където можете да конвертирате реч от микрофона на вашия компютър в текст, което може да бъде удобно, ако искате да транскрибирате нещо в движение.

Прекарах месеци в чудене кога някой най-накрая ще разработи GUI за Whisper, тъй като няколко души го пробваха, но не създадоха нищо много удобно за потребителя. Но MacWhisper, разработен от Jordi Bruin, е софтуерът, който чаках. Bruin също е разработил софтуер като MacGPT, което позволява на потребителите да имат достъп до ChatGPT от тяхната лента с менюта.

Можете да изтеглите MacWhisper безплатно, с регистрация по имейл, на уебсайта на Bruin.

Източник: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/