Forum Debian Users Gang

MMW · 2023-07-10 10:08:16

Witam po kilku latach nieobecności. Wczoraj kontrolnie zainstalowałem sobie Debiana Stable, ale mam jeden zasadniczy problem - bezwzględnie potrzebuję zestawu do tworzenia sobie audiobooków mp3 z ebooków, czyli odpowiednik programu Balabolka i głosu Jan [który mam legalnie kupiony].

Próbowałem wielu opcji: Balabolki pod Wine/Playonlinux, Festival, espeak, mbrola, RHVoice, jakieś polskie głosy pod Festival - ogólnie wszystko, co znalazłem w sieci po polsku i angielsku. Próbowałem też odpalić głos stąd:
http://www.syntezamowy.pjwstk.edu.pl/korpus.html
ale bez powodzenia - instrukcja niczego mi nie wyjaśniła.

Niestety, instalacja Balabolki i Jana pod Wine nie wyszła, a te wszystkie programiki albo nie mają potrzebnej mi funkcjonalności [jak np. Festival z Orca], albo mają tragicznych lektorów [espeak], albo w ogóle nie wiem, jak to normalnie odpalić.

Czy ktoś ma jakiś sprawdzony, funkcjonalny zestaw pod Debiana? Możliwie dobrze mówiący i możliwie prosty. Jeśli chodzi o edycję ebooków, to biorę to na siebie - mogę tworzyć gotowe pliki .txt samodzielnie. Ale koniecznie potrzebuję sprawnie działający program, który z tych .txt nagra sensownie brzmiące .mp3.

Alternatywnie, może znacie jakiś program pod Androida, który zrobi to, o czym piszę powyżej, a nie jest płatny i jest w pełni funkcjonalny? Wtedy zgrywałbym mptrójki z telefonu na kompa.

ethanak · 2023-07-10 10:53:52

milena_abc - trochę przy kompilacji trzeba pokombinować. Słucham tego od parunastu lat.
Teoretycznie jest możliwa instalacja Jana pod Wine, ale bardzo mocno trzeba pokombinować. Jeśli się uda - milena_abc działa również z głosami SAPI.
http://milena.polip.com/

Ostatnio edytowany przez ethanak (2023-07-10 10:54:15)

Pavlo950 · 2023-07-10 12:04:22

MMW napisał(-a):
Niestety, instalacja Balabolki i Jana pod Wine nie wyszła, a te wszystkie programiki albo nie mają potrzebnej mi funkcjonalności [jak np. Festival z Orca], albo mają tragicznych lektorów [espeak], albo w ogóle nie wiem, jak to normalnie odpalić.

Nie wiem jak ten głos ale balabolka ma wersję portable i wersję konsolową. Może spróbuj? Poza tym - dzisiejsze kompy są na tyle mocne że zawsze możesz wirtualizować windę.

MMW · 2023-07-10 14:27:29

A może coś pod Androida? Też próbowałem, ale większość programów płatna, chociaż coś mi się kołacze, że był jakiś program bezpłatny i miał dobre głosy, ale nie pamiętam nazwy. A przecież Android sam w sobie ma głos [Z Googla, z Samsunga], więc wystarczyłby tylko prosty program do zamiany tekstu na mowę/MP3 głosem systemowym.

Wirtualizować nie chcę, bo to wymusza zajmowanie się kolejnym systemem w systemie. Gdybym musiał używać Debiana, to pewnie bym wirtualizował, ale myślałem, że skoro są polskie głosy pod mbrolę czy Festival, to uda się natywnie.

Ostatnio edytowany przez MMW (2023-07-10 14:28:02)

ethanak · 2023-07-10 18:38:02

Są jeszcze głosy od Oraluxa...

megabajt · 2023-07-11 08:53:14

ReadEra od niedawna potrafi czytać syntezatorem.

MMW · 2023-07-11 09:08:39

@megabajt Dzięki, pójdę tropem Androida. Głosy w w tym ReadEra są bardzo OK. Oczywiście wersja premium płatna, ale zapoznam się z warunkami licencyjnymi i zapłacę, jeśli nie znajdę darmowego odpowiednika. W wersji bezpłatnej nie wygasza ekranu, co oczywiście jest słabe, ale wiadomo, że za darmo mało komu się chce ;)

edit: Bardzo mi pomogłeś. Wreszcie namierzyłem aplikacje, które mnie interesują. T2S kosztuje nieco ponad 20 PLN jednorazowo i ma możliwość generowania plików dźwiękowych bardzo dobrymi głosami systemowymi i Google :)

edit2 @Voice Aloud Reader też mi się podoba, chociaż to koszt ponad 50 PLN, ale większa funkcjonalność. Jeśli znasz jeszcze jakiś lepszy w relacji cena/jakość, to poproszę.

Ostatnio edytowany przez MMW (2023-07-11 09:58:24)

megabajt · 2023-07-11 21:30:38

Poszukaj może w sklepie googla: ebook tts reader

MMW · 2023-07-11 21:39:25

Jest już OK, znalazłem wszystko, co potrzebne, a teraz piszę z Debiana.

ethanak · 2023-07-12 18:50:13

Ja tylko powiem, że przesłuchanie paru książek Balabolką zaowocowało stworzeniem Mileny... ale jak komuś wystarczy to jego sprawa.
Dzisiaj słucham sobie takim małym ustrojstwem na ESP32, mimo ograniczonych zasobów interpretacja tekstu (odmiana liczebników, skrótowców, prawidłowa wymowa dat czy godzin, wbudowane słowniki wyrażeń obcojęzycznych) to coś, czego mi brakuje w innych aplikacjach.

MMW · 2023-07-12 20:42:55

Słucham właśnie na Debianie audiobooka wygenerowanego w telefonie. Nie mam zastrzeżeń. Słychać oczywiście niedoskonałości, ale ogólnie jest to głos nie gorszy od Jana z Ivony - moim skromnym zdaniem.

Reszta softu działa bez problemów. Szczególnie cieszy bezproblemowość Veracrypt i KeePassXC. Miałem obawy, czy otworzą dyski/bazy, ale jest OK.

seler · 2023-07-15 09:38:13

Głos google można syntezować do plików mp3 pakietem gtts-cli

Natomiast w Androidzie można łatwo "gadać" systemowymi syntezatorami po zainstalowaniu Termuxa (linuxowa nakładka) komendą
termux-tts-speak 'tekst do mówienia'

gnomek · 2024-01-20 12:56:35

Czy da się używać milena z jakimś sensownie brzmiącym głosem angielskim? Czy da się na tym uruchomić głosy MS
SAPI5 (te co w Balabolka)?

Dodam, że z projektów offline z polskim lub angielskim mogę polecić Piper. Nie wymaga dużych zasobów typu 12GB GPU. U mnie chodzi na CPU Intel G4560 bez dodatkowej karty graficznej, chociaż całych książek jeszcze nie próbowałem konwertować. Jeśli chodzi o angielski offline, to udało mi się uruchomić (na Manjaro) MS speecht5_tts. Ale wymaga większych zasobów niż Piper. Na github i Hugging Face jest dużo projektów TTS.

Ostatnio edytowany przez gnomek (2024-01-20 17:55:13)

seler · 2024-01-21 17:57:23

gnomek napisał(-a):
Czy da się używać milena z jakimś sensownie brzmiącym głosem angielskim? Czy da się na tym uruchomić głosy MS
SAPI5 (te co w Balabolka)?

Dodam, że z projektów offline z polskim lub angielskim mogę polecić Piper. Nie wymaga dużych zasobów typu 12GB GPU. U mnie chodzi na CPU Intel G4560 bez dodatkowej karty graficznej, chociaż całych książek jeszcze nie próbowałem konwertować. Jeśli chodzi o angielski offline, to udało mi się uruchomić (na Manjaro) MS speecht5_tts. Ale wymaga większych zasobów niż Piper. Na github i Hugging Face jest dużo projektów TTS.

Dzięki wielkie za info o tym Piperze! Świetna sprawa.

gnomek · 2024-01-22 10:05:38

Polski (pl_PL/m-ailabs_low) jest też w MycroftAI/mimic3 Mimic3 jest bardzo szybki, ale wymowa niektórych polskich wyrazów pozostawia wiele do życzenia. Może znajdzie się ktoś bardziej ogarnięty, z dobrym sprzętem i dostarczy im odpowiednio wytrenowanego modelu / głosu.

Tak jak pisałem, na github jest wiele projektów TTS i bardzo szybko się to rozwija. Zobaczcie np. ten:
KoljaB/RealtimeTTS: Converts text to speech in realtime
To jest ogromny postęp w stosunku do tych mechanicznie brzmiących głosów, jakie były dostępne kilka lat temu.

Albo tu są sample angielskiego z StyleTTS 2.

Albo ten projekt:
GitHub - coqui-ai/TTS: - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
https://github.com/coqui-ai/TTS
Chociaż jego przyszłość jest już niepewna.
Problem z niektórymi projektami jest taki, że nie obsługują ssml tags, więc nie zawsze się nadają do każdego zadania.

Fajnie byłoby, gdyby polska społeczność open source się w to włączyła i popracowała nad dostarczeniem polskich modeli głosów z poprawną polską wymową.

ethanak · 2024-01-22 16:53:00

Kombinuję z pożenieniem Mileny z RHVoice, ale to dopiero początki. W każdym razie brzmi całkiem nieźle.

gnomek · 2024-01-22 18:12:22

Widzę, że mimic3 ma paczkę na Debiana i obsługuje ssml tags. Biorąc pod uwagę szybkość z jaką pracuje, to jeden z bardziej wartych uwagi projektów.

Ostatnio edytowany przez gnomek (2024-01-23 09:08:24)

Forum Debian Users Gang

Ogłoszenie

#1 2023-07-10 10:08:16

MMW - Użytkownik

funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#2 2023-07-10 10:53:52

ethanak - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#3 2023-07-10 12:04:22

Pavlo950 - człowiek pasjonat :D

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

MMW napisał(-a):

#4 2023-07-10 14:27:29

MMW - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#5 2023-07-10 18:38:02

ethanak - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#6 2023-07-11 08:53:14

megabajt - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#7 2023-07-11 09:08:39

MMW - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#8 2023-07-11 21:30:38

megabajt - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#9 2023-07-11 21:39:25

MMW - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#10 2023-07-12 18:50:13

ethanak - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#11 2023-07-12 20:42:55

MMW - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#12 2023-07-15 09:38:13

seler - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#13 2024-01-20 12:56:35

gnomek - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#14 2024-01-21 17:57:23

seler - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

gnomek napisał(-a):

#15 2024-01-22 10:05:38

gnomek - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#16 2024-01-22 16:53:00

ethanak - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

#17 2024-01-22 18:12:22

gnomek - Użytkownik

Re: funkcjonalność analogiczna do zestawy Balabolka + głos Jan

Stopka forum