Characters with diacritics break words #30

crecos · 2022-11-08T22:22:24Z

crecos
Nov 8, 2022

If I use this stable-ts modification, the word containing diacritics will be split.

If I use the original whisper the diacritics are not a problem.

Maybe a unicode problem. Any ideas for a solution?

[stable-ts] - Word by word example:
`1
00:00:00,360 --> 00:00:00,380
T

2
00:00:00,380 --> 00:00:00,540
ý

3
00:00:00,540 --> 00:00:00,750
m

4
00:00:00,750 --> 00:00:01,200
z

5
00:00:01,200 --> 00:00:02,030
á

6
00:00:02,030 --> 00:00:02,100
vod

7
00:00:02,100 --> 00:00:02,470
em

8
00:00:02,470 --> 00:00:02,540
je ne

9
00:00:02,540 --> 00:00:02,670
j

10
00:00:02,670 --> 00:00:03,090
le

11
00:00:03,090 --> 00:00:03,500
p

12
00:00:03,500 --> 00:00:05,100
ší.

13
00:00:06,360 --> 00:00:06,770
Je to

14
00:00:06,770 --> 00:00:08,590
ne

15
00:00:08,590 --> 00:00:08,710
j

16
00:00:08,710 --> 00:00:08,770
le

17
00:00:08,770 --> 00:00:09,820
p

18
00:00:09,820 --> 00:00:10,710
ší.

19
00:00:11,360 --> 00:00:11,760
Je

20
00:00:11,760 --> 00:00:13,920
to

21
00:00:13,920 --> 00:00:14,120
ne

22
00:00:14,120 --> 00:00:14,170
j

23
00:00:14,170 --> 00:00:14,360
lep

24
00:00:14,360 --> 00:00:16,070
ší.

25
00:00:16,360 --> 00:00:16,940
Je

26
00:00:16,940 --> 00:00:19,000
to

27
00:00:19,000 --> 00:00:19,120
nej

28
00:00:19,120 --> 00:00:19,360
lep

29
00:00:19,360 --> 00:00:21,160
ší.`
str.txt

[stable-ts] - JSON example:
"text": " T\u00fdm z\u00e1vodem je nejlep\u0161\u00ed. Je to nejlep\u0161\u00ed. Je to nejlep\u0161\u00ed. Je to nejlep\u0161\u00ed. Je to nejlep\u0161\u00ed. Na kraji rozkvetl\u00e9ho makov\u00e9ho pole sed\u011bl mot\u00fdl s mal\u00fdm \u010darn\u00fdm cilindrem na hlav\u011b. Skl\u00e1dal a zase rozkl\u00e1dal krz\u00eddla, ale za chv\u00edli to ho nechal a povid\u00e1, pro\u010d vlastn\u011b rozkl\u00e1d\u00e1m krz\u00eddla, kdy\u017e to nikdo nen\u00ed? Sotva d\u0159ekl, smakov\u00e9ho pole nikdo zavol\u00e1lo. \u017ddejte u\u017e b\u016fv. A zm\u00e1k\u016f jako z lesa by\u0161la panenka. M\u011bla makokv\u00eddkovou suhnidozvonu a usm\u00edvala se. Jsem makov\u00e1 panenka. Mot\u00fdl smekl mal\u00fd \u010darn\u00fd cilindr a poklonil se. Jsem mot\u00fdl Emanuel. L\u00edb\u00ed\u0161 se mi panenko. Ale boj\u00edm se, aby m\u011bn ne sezob kos. To ho se v\u00e1d nemus\u00ed\u0161, \u0159ekl makov\u00e1 panenka. J\u00e1 m\u00e1m tak \u010darvenou suhnitku, \u017ee za\u017eene ka\u017ed\u00e9ho kosa. A posko\u010dila si a zatancovala do kola. Mot\u00fdl Emanuel smekl \u010darn\u00fd cilindr a klanil se na v\u0161echny strany. M\u011bl \u010darn\u00fd kos a sezobl Emanuelov\u00fd cilindr. Mot\u00fdl Emanuel ti\u0161e \u0159ekl, byl to kos a sezob mi cilindr. Makov\u00e1 panenka se p\u0159estela to\u010dit do kola. To p\u0159ed sedem\u00ed mo\u017en\u00e9. M\u00e1m tak \u010darvenou suhnitku, \u017ee se j\u00ed m\u00f4s\u00ed leknout ka\u017ed\u00fd kos. Mot\u00fdl Emanuel sklonil hlavu. S\u00e1hn\u011b si. M\u00e1 se z\u00e1hla a Emanuel m\u011bl na hlav\u011b opravdu jen ty kadla. Posadili se na kraj\u00ed \u010cekmakov\u00e9ho pole a panenka pov\u00edd\u00e1, asi jsem ti lhala, ale ani o tom nev\u00edm. A te\u010f m\u011b \u0159ekni, jestli bys m\u011b unes, kdybych si ti sedla mezi kr\u00edla. Usadila se tam a vzn\u00e1\u0161eli se spolu nad rozkvetl\u00fdm m\u00e1kem. To je dob\u0159e, \u017ee m\u011b unese\u0161, Emanuely, \u0159ekle panenka. Le\u010f a\u017e do prost\u0159edpole, j\u00e1 se tam mus\u00edm s n\u011bjak\u00fdm poradit. Doleteli do prost\u0159edpole a tam u prost\u0159edkvetouc\u00edch m\u00e1k\u016f st\u00e1la zral\u00e1 Makovice. To je z cel\u00e9ho pole nejchyt\u0159ej\u0161\u00ed, \u0159ekla Makov\u00e1 panenka Emanuelovy, a hned se za\u010dala pt\u00e1t. Nemohla bych mi Makovice pov\u011bd\u011bt? I mohla. Kdyby se zbyla to\u010dila ke slun\u00ed\u010dku, a tak\u00e9jnka je\u0161t\u011b \u010derven\u011bj\u0161\u00ed a kos by byl uletel. Ale ty se sto\u010dila od slun\u00ed\u010dka, a tak kos sezobl Emanuelov\u00fd cilindr. Je to v\u0161ecko, co si cht\u011bla v\u011bd\u011bt? D\u011bkuju \u0159ekla Makov\u00e1 panenka, jen bych se je\u0161t\u011b r\u00e1da dov\u011bd\u011bla, jak to ud\u011blat, aby kos Emanuelov\u00fd cilindr zazvr\u00e1til. Makovice se otr\u00e1sla ve v\u011btru, a Makov\u00e1 zrnka v n\u00ed za\u0161eles cila, jako kdy\u017e se p\u0159es\u00edpaj\u00ed my\u0161lenky. Nastav dv\u011bl\u00e1n\u011b. Makov\u00e1 panenka to ud\u011blala, Makovice se otr\u00e1sla, a panence do dv\u011bl\u00e1n\u011b napr\u0161el m\u00e1k. V ka\u017ed\u00e9m zrn\u00ed\u010dku je dost zpan\u00ed na jedn\u00fa noc, \u0159ekla je\u0161t\u011b Makovice, a d\u00e1l u\u017e si panenky a Emanuelov\u00e9la nev\u0161\u00edmala. Makov\u00e1 panenka se posadila Emanuelov\u00fd mezi ch\u0159\u00eddla a leteli tak dlouho, a\u017e uvid\u011bli kosa. A slunce na n\u011bj sv\u00edtilo. N\u00e1hlav\u011b m\u011bl cilindr a sp\u00edval. To je Emanuelov cilindr, hned m\u016fho vradt zavola na panenka. Kos se tv\u00e1\u0159il, \u017ee prosp\u011b v Makovou panenku v\u016fbec nezly\u0161\u00ed. Panenka se k nim p\u0159ito\u010dila a upustila mu Makov\u00e9 zrnko rovnou pod zob\u00e1k. Kos se po n\u011bm ani nepod\u00edval a povid\u00e1, kde pak t\u00edm m\u011b neuspite, m\u00e1k j\u00e1 nezob\u00e1m. Ostr\u010dil si Emanuelov cilindr na stranu a sp\u00edval d\u00e1l. Nic se Emanuely ned\u00e1 d\u011blat, mus\u00ed\u0161 nahoru ke slun\u00ed\u010dku, \u0159ekla Makov\u00e1 panenka. Ka\u017ed\u00fd mot\u00fdl se u\u017e od mali\u010dka u\u010d\u00ed l\u00edtat ke slun\u00ed\u010dku. Emanuel si dal do kapsi t\u0159i Makov\u00e1 zrnka, zamhou\u0159il o\u010di a letel rovnou nahoru. Zv\u00ed\u0159\u00ed v m\u011bl zazav\u0159en\u00fdmi v\u00ed\u010dky \u010derveno, pak b\u00edlo a nakonec modro. To u\u017e byl \u00fa sameho slun\u00ed\u010dka. ''Co mi nese\u0161?'' Emanuely, povid\u00e1 slunce. ''Ale tady t\u0159i zrnka m\u00e1ku,'' \u0159ekl mot\u00fdl Emanuel. ''Nase ti d\u00edv\u00ed se slunce?'' ''Ne, prospan\u00ed,'' povid\u00e1 Emanuel. ''A\u017e slun\u00ed\u010dko usne\u0161, usne taky kos a Makov\u00e1 panenka mu vezme cilindr.'' ''Onanos\u00ed cilindr?'' ''Divilo se slunce.'' ''Ne, to je m\u016fj,'' \u0159ekl Emanuel. A podal slunci t\u0159i zrnka m\u00e1ku. ''Slun\u00ed\u010dko je sl\u00edzlo \u0161pi\u010dkou jazyka, p\u0159ekou sloje a usnulo. Kdy\u017e sp\u00ed slunce, mus\u00ed kostaky. Usnul zrovna v polovin\u011b p\u00edsni\u010dky a cilindr se muskut\u00e1lel za lavy do tr\u00e1vy. Makov\u00e1 panenka ho zvedla a pov\u011bsil\u00e1 na v\u011btvi\u010dku. Za chv\u00edli se vr\u00e1til Motil Emanuel o slunce. P\u0159es\u00e1hl na v\u011btvi\u010dku pro cilindr, t\u0159i kr\u00e1ci ho posadil na hlavu a t\u0159i kr\u00e1t smekl. Poprv\u00e9 p\u0159ed slun\u00ed\u010dkem, po druh\u00e9 p\u0159ed Makovou panenkou. A do t\u0159etice jen tak s\u00e1m stop je proradost. Jednou u\u017e za prvn\u00ed tmi \u010dekala Makov\u00e1 panenka na Motila Emanuela. Ka\u017edou chv\u00edli zavolela, sl\u00ed\u0161i m\u011b n\u011bkdo, nen\u00ed tam n\u011bkde Motil Emanuel. U lesa nen\u00ed, \u0159ekla ozv\u011bna od lesa. U rybn\u00edka taky nen\u00ed, za\u0161iptala ozv\u011bna od rybn\u00edka. Cel\u00fd den jsem ho ani nezahl\u00edd\u00e1, houkla ozv\u011bna od sk\u00e1li. A bylo u\u017e pozd\u011b ve\u010der, m\u011bs\u00edc \u0161el po neby a Makov\u00e1 panenka se st\u00e1le je\u0161t\u011b d\u00edvala dotmi. Na jednou vtedy m\u011b n\u011bkdo vyk\u0159ikl, pro p\u00e1na, to je na\u0161t\u011bst\u00ed. Kdo je to? N\u011bkoho nevid\u00edm, bo de\u0148 by si vid\u011bla. J\u00e1 jsem te\u010f zhasl\u00e9 lu\u010dn\u00fd sv\u011bt\u00edlko Ferdinand, nezvid\u00edm. A kdo t\u011b zhasl Ferdinandy? N\u011bjak\u00fd ne\u0161i kapit\u00e1n, k m\u00e1 velk\u0159\u00eddle, ma bilota. Mohla bych ti n\u011bjak pomoct, \u0159ekla panenka. P\u0159\u00ed\u0161t\u011bno, pov\u00edd\u00e1 u\u017e veselej Ferdinand, zvedni dv\u00e1 krzem\u00edjinky, co t\u011b le\u017e\u00ed u\u017ep\u00ed\u010dky z trv\u00edce a kr\u0161\u00ed s nimi o sebe. Makov\u00e9 panenky maj\u00ed jen malou s\u00edlu. Panenka pomalu zvedla krzem\u00edjinky, jakoby to byli dva balvany a uhodila jedn\u00edm odruh\u00fd. Vysko\u010dila jiskra a p\u0159ed panenkou stoj\u00ed lu\u010dn\u00fd sv\u011bt\u00edlko Ferdinand a ti se z\u00e1\u0159\u00ed. Zvuk\u00e1v\u00e1me, jak n\u011bzhasl kr\u00eddlem, ty si m\u011b znova zap\u00e1lila jisk\u0159i\u010dkou a j\u00e1 ti d\u011bkuju, \u0159ekl a dal se do tance. Tancoval po \u0161pi\u010di\u010dk\u00e1ch tr\u00e1v\u011b, to\u010dil se do kola, nebo zas jen ti\u0161e ho\u0159el jako na slavnosti. Na jednou toho nechal. P\u0159ito\u010dil se k panence a pov\u00edd\u00e1, d\u011bl se tu vesel\u00fd jako na b\u00e1le. Zlob\u00ed se p\u0159ece n\u011bkde v\u011btn\u011b stratil Motil Emanuel, jestli dovol\u00ed\u0161, j\u00e1 se po n\u011bm pod\u00edv\u00e1m. To bych byla r\u00e1da, \u0159ekl a makov\u00e1 panenka. Ferdinand odb\u011bhl do tmi a panenka \u010dekala d\u00e1l. Za chv\u00edli bylo sly\u0161et po\u0159\u00e1dn\u011b veselou Motil\u00ed p\u00edsni\u010dku a Motil Emanuel je tu, a Vlindl m\u00e1 na stranu a vykl\u00e1d\u00e1, jestli se panenko na m\u011b zlob\u00ed\u0161, tak se ne\u017elob. Za v\u0161echno m\u016f\u017ee j\u00edt rocel, proto\u017ee on porad lizn\u011b si Emanuely a je\u0161t\u011b trochu a je\u0161t\u011b asi po capi\u010dku. J\u00e1 se nezlob\u00edm, \u0159ekl a makov\u00e1 panenka, ale ty Emanuely mus\u00ed\u0161 j\u00edt net sp\u00e1t. J\u00e1 mu postel ve velik\u00e9m \u017elut\u00e9m kv\u011btu a Emanuel si do n\u00ed vlezal. Panenka ho houpala, ale Emanuel ne a neusnout. Na koniec pov\u00edd\u00e1, j\u00e1 neusnu, proto\u017ee m\u00e1m velikou \u017e\u00edza\u0148. Kde m\u00e1m te\u010f co sch\u00e1\u0148at, \u0159ekla panenka, no\u010dn\u00ed roce u\u017e d\u00e1vno sp\u00e1t. J\u00e1 m\u00e1m \u017e\u00edza\u0148, \u0159ekl Emanuel. Makov\u00e1 panenka se vypravila pod herzmanty, ale tam ani kapka. Kdy se vracela dom\u016f, potkala vysok\u00fd bodl\u00e1k. V\u0161ude na n\u011bm st\u00e1la rosa, bodl\u00e1k byl tak je\u017eat\u00fd, \u017ee se po n\u011bm rostn\u00e9 kapky b\u00e1li sklouznout do tr\u00e1vy. Panenka bodl\u00e1ku pov\u00edd\u00e1, dej mi kapku pro Emanuela, on m\u00e1 \u017e\u00edza\u0148. Velikou \u0159ekl bodl\u00e1k. Ale pros\u00edm, \u0159ekl bodl\u00e1k, ale pro\u0161el se, pro pro Emanuela, on m\u00e1 \u017e\u00edza\u0148. Velikou \u0159ekl bodl\u00e1k. Ale pros\u00edm panenka, nab\u00e9r si rosa, kolik chce\u0161. Makov\u00e1 panenka ud\u011blala krok a uv\u00edzla s cuk\u00ednkou v bodl\u00e1\u010di. P\u016fstn\u011b vyk\u0159ikla. J\u00e1 nem\u016f\u017eu, a nikdy bych sam cht\u011bl \u0159ekl bodl\u00e1k. Emanuel zat\u00edm \u010dekal, nedo\u010dkal se a ustnul ve velik\u00e9m \u017elut\u00e9m kv\u011btu. Probudil se a m\u011bs\u00edc u\u017e ukazoval kr\u00e1nu. Makov\u00e1 panenka m\u011bkam zabloudila, lekl se Emanuel a letel ji hledat. Uvid\u011bli ho m\u016fry, kter\u00e9 se zrovna chystali d\u00edt zp\u00e1t a v\u0161e ptali si, co je to za bl\u00e1zniv\u00e9ho mot\u00fdla, co pak po\u0159\u00e1dn\u00fd mot\u00fdl l\u00edt\u00e1 p\u0159ed slun\u00ed\u010dkem. Co je to za bl\u00e1zniv\u00e9ho mot\u00fdla, pov\u00edd\u00e1 o chv\u00edlku pozd\u011bji bodl\u00e1k, kter\u00fd dr\u017eel Makovou panenku za cukni\u010dku. Vyd\u011bl jste n\u011bkdy mot\u00fdla hrnout se takhle rovnou na bodl\u00e1k. To u\u017e byl Emanuel nam\u00e1vnut\u00ed k\u0159\u00eddli od bodl\u00e1ku a vol\u00e1, p\u016fst\u0148 mou panenku, p\u016fst\u00ed. Po\u010f, pov\u00edd\u00e1 bodl\u00e1k a mou chy, co tam p\u0159ed r\u00e1nem brouzili kolem, si za chv\u00edlku pov\u00eddali. Makov\u00e1 panenka uv\u00edzla na bodl\u00e1ku za cukn\u00edku a mot\u00fdl Emanuel zak\u0159\u00eddlo. D\u011bn, \u017ee to u\u017e se tam po \u0161pi\u010di\u010dk\u00e1ch traf hnalo lu\u010dn\u00fd sv\u011bt\u00fdlko Ferdinand. Postavilo se p\u0159ed bodl\u00e1k a \u0159eklo, net je oba, pust\u00ed\u0161 panenku i Emanuela. Pust\u00ed\u0161, nepust\u00edm, naje\u017eil se bodl\u00e1k. Tak uvid\u00ed\u0161, \u0159ekl Ferdinand a sv\u00edtil p\u0159\u00edsn\u011b jako sv\u00ed\u010dka v soun\u00ed s\u00fd\u0148. P\u00e1l\u00ed\u0161, zeptal se o patrn\u011b bodl\u00e1k. Pust\u00ed\u0161, zeptal se Ferdinand. Pust\u00edm a bodl\u00e1k pustil Makovou panenku i mot\u00fdla Emanuela. Ale j\u00e1 nep\u00e1l\u00edm, zasm\u00e1lose lu\u010dn\u00fd sv\u011bt\u00fdlko Ferdinand a odb\u011bhlo po \u0161pi\u010di\u010dk\u00e1ch traf. Na tr\u017eenou suk\u00ednku si panenka snadno zp\u00edchla a taky Emanuelovy vyspravila kr\u0161\u00ed dlo. Jednou r\u00e1no chodila Makov\u00e1 panenka po Makov\u00e9m poli a zb\u00edrala do kapsi usukn\u011b kapky rossy. Mut\u00edl Emanuel zat\u00edm l\u00edtal od kv\u011btu ke kv\u011btu a v\u0161ude smekl cilindr a \u0159ekl, p\u0159ej\u00fa rozkvetl\u00e9 dobr\u00e9 j\u00edtro. Kdy\u017e Makov\u00e1 panenka nazb\u00edrala plnou kapsu rossy, trochu se nad t\u00edm zamyslila a \u0159ekla, nev\u00edm, pro\u010d vlastn\u011b jsem tu rossu zb\u00edrala. Jen dopov\u011bd\u011bl a p\u0159ib\u011bhl odle sa \u017ealud. Nem\u011bl \u010depi\u010dku, byl podje\u0161en\u00fd a cel\u00fd zelen\u00fd strachem. Pro Pietr\u00e1n Emanuely, ho nemy p\u016fj\u010f cilindr. Ten j\u00e1 nikomu nikdy nep\u016fj\u010d\u00edm, pov\u00edd\u00e1m o tyl Emanuel. M\u016fdej ten cilindr, \u0161ekl Makov\u00e1 panenka, co pak nevid\u00ed\u0161, \u017ee n\u011bkde stratil \u010depi\u010dku. Emanuel smekl cilindr a \u017ealud \u0161ub cilindrem na hlavu. Vypadal te\u010f jako souce a stalo se to pr\u00e1v\u011b v \u010das. V lese zapraskali v\u011btvi\u010dky, ozvalo se klen\u00ed a hromov\u00e1n\u00ed a z hou\u0161ti vyb\u011bhl loup\u00e9\u017en\u00ed\u010dek bur\u00e1sek. Hromci bava prsk, s lesami utekl \u017ealud a n\u011bkde tady. Bur\u00e1sek nebyl v\u011bt\u0161\u00ed ne\u017e v\u011bt\u00fd v kamechu, ale rozel\u00ed\u017eel se tak ostra, a\u017e to p\u0159esek\u00e1valoste byla tr\u00e1vy. \u017dalud opatrn\u011b ustoupil do st\u00ednu a postr\u010del si cilindr do o\u010di. Hromci bava prsk, povid\u00e1 bur\u00e1sek Makov\u00e9 panence a j\u00e1 si tam \u017ealud najdu. A co kdybych ti zatatcovala, \u0159ekla panenka, aby bur\u00e1zkov\u00fd odvedla my\u0161lenky od \u017ealudu. Ne\u0159ekl tak ani tak bur\u00e1sek. Panenka se d\u00e1l do tance, a\u017e bylo s \u010derven\u00e9 subn\u00ed\u010dky kolo. Vznese se taky motil Emmanuel a vyv\u00e1d\u011bl ve vzduchu vyberlata, aby loup\u00e9\u017en\u00edk zapom\u011bl na \u017ealud. Jen\u017ee loup\u00e9\u017en\u00ed\u010dek bur\u00e1sek se na to v\u0161echno d\u00edval a ned\u00edval a ob\u010das m\u00e1vnul rukou. Hromci bava prsk. Hromci m\u00e1 prohled\u00e1val tr\u00e1vu a v tom uvid\u011bl smrteln\u011b bled\u00fd \u017ealud, jak se op\u00edr\u00e1 ost\u00e9blot \u0161aslice. Jen\u017ee ten \u017ealud m\u011bl na hlav\u011b cilindr jako souce. Bur\u00e1sek se \u00factiv\u011b uklonil. Klan\u00edm se, pane souce, nevid\u011blste tu nikdy \u017ealud? Utekl mi z lesa a j\u00e1 ho moc im chvidit. \u017dalud by byl nejrad\u011bj\u00ed zmizel cel\u00fd v cilindru. Bur\u00e1sek se na n\u011bj d\u00edv\u00e1 po\u0159\u00e1d ostrzeji. Hromci bava prsk. N\u011bco se mi na v\u00e1s nezd\u00e1, pane souce. Bur\u00e1sek sah\u00e1 souci po cilindru. V tom ale Motil Emanuel vrazil do kitky, co tam kv\u00e9tla tak pr\u016fce, a\u017e se zapr\u00e1\u0161ilo s lat\u00fdm pr\u00e1\u0161kem a v\u0161ecko to vletilo bur\u00e1cko vydo\u010d\u00ed. Hromci bava prsk, co se mi to Emanueli hodil do o\u010d\u00ed, k\u0159ikl Bur\u00e1sek a zlostn\u011b dupl. A jak dupl ud\u011blalo to v zemi jamku, \u017ealud do n\u00ed sko\u010dil, panenka na n\u011bj p\u0159ihr\u00e1bl\u00e1 hl\u00ednu a zalila j\u00ed rosauskapsy usukn\u011b. Na tom m\u00edste pak vyrostl vysok\u00fd dup. Od m\u011bj\u00ed loup\u011b\u017en\u00ed\u010dek Bur\u00e1sek p\u0159i\u0161el za v\u011btr\u016f nebo v \u010das, kdy se nehnulo ani holub\u00fd p\u00edrko, hodil po n\u011bm ten dup tvrd\u00fdm \u017ealudem. Jednou se makov\u00e1 panenka pod\u00edvada na nebe a pov\u00edd\u00e1 Motilu Emanuelov\u00fd. Zchovej si n\u011bkam cilinder, za chv\u00edli je to bou\u017eka. Emanuel Eline sed\u011bl na konvy na zal\u00edv\u00e1n\u00ed a jen m\u00e1 vnul ty kadly. Jde pak bou\u017eka. Tak to mus\u00edme makov\u00e9 pole zal\u00edcama, zdychla si panenka. A bylo horko makov\u00e9 korunky vadli. Dojde\u0161 mi a spo\u0148 z konv\u00ed provodu Emanuely. Jen\u017ee Motil Emanuel byl l\u00fdn\u00fd s vednouce z konve. U\u017e asi stejn\u011b d\u00e1vno vyschla, \u0159ekl. Na neby se se\u0161li mraky, tm m\u011blo se v\u00edc a v\u00edc, zafoukal v\u00fdtr. Leteli s n\u00edm tenou\u010dk\u00e9 sl\u00e1mov\u00e9 sezt\u0159i\u010dky a volali. \u00da\u017e to za\u010dne. A spo\u0148 de\u0161t pokrop\u00ed makov\u00e9 pole, \u0159ekla panenka. Ani nek\u00e1pne volali sl\u00e1mov\u00e9 sezt\u0159i\u010dky. Jen hrom bude b\u00fdt. A spo\u0148 d\u00edste, konve Emanuely povid\u00e1 panenka. Mus\u00edm zalit pole, ne\u017e bou\u017eka o\u010des\u00e1m\u00e1 kumpovadle korunky. Emanuel l\u00fdn\u00fd slezl z konve. Sezt\u0159i\u010dky n\u011b\u010demu nerozum\u011bj\u00ed, pov\u00edd\u00e1 a smekl z hlavit cilindr. Za chv\u00edli tu m\u00e1me de\u0161t jako skrop\u00e1\u010de. A kdy\u017e se v tomto cilindru uhod\u00ed hrom. Blask a r\u00e1na a Emanuelov\u00fd poskakuje v cilindru lesk l\u00fdpan\u00e1\u010dek. Jakoby se strojen\u00ed se sam\u00fdch tenou\u010dk\u00fdch a lesk le\u017eav\u00fdch t\u00e9 reky. P\u0159ej\u00fa romsk\u00fd dob\u0159\u00fd odpolene. J\u00e1 jsem blask. P\u0159i\u0161el jste tak na jednou \u0161eptla panenka. Emanuel m\u011b p\u0159ece pozval. M\u00e9nuj se \u00c1mos. Na \u00c1 se nad\u00fdchno a na Mos spust\u00edm. Pan\u00e1\u010dek se nad\u00fdchl a spostil a\u017e lehl blask a bochnul hrom. Motil Emanuel leknut\u00edm skl\u00e1pl kr\u00eddla a byl bl\u00edl\u00fd a tenou\u010dky jako pap\u00edr. Taky makov\u00e1 panenka m\u011bla du\u0161i s tisklou na sem\u00ednko. M\u00edte jen takhle r\u00e1mosit \u0161eptla? Ne, j\u00e1 jsem lesk pracovit\u00fd. A nece za\u010dal ohl\u00ed\u017eet \u010d\u00edm by panence poslou\u017eil. A co v\u0161echno um\u00edte \u00c1mosi? Mohl by v\u00e1m tu podp\u00e1lit stromy nebo ro\u017et\u00edpat sk\u00e1ly, kdybyste si to p\u0159\u00e1la zahromcoval \u00c1mos. Ne p\u0159eju lekla se panenka, ale dovedil byste spr\u00e1vit konev? J\u00e1 cht\u011bla zad\u00edt makov\u00e9 pole a konev kdo ro\u017e ute\u010de. Ne, nece na kto pod\u00edv\u00e1m, \u0159ekl \u00c1mos, sko\u010dilo rovnou lkonve a za chv\u00edry bylo sli\u0161et, jak vol\u00e1 opravdu, je tu d\u011brka. Taky spr\u00e1vte \u00c1mosi, \u0159ekla panenka a k\u00fdvla na Emanuel'a, aby \u0161el d\u00e1l od konve. V konvy to bouhlo, ale ne moc a \u00c1mos vystar\u010dil hlavu. Ne zlobte se na m\u011b, ale v konvy jsou u\u017e dv\u011b. Taky spr\u00e1vte \u00c1mosi, \u0159ekla panenka. Vy panenko nev\u00edte, \u017ee j\u00e1 nikdy nic nem\u016f\u017eu spr\u00e1vit? Pov\u00edd\u00e1 ti, \u017ee \u00c1mos. Tak \u00c1mosi tak konev rozb\u00edte a taky u\u017e v n\u00ed nebude d\u00edrka, usm\u00e1la se na blzkov\u00e9ho pan\u00e1\u010dka makov\u00e1 panenka. Jste moc hodn\u00e1 a m\u00e1te do b\u011bhej srce, \u0159ekl \u00c1mos a hnul sebou v konvy tak pr\u016fce, a\u017e se rozletela, jakoby do n\u00ed \u00fahodil blzk. Potom panenka po\u010dkala, a\u017e ji odlehne v \u00fa\u0161\u00edch a poru\u010dila mot\u00edlu Emanuelov\u00fd. A te\u010f si dojde\u0161 n\u011bkam vyp\u016fj\u010dit konev, u stud\u00e1nky ji nabere\u0161 plnou vody a po\u0159\u00e1dn\u011b zal\u00edje\u0161 makov\u00e9 pole.", "segments": [ { "id": 0, "seek": 0, "offset": 0.0, "start": 0.36, "end": 6.36, "text": " T\u00fdm z\u00e1vodem je nejlep\u0161\u00ed.", "tokens": [ 50382, 314, 11822, 76, 710, 842, 85, 378, 443, 1506, 408, 73, 306, 79, 48651, 13, 50682, 50682, 2588, 281, 408, 73, 306, 79, 48651, 13, 50932, 50932, 2588, 281, 408, 73, 306, 79, 48651, 13, 51182, 51182, 2588, 281, 408, 73, 306, 79, 48651, 13, 51532, 51532, 2588, 281, 408, 73, 306, 79, 48651, 13, 51732, 51732 ],
json.txt

[original-whisper] - Word by word example:

`1
00:00:30,000 --> 00:00:36,800
Kvetlého makového pole seděl motýl s malým čarným cilindrem na hlavě.

2
00:00:37,600 --> 00:00:43,100
Skládal a zase rozkládal krzídla, ale za chvíli to ho nechal a povídá,

3
00:00:43,600 --> 00:00:48,800
proč vlastně rozkládám krzídla, když to nikdo není?

4
00:00:50,000 --> 00:00:53,400
Sotva dořekl, smakového pole nikdo zavolálo.

5
00:00:53,400 --> 00:01:00,400
Vždyť už bův. A zmáků jako z lesa vyšla panenka.

6
00:01:01,400 --> 00:01:04,400
Měla makokvítovou sutni dozvonu a usmívala se.

7
00:01:05,400 --> 00:01:08,400
Jsem maková panenka.

8
00:01:09,400 --> 00:01:12,400
Motýl smekl malý čarný cilindr a poklonil se.

9
00:01:13,400 --> 00:01:17,400
Jsem Motýl Emanuel. Líbíš se mi panenko.`

Answered by jianfch

Nov 8, 2022

Since not all languages uses space to separate words it was not made default (except English). But you can specify this behavior with combine_compound=True for results_to_word_srt or group_word_timestamps.

from stable_whisper import results_to_word_srt
results_to_word_srt(results, 'audio.srt', combine_compound=True) # strip=True to remove the space before the first word

1
00:00:00,360 --> 00:00:00,750
 Tým

2
00:00:00,750 --> 00:00:02,470
 závodem

3
00:00:02,470 --> 00:00:05,100
 je nejlepší.

4
00:00:06,360 --> 00:00:06,770
 Je to

...

View full answer

jianfch · 2022-11-08T22:55:55Z

jianfch
Nov 8, 2022
Maintainer

Since not all languages uses space to separate words it was not made default (except English). But you can specify this behavior with combine_compound=True for results_to_word_srt or group_word_timestamps.

from stable_whisper import results_to_word_srt
results_to_word_srt(results, 'audio.srt', combine_compound=True) # strip=True to remove the space before the first word

1
00:00:00,360 --> 00:00:00,750
 Tým

2
00:00:00,750 --> 00:00:02,470
 závodem

3
00:00:02,470 --> 00:00:05,100
 je nejlepší.

4
00:00:06,360 --> 00:00:06,770
 Je to

...

0 replies

crecos · 2022-12-19T22:45:51Z

crecos
Dec 19, 2022
Author

English works well. Other languages have a problem. For other languages, if combine_compound=False, the word will be split into consonants and vowels. If combine_compound=True instead of outputting one word and its timestamp is 2 or 3 words.

Good work. Keep going

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Characters with diacritics break words #30

{{title}}

Replies: 2 comments

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

Select a reply

Characters with diacritics break words #30

crecos Nov 8, 2022

Replies: 2 comments

jianfch Nov 8, 2022 Maintainer

crecos Dec 19, 2022 Author

crecos
Nov 8, 2022

jianfch
Nov 8, 2022
Maintainer

crecos
Dec 19, 2022
Author