« zpět na výpis měsíce |

[Talk-cz] Římské číslice v názvech ulic

Vlákno 21.1. - 23.1.2018, počet zpráv: 6


21.1.2018 09:47:52 (#1)
gravatar

Jan Sten Adámek

<sten at adamek.online>
38
Ahoj, bohužel se mi nepodařilo přijít na to, jak odpovědět na konkrétní dotaz v archivu, tak to holt posílám všem. Chtěl jsem reagovat na diskuzi ohledně zápisu římských čísel, protože jsem ten, co je měnil na Unicode (nebo alespoň jeden z nich, možná je takových lidí víc :). Důvod nejsou manýry ani hyperkorektnost, ale TTS a řazení. TTS: Pokud TTS dostane k přečtení zprávu „odbočte na Jižní V“ (písmeny), přečte to „jižní vé“, protože nemá jak rozhodnout, jestli je to zkratka nebo číslo. Použitím římských číslic se dá TTS říct, že to je číslo, a třeba Acapela TTS to pak přečte správně. Bohužel Google TTS (dělal jsem to kvůli OsmAnd) ty číslice úplně ignoruje a přečte jen „jižní“. Nepodporuje ani IPA, takže nejde použít ani name:pronunciation. Pro Google TTS tak momentálně neexistuje řešení. Zkusím připravit patch pro OsmAnd, aby pro TTS přepisoval římské číslice na arabské, pak by římské číslice měly význam. Řazení: Řazení má stejný problém jako TTS, takže bude řadit podle písmenné hodnoty. Pokud se použijí římské číslice, tak se řadí podle hodnoty code pointu a Jižní Ⅸ se umístí až po Jižní Ⅴ (funguje to i na kombinace více číslic jako ⅩⅤ, ⅩⅠⅩ ap.). Ale tohle jde řešit pomocí „sorting_name=Jižní 9“. Sten

23.1.2018 06:07:15 (#2)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
77
Člověk z DWG mi tvrdí, že prý na tohle existuje precedent. Nevíte někdo o něčem? Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek. Když tak se prý mám zeptat na Tagging. 2018-01-21 21:47 GMT+01:00 Jan Sten Adámek <sten at adamek.online>: zobrazit citaci
> Ahoj, > > bohužel se mi nepodařilo přijít na to, jak odpovědět na konkrétní dotaz > v archivu, tak to holt posílám všem. > > Chtěl jsem reagovat na diskuzi ohledně zápisu římských čísel, protože jsem > ten, co je měnil na Unicode (nebo alespoň jeden z nich, možná je takových > lidí > víc :). Důvod nejsou manýry ani hyperkorektnost, ale TTS a řazení. > > TTS: > Pokud TTS dostane k přečtení zprávu „odbočte na Jižní V“ (písmeny), přečte > to > „jižní vé“, protože nemá jak rozhodnout, jestli je to zkratka nebo číslo. > Použitím římských číslic se dá TTS říct, že to je číslo, a třeba Acapela > TTS > to pak přečte správně. Bohužel Google TTS (dělal jsem to kvůli OsmAnd) ty > číslice úplně ignoruje a přečte jen „jižní“. Nepodporuje ani IPA, takže > nejde > použít ani name:pronunciation. Pro Google TTS tak momentálně neexistuje > řešení. Zkusím připravit patch pro OsmAnd, aby pro TTS přepisoval římské > číslice na arabské, pak by římské číslice měly význam. > > Řazení: > Řazení má stejný problém jako TTS, takže bude řadit podle písmenné hodnoty. > Pokud se použijí římské číslice, tak se řadí podle hodnoty code pointu a > Jižní > Ⅸ se umístí až po Jižní Ⅴ (funguje to i na kombinace více číslic jako ⅩⅤ, > ⅩⅠⅩ > ap.). Ale tohle jde řešit pomocí „sorting_name=Jižní 9“. > > Sten > _______________________________________________ > Talk-cz mailing list > Talk-cz at openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
-------------- next part -------------- An HTML attachment was scrubbed... URL: <http://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/57fc6edc/attachment.html>

23.1.2018 07:40:37 (#3)
gravatar

Miroslav Suchý

<miroslav at suchy.cz>
507 3611
Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a): zobrazit citaci
> Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek.
A máš link na to vlákno? Mirek

23.1.2018 07:48:38 (#4)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
77
https://lists.openstreetmap.org/pipermail/talk-fr/2015-June/thread.html (Sorry, to jsem mohl poslat hned) 2018-01-23 19:40 GMT+01:00 Miroslav Suchý <miroslav at suchy.cz>: zobrazit citaci
> Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a): > > Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek. > > A máš link na to vlákno? > > Mirek > > _______________________________________________ > Talk-cz mailing list > Talk-cz at openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
-------------- next part -------------- An HTML attachment was scrubbed... URL: <http://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/7ceb73d4/attachment.html>

23.1.2018 08:08:58 (#5)
gravatar

majka

<majka.zem+talk at gmail.com>
670 2360
Ta debata na talk-fr ale neřeší primárně zápis římských číslic. Řeší problém toho, že to TTS neumí přečíst. Zápis v Unicode je tam hozený jen jako jedna z alternativ, navíc jedna z těch, postavených až na konci. Jo, padl tam nápad, že by to takhle mělo být správně (a osmose by měla vyhazovat chyby), ale to je podle mě jen úlet. Většina to rozhodně nechce, většina řeší jak podstrčit výslovnost do dat (což považuji za vhodnější). Debata vyšuměla bez rozuzlení. Za mě: jak ty mezery, tak římské číslice by měly být ve jménech zapsané "na psacím stroji" - tedy ne unicode znaky. Jak výslovnost, tak i správné zobrazování (tedy připojování předložek) by měly řešit programy ty data zpracovávající. A to uvádím jako někdo, kdo do tisku tyhle věci řeší. Jen v datech to (zatím) dělá neplechu, ať už větší či menší. 2018-01-23 19:48 GMT+01:00 Matej Lieskovský <lieskovsky.matej at gmail.com>: zobrazit citaci
> https://lists.openstreetmap.org/pipermail/talk-fr/2015-June/thread.html > > (Sorry, to jsem mohl poslat hned) > > 2018-01-23 19:40 GMT+01:00 Miroslav Suchý <miroslav at suchy.cz>: > >> Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a): >> > Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek. >> >> A máš link na to vlákno? >> >> Mirek >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz at openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> > > > _______________________________________________ > Talk-cz mailing list > Talk-cz at openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <http://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/fce5716e/attachment.html>

23.1.2018 08:31:02 (#6)
gravatar

Miroslav Suchý

<miroslav at suchy.cz>
507 3611
Dne 23.1.2018 v 20:08 majka napsal(a): zobrazit citaci
> Řeší problém toho, že to TTS neumí přečíst.  > Zápis v Unicode je tam hozený jen jako jedna z alternativ, navíc jedna z
Ano. Tady je jsou relevantni znaky https://en.wikipedia.org/wiki/Numerals_in_Unicode#Roman_numerals Ale byl uveden protipříklad čísel domů na Madagascaru, která se píší římsky. A že by bylo lepší to psát taky římsky do dat, a aplikace by to měla detekovat. Zajímavý problém pro detekci může být i D 8 III kde D je taky římská číslice. zobrazit citaci
> těch, postavených až na konci. Jo, padl tam nápad, že by to takhle mělo > být správně (a osmose by měla vyhazovat chyby), ale to je podle mě jen > úlet. Většina to rozhodně nechce, většina řeší jak podstrčit výslovnost > do dat (což považuji za vhodnější). Debata vyšuměla bez rozuzlení.
Řešili zda a jak používat name:fr-fonipa a name:phonetic:fr Napr. name:Avenue George V name:phonetics:fr=*ˈævənju: **ʒɔrʒ sε̃k* name:phonetics:en=*avnyˈdʒɔ:dʒ faɪv* Mirek

« zpět na výpis měsíce