[Talk-cz] Římské číslice v názvech ulic
Vlákno 21.1. - 23.1.2018, počet zpráv: 6
Ahoj,
bohužel se mi nepodařilo přijít na to, jak odpovědět na konkrétní dotaz
v archivu, tak to holt posílám všem.
Chtěl jsem reagovat na diskuzi ohledně zápisu římských čísel, protože jsem
ten, co je měnil na Unicode (nebo alespoň jeden z nich, možná je takových lidí
víc :). Důvod nejsou manýry ani hyperkorektnost, ale TTS a řazení.
TTS:
Pokud TTS dostane k přečtení zprávu „odbočte na Jižní V“ (písmeny), přečte to
„jižní vé“, protože nemá jak rozhodnout, jestli je to zkratka nebo číslo.
Použitím římských číslic se dá TTS říct, že to je číslo, a třeba Acapela TTS
to pak přečte správně. Bohužel Google TTS (dělal jsem to kvůli OsmAnd) ty
číslice úplně ignoruje a přečte jen „jižní“. Nepodporuje ani IPA, takže nejde
použít ani name:pronunciation. Pro Google TTS tak momentálně neexistuje
řešení. Zkusím připravit patch pro OsmAnd, aby pro TTS přepisoval římské
číslice na arabské, pak by římské číslice měly význam.
Řazení:
Řazení má stejný problém jako TTS, takže bude řadit podle písmenné hodnoty.
Pokud se použijí římské číslice, tak se řadí podle hodnoty code pointu a Jižní
Ⅸ se umístí až po Jižní Ⅴ (funguje to i na kombinace více číslic jako ⅩⅤ, ⅩⅠⅩ
ap.). Ale tohle jde řešit pomocí „sorting_name=Jižní 9“.
Sten
Člověk z DWG mi tvrdí, že prý na tohle existuje precedent. Nevíte někdo o
něčem? Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek.
Když tak se prý mám zeptat na Tagging.
2018-01-21 21:47 GMT+01:00 Jan Sten Adámek <sten na adamek.online>:
zobrazit citaci
> Ahoj,
>
> bohužel se mi nepodařilo přijít na to, jak odpovědět na konkrétní dotaz
> v archivu, tak to holt posílám všem.
>
> Chtěl jsem reagovat na diskuzi ohledně zápisu římských čísel, protože jsem
> ten, co je měnil na Unicode (nebo alespoň jeden z nich, možná je takových
> lidí
> víc :). Důvod nejsou manýry ani hyperkorektnost, ale TTS a řazení.
>
> TTS:
> Pokud TTS dostane k přečtení zprávu „odbočte na Jižní V“ (písmeny), přečte
> to
> „jižní vé“, protože nemá jak rozhodnout, jestli je to zkratka nebo číslo.
> Použitím římských číslic se dá TTS říct, že to je číslo, a třeba Acapela
> TTS
> to pak přečte správně. Bohužel Google TTS (dělal jsem to kvůli OsmAnd) ty
> číslice úplně ignoruje a přečte jen „jižní“. Nepodporuje ani IPA, takže
> nejde
> použít ani name:pronunciation. Pro Google TTS tak momentálně neexistuje
> řešení. Zkusím připravit patch pro OsmAnd, aby pro TTS přepisoval římské
> číslice na arabské, pak by římské číslice měly význam.
>
> Řazení:
> Řazení má stejný problém jako TTS, takže bude řadit podle písmenné hodnoty.
> Pokud se použijí římské číslice, tak se řadí podle hodnoty code pointu a
> Jižní
> Ⅸ se umístí až po Jižní Ⅴ (funguje to i na kombinace více číslic jako ⅩⅤ,
> ⅩⅠⅩ
> ap.). Ale tohle jde řešit pomocí „sorting_name=Jižní 9“.
>
> Sten
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/57fc6edc/attachment.html>
Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a):
zobrazit citaci
> Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek.
A máš link na to vlákno?
Mirek
https://lists.openstreetmap.org/pipermail/talk-fr/2015-June/thread.html
(Sorry, to jsem mohl poslat hned)
2018-01-23 19:40 GMT+01:00 Miroslav Suchý <miroslav na suchy.cz>:
zobrazit citaci
> Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a):
> > Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek.
>
> A máš link na to vlákno?
>
> Mirek
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/7ceb73d4/attachment.html>
Ta debata na talk-fr ale neřeší primárně zápis římských číslic.
Řeší problém toho, že to TTS neumí přečíst.
Zápis v Unicode je tam hozený jen jako jedna z alternativ, navíc jedna z
těch, postavených až na konci. Jo, padl tam nápad, že by to takhle mělo být
správně (a osmose by měla vyhazovat chyby), ale to je podle mě jen úlet.
Většina to rozhodně nechce, většina řeší jak podstrčit výslovnost do dat
(což považuji za vhodnější). Debata vyšuměla bez rozuzlení.
Za mě: jak ty mezery, tak římské číslice by měly být ve jménech zapsané "na
psacím stroji" - tedy ne unicode znaky.
Jak výslovnost, tak i správné zobrazování (tedy připojování předložek) by
měly řešit programy ty data zpracovávající. A to uvádím jako někdo, kdo do
tisku tyhle věci řeší. Jen v datech to (zatím) dělá neplechu, ať už větší
či menší.
2018-01-23 19:48 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> https://lists.openstreetmap.org/pipermail/talk-fr/2015-June/thread.html
>
> (Sorry, to jsem mohl poslat hned)
>
> 2018-01-23 19:40 GMT+01:00 Miroslav Suchý <miroslav na suchy.cz>:
>
>> Dne 23.1.2018 v 18:07 Matej Lieskovský napsal(a):
>> > Já našel jen debatu na Talk-fr, ze které opravdu nepoznám výsledek.
>>
>> A máš link na to vlákno?
>>
>> Mirek
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/fce5716e/attachment.html>
Dne 23.1.2018 v 20:08 majka napsal(a):
zobrazit citaci
> Řeší problém toho, že to TTS neumí přečíst.
> Zápis v Unicode je tam hozený jen jako jedna z alternativ, navíc jedna z
Ano. Tady je jsou relevantni znaky
https://en.wikipedia.org/wiki/Numerals_in_Unicode#Roman_numerals
Ale byl uveden protipříklad čísel domů na Madagascaru, která se píší
římsky. A že by bylo lepší to psát taky římsky do dat, a aplikace by to
měla detekovat.
Zajímavý problém pro detekci může být i
D 8 III
kde D je taky římská číslice.
zobrazit citaci
> těch, postavených až na konci. Jo, padl tam nápad, že by to takhle mělo
> být správně (a osmose by měla vyhazovat chyby), ale to je podle mě jen
> úlet. Většina to rozhodně nechce, většina řeší jak podstrčit výslovnost
> do dat (což považuji za vhodnější). Debata vyšuměla bez rozuzlení.
Řešili zda a jak používat
name:fr-fonipa
a
name:phonetic:fr
Napr.
name:Avenue George V
name:phonetics:fr=*ˈævənju: **ʒɔrʒ sε̃k*
name:phonetics:en=*avnyˈdʒɔ:dʒ faɪv*
Mirek« zpět na výpis měsíce