« zpět na výpis měsíce |

[Talk-cz] Nedělitelné mezery v názvech ulic

Vlákno 17.1. - 14.2.2018, počet zpráv: 91


17.1.2018 01:49:08 (#1)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Ahoj! Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu street relací a tak narážím na různé podivnosti v databázi, kterých bych si jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té samé ulice mají různé názvy, což chytá i takové prkotiny, jako je nedělitelná mezera (nbsp). Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k žádnému konsenzu to (pokud vím) nevedlo. Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak opravovat. Co mám dělat? 1) Odstraňuj nbsp z názvů ulic 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp 3) Tam, kde se vyskytují obě varianty, preferuj tu častější 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp 5) Přidávej (ručně) nbsp do názvů ulic 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně Ať se daří, Matej ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/306fdd04/attachment.html>

17.1.2018 02:36:42 (#2)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-17, 12:49 GMT, Matej Lieskovský wrote: zobrazit citaci
> 1) Odstraňuj nbsp z názvů ulic > 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp > 3) Tam, kde se vyskytují obě varianty, preferuj tu častější > 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp > 5) Přidávej (ručně) nbsp do názvů ulic > 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
Já se potácím někde mezi 4 a 6. Na jednu stranu je koncept jména ulice velice nestálý pojem (je skutečně spořilovská Jihovýchodní IV. 2. díl jiná ulice nežli Jihovýchodní IV 1. díl? Hmm, tohle dělení jsme také zjevně vzdaly a ty díly vynecháváme), ale nic lepšího nemáme, a ono to asi souvisí s nejasným konceptem ulice. Ono není nikde žádná metafyzická odpověď na to, proč Vinohradská končí na té křižovatce se Starostrašnickou a je z ní najednou Černokostelecká. Taky Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 It is the mark of an educated mind to be able to entertain a thought without accepting it. -- Aristotle

17.1.2018 02:49:03 (#3)
gravatar

majka

<majka.zem+talk at gmail.com>
718 2573
2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> > 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně >
Trocha teorie - správně by to snad mělo být podle údajů ČÚZK <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx> A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015. Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská", "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala alt_name, protože s tím vyhledávače měly problémy. A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec neexistovaly. Jako příklad je ulice U Panelárny <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se nacházející používající tuhle adresu totiž (snad až na jedinou výjimku) do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK 11.09.2014 oficiálně zaveden. Asi jsem Ti moc nepomohla, co říkáš? Majka ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/694d3a76/attachment.html>

17.1.2018 03:10:53 (#4)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
Na neoficiální názvy máme loc_name, ne (křižovatka U Bulhara byl taky kdysi neofiko název podle tamního trafikanta)? Minimálně Nominatim podle toho hledat umí. Co se týče logických důvodů, ty celkem neexistují - jen historické ("Vinohradská končí u vozovny, protože to je poslední výspa civilizace v malešických polích, dál už je jenom silnice." - no a pak se Praha rozrostla) Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na římské číslice v názvech. To je medle ok, ale je to kanonický název, nebo ten má být spíše Ⅱ, nebo II? Zdar, Honza Piškvor Martinec Dne 17. 1. 2018 14:50 napsal uživatel "majka" <majka.zem+talk na gmail.com>: 2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> > 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně >
Trocha teorie - správně by to snad mělo být podle údajů ČÚZK <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx> A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015. Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská", "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala alt_name, protože s tím vyhledávače měly problémy. A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec neexistovaly. Jako příklad je ulice U Panelárny <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se nacházející používající tuhle adresu totiž (snad až na jedinou výjimku) do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK 11.09.2014 oficiálně zaveden. Asi jsem Ti moc nepomohla, co říkáš? Majka _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/a5878864/attachment.html>

17.1.2018 06:29:15 (#5)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-17, 14:10 GMT, Jan Martinec wrote: zobrazit citaci
> Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na > římské číslice v názvech. To je medle ok, ale je to kanonický > název, nebo ten má být spíše Ⅱ, nebo II?
To už mi připadne jako kravina. Nezlomitelná mezera má svoje výhody, ale Ⅱ mi připadne jako čistý manýrismus. Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Quod fuimus, estis; quod sumus, vos eritis.

17.1.2018 10:14:47 (#6)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
To se mi zase povedlo kopnout do něčeho fajného... O metafyziku mi v tomto případě opravdu moc nejde - když končí Vinohradská a začíná Černokostelecká, tak končí Vinohradská a začíná Černokostelecká. To mě vážně netrápí. Taky mi nedělá problém přejmenovat celou ulici, kdykoliv kdy se její název změní. Když si všimnu, že to opravdu mám přepsat, tak to díky systému pojede téměř samo. alt_name a loc_name se zatím taky nehodlám ani dotknout. O Římských číslicích můžeme debatovat, ještě chvíli na ně asi nenarazím. Možná bych se dokonce přikláněl k tomu, že ty unicode věci jsou možná i dobře, ale to je na délší debatu. Teď ale naprosto reálně chci vědět, zda se ta ulice má jmenovat "K Jezeru" nebo "K Jezeru", protože naprosto odmítám možnost, že to jsou dvě různé ulice. Výhledově to asi chce na wiki napsat, jak se máme v takovýchto situacích zachovat. Pokud například zvládneme udržet správné názvy v relacích, tak bych měl být schopen dohlížet na nbsp a podobné minimálně pro celou Prahu. Shodneme se tedy na tom, že varianta 4 je bezpečná? Systém bude jen polo-automatický, takže pokud narazí na něco divného, tak nejspíše zase napíšu sem. @Matěj: Podle ČÚZK žádné díly neexistují a basta! :) Matej 2018-01-17 18:29 GMT+01:00 Matěj Cepl <mcepl na cepl.eu>: zobrazit citaci
> On 2018-01-17, 14:10 GMT, Jan Martinec wrote: > > Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na > > římské číslice v názvech. To je medle ok, ale je to kanonický > > název, nebo ten má být spíše Ⅱ, nebo II? > > To už mi připadne jako kravina. Nezlomitelná mezera má svoje > výhody, ale Ⅱ mi připadne jako čistý manýrismus. > > Matěj > -- > http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz > GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 > > Quod fuimus, estis; quod sumus, vos eritis. > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/cb938dc0/attachment.html>

18.1.2018 01:01:25 (#7)
gravatar

jzvc

<jzvc at tpfree.net>
588
Dne 17.1.2018 v 14:49 majka napsal(a): zobrazit citaci
> > > 2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com > <mailto:lieskovsky.matej na gmail.com>>: > > > 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně > > > Trocha teorie - správně by to snad mělo být podle údajů ČÚZK
To se obavam ze je dost naivni ... vzhledem ke kvalite dat. Jinak ad nedelitelna mezera, podle me je to zbytecnej udaj navic dost casto komplikujici spoustu veci (co si budem rikat, je to mnoha editory nesdelitelna informace a o renederu ani nemluve). Nehlede na to, ze tam tech znaku znamenajicich totez muze byt vicero ... Jednak samozrejme unicode ... pak taky napriklad &#xA0; nebo &#160; to se nam to komplikuje coz? A ad unicode znaky ... to bych svym zpusobem prenechal "prirode", jelikoz a protoze u zdroje to nebude (nejmin po dobu nasich zivotu bude pro libovolny podobny data unicode sprosty slovo) a na druhou stranu nema smysl ani nekomu branit to pouzivat. Ostatne, tech znaku ktery v ceskych podminkach maji vyuzitelnost je pomerne dost, jen se obavam, ze opet skoncime u toho, ze na klavesnici nejsou (na ty ostatne neni ani pomlcka). BTW: To ze ulice vznika z nejakyho obecne pouzivanyho pojmenovani danyho mista je asi celkem beznej zpusob. zobrazit citaci
> <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx> > > A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, > jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015. > Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská", > "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. > Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala > alt_name, protože s tím vyhledávače měly problémy. > > A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec > neexistovaly. Jako příklad je ulice U Panelárny > <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se > nacházející používající tuhle adresu totiž (snad až na jedinou výjimku) > do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co > já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK > 11.09.2014 oficiálně zaveden. > > Asi jsem Ti moc nepomohla, co říkáš? > > Majka > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

18.1.2018 06:56:09 (#8)
gravatar

Jan Dudík

<jan.dudik at gmail.com>
356 733
Já bych měl jeden související dotaz. V naší obci ulice oficiálně jména nemají. Ovšem třeba do projektu opravy po mně starosta chtěl, abych tam uvedl určité jméno. Jak případně tagovat takováto neoficiální (= nejsou v žádném registru) jména? JAnD --- Ing. Jan Dudík projekce dopravních staveb tel. 777082195 Dne 18. ledna 2018 1:01 jzvc <jzvc na tpfree.net> napsal(a): zobrazit citaci
> Dne 17.1.2018 v 14:49 majka napsal(a): > >> >> >> 2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com >> <mailto:lieskovsky.matej na gmail.com>>: >> >> >> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně >> >> >> Trocha teorie - správně by to snad mělo být podle údajů ČÚZK >> > > To se obavam ze je dost naivni ... vzhledem ke kvalite dat. > > Jinak ad nedelitelna mezera, podle me je to zbytecnej udaj navic dost > casto komplikujici spoustu veci (co si budem rikat, je to mnoha editory > nesdelitelna informace a o renederu ani nemluve). > > Nehlede na to, ze tam tech znaku znamenajicich totez muze byt vicero ... > > Jednak samozrejme unicode ... pak taky napriklad &#xA0; nebo &#160; to se > nam to komplikuje coz? > > > A ad unicode znaky ... to bych svym zpusobem prenechal "prirode", jelikoz > a protoze u zdroje to nebude (nejmin po dobu nasich zivotu bude pro > libovolny podobny data unicode sprosty slovo) a na druhou stranu nema smysl > ani nekomu branit to pouzivat. > > Ostatne, tech znaku ktery v ceskych podminkach maji vyuzitelnost je > pomerne dost, jen se obavam, ze opet skoncime u toho, ze na klavesnici > nejsou (na ty ostatne neni ani pomlcka). > > BTW: To ze ulice vznika z nejakyho obecne pouzivanyho pojmenovani danyho > mista je asi celkem beznej zpusob. > > <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytova >> ni-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni- >> prvky-a-uzemne-evidencni-jednotky.aspx> >> >> A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, >> jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015. >> Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská", >> "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. >> Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala >> alt_name, protože s tím vyhledávače měly problémy. >> >> A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec >> neexistovaly. Jako příklad je ulice U Panelárny >> <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se >> nacházející používající tuhle adresu totiž (snad až na jedinou výjimku) >> do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co >> já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK >> 11.09.2014 oficiálně zaveden. >> >> Asi jsem Ti moc nepomohla, co říkáš? >> >> Majka >> >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> >> > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/7191b4c5/attachment.html>

18.1.2018 08:45:14 (#9)
gravatar

majka

<majka.zem+talk at gmail.com>
718 2573
Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích pak přesunout do name 2018-01-18 6:56 GMT+01:00 Jan Dudík <jan.dudik na gmail.com>: zobrazit citaci
> Já bych měl jeden související dotaz. > V naší obci ulice oficiálně jména nemají. > Ovšem třeba do projektu opravy po mně starosta chtěl, abych tam uvedl > určité jméno. Jak případně tagovat takováto neoficiální (= nejsou v žádném > registru) jména? >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/bb381891/attachment.html>

18.1.2018 09:17:58 (#10)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
2018-01-18 8:45 GMT+01:00 majka <majka.zem+talk na gmail.com>: zobrazit citaci
> Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích pak > přesunout do name
Na cedulích? Jednou mně tady bylo řečeno, že cedule jsou irelevatní a že směrodatná jsou data ČÚZK. -- Michal Fabík

18.1.2018 10:46:54 (#11)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Wed 2018-01-17 13:49:08, Matej Lieskovský wrote: zobrazit citaci
> Ahoj! > > Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu > street relací a tak narážím na různé podivnosti v databázi, kterých bych si > jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té > samé ulice mají různé názvy, což chytá i takové prkotiny, jako je > nedělitelná mezera (nbsp). > > Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k > žádnému konsenzu to (pokud vím) nevedlo. > > Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. > Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou > synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do > tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak > opravovat. > > Co mám dělat? > > 1) Odstraňuj nbsp z názvů ulic
1). ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v nazvech. A podle toho dal. Do te doby... Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 181 bytes Desc: Digital signature URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/b2e7e71b/attachment.sig>

18.1.2018 11:02:52 (#12)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
Dne 18.1.2018 v 09:17 Michal Fabík napsal(a): zobrazit citaci
> 2018-01-18 8:45 GMT+01:00 majka <majka.zem+talk na gmail.com>: >> Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích pak >> přesunout do name > > Na cedulích? Jednou mně tady bylo řečeno, že cedule jsou irelevatní a > že směrodatná jsou data ČÚZK. >
No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí na OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to zmapováno i podle cedule (alt_name?). (Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím to o dlouhém večeru přeložit: https://wiki.openstreetmap.org/wiki/Good_practice#Map_what.27s_on_the_ground ) Zdar, HPM

18.1.2018 11:08:37 (#13)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
2018-01-18 11:02 GMT+01:00 Jan Martinec <jan na martinec.name>: zobrazit citaci
> No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí na > OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to zmapováno i > podle cedule (alt_name?). > > (Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím to o > dlouhém večeru přeložit: > https://wiki.openstreetmap.org/wiki/Good_practice#Map_what.27s_on_the_ground
Takhle jo, _i_ podle cedule, do alt_name. Prý by ale cedule (resp. podoba názvu na ní) nemá sloužit jako zdroj pro name. -- Michal Fabík

18.1.2018 11:18:02 (#14)
gravatar

Marián Kyral

<mkyral at email.cz>
2504 2837
---------- Původní e-mail ---------- Od: Michal Fabík <michal.fabik na gmail.com> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> Datum: 18. 1. 2018 11:09:54 Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic "2018-01-18 11:02 GMT+01:00 Jan Martinec <jan na martinec.name>: zobrazit citaci
> No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí na > OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to zmapováno
i zobrazit citaci
> podle cedule (alt_name?). > > (Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím to
o zobrazit citaci ground Takhle jo, _i_ podle cedule, do alt_name. Prý by ale cedule (resp. podoba názvu na ní) nemá sloužit jako zdroj pro name. " Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1. máje", "Kpt. Jaroše", "Nám. Svobody"... To je pravda. Do name by se to mělo rozepsat. Ale jinak nevidím důvod, proč do name tu ceduli nepřepsat. Marián " -- Michal Fabík _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz " ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/9d491d48/attachment.html>

18.1.2018 01:54:19 (#15)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-18, 10:18 GMT, Marián Kyral wrote: zobrazit citaci
> Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1. > máje", "Kpt. Jaroše", "Nám. Svobody"...
Já jsem měl na mysli spíše ulici V jámě. Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Quod fuimus, estis; quod sumus, vos eritis.

18.1.2018 02:30:23 (#16)
gravatar

Marián Kyral

<mkyral at email.cz>
2504 2837
---------- Původní e-mail ---------- Od: MatějCepl <mcepl na cepl.eu> Komu: talk-cz na openstreetmap.org Datum: 18. 1. 2018 14:02:59 Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic "On 2018-01-18, 10:18 GMT, Marián Kyral wrote: zobrazit citaci
> Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1. > máje", "Kpt. Jaroše", "Nám. Svobody"...
Já jsem měl na mysli spíše ulici V jámě. " Tam je problém, pravidla pravopisu se občas mění a záleží jak se k tomu postaví místní samospráva (ta co pojmenovává ulice). Někde se snaží mít to dle pravidel, jinde lpí na starém názvu a někde to neřeší a píší si to jak chtějí - jinak je to v KM, jinak v registrech, půlka cedulí tak, druhá půlka jinak. Už nevím, kde jsem to viděl/četl, ale stalo se, že zastupitelé schválili určitý název, ale do KM se (zřejmě chybou úředníka) dostalo něco trochu jiného. Pro případ výše jsou podle mně možné obě možnosti, záleží na kontextu: V jámě - v nějaké obecné rýze, která jámu připomíná V Jámě - dané místo je jmenuje Jáma. Bez bližší znalosti místa je těžké říct, jak je to správně. A už vůbec nedokáži říct, odkud se to má brát. Marián " Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Quod fuimus, estis; quod sumus, vos eritis. _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz " ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/7218223a/attachment.html>

18.1.2018 02:38:02 (#17)
gravatar

Mikoláš Štrajt

<strajt9 at seznam.cz>
245 40
Uliční cedule jsou navíc typicky psány CAPS LOCKem, takže to neulehčují. -- Severák ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/95bd9274/attachment.html>

18.1.2018 02:41:02 (#18)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
Ahoj, 4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal). 2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz>: zobrazit citaci
> ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working > group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v > nazvech. A podle toho dal. Do te doby... >
Budeme se ptát data working group, jestli chtějí v rámci celého světa v názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém textu se prostě např. po jednopísmenných předložkách píše nezlomitelná mezera. Ale tahle debata už tu proběhla. Římské číslice v Unicode jsou úplně jiná situace a do názvů nepatří. Viz Unicode Standard 10.0.0, kapitola 22.3 (s. 798) [1]; TLDR existují jen kvůli východoasijským zemím: „For most purposes, it is preferable to compose the Roman numerals from sequences of the appropriate Latin letters. However, the uppercase and lowercase variants of the Roman numerals through 12, plus L, C, D, and M, have been encoded in the Number Forms block (U+2150..U+218F) for compatibility with East Asian standards. Unlike sequences of Latin letters, these symbols remain upright in vertical layout. Additionally, in certain locales, compact date formats use Roman numerals for the month, but may expect the use of a single character.“ -- Petr Kadlec / Mormegil [1]: https://www.unicode.org/versions/Unicode10.0.0/ch22.pdf ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/19d5a376/attachment.html>

18.1.2018 05:36:18 (#19)
gravatar

jzvc

<jzvc at tpfree.net>
588
Dne 18.1.2018 v 14:41 Petr Kadlec napsal(a): zobrazit citaci
> Ahoj, > > 4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal). > > 2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz > <mailto:pavel na ucw.cz>>: > > ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working > group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v > nazvech. A podle toho dal. Do te doby... > > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém > textu se prostě např. po jednopísmenných předložkách píše nezlomitelná > mezera.
Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam vedet, ze v dany lokalite ma ten text spojit. Ale tahle debata už tu proběhla. zobrazit citaci
> > Římské číslice v Unicode jsou úplně jiná situace a do názvů nepatří. Viz > Unicode Standard 10.0.0, kapitola 22.3 (s. 798) [1]; TLDR existují jen > kvůli východoasijským zemím: „For most purposes, it is preferable to > compose the Roman numerals from sequences of the appropriate Latin > letters. However, the uppercase and lowercase variants of the Roman > numerals through 12, plus L, C, D, and M, have been encoded in the > Number Forms block (U+2150..U+218F) for compatibility with East Asian > standards. Unlike sequences of Latin letters, these symbols remain > upright in vertical layout. Additionally, in certain locales, compact > date formats use Roman numerals for the month, but may expect the use of > a single character.“
Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu. Na druhou stranu existuji znaky, trebas (c), coz ve skutecnosti je jeden znak, a tudiz by to i jako jeden znak melo byt pouzivano. zobrazit citaci
> > -- Petr Kadlec / Mormegil
A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises basne) a ne minus -. zobrazit citaci
> > [1]: https://www.unicode.org/versions/Unicode10.0.0/ch22.pdf > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

18.1.2018 05:49:15 (#20)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
No...ulice je tam od 13.století, zatímco hospoda vznikla i zanikla v době, k níž ještě existují pamětníci - jmenovala se hospoda podle ulice, nikoli naopak (dokonce vedle Jámy byla kavárna Kyvadlo). Velké "J" by tam sice mělo být podle nového pravopisu, byť je ulice asi pojmenovaná podle morové jámy, která pravděpodobně pojmenování ani neměla, ale s tou jednoznačností jména je to hodně vratké ;) Zdar, HPM Dne 18. 1. 2018 16:02 napsal uživatel "Matěj Cepl" <mcepl na cepl.eu>: On 2018-01-18, 13:30 GMT, Marián Kyral wrote: zobrazit citaci
> Tam je problém, pravidla pravopisu se občas mění a záleží jak > se k tomu postaví místní samospráva (ta co pojmenovává ulice).
Point nebylo velké nebo malé písmeno (a tady je zcela nepochybně velké, protože se jedná o bývalou hospodu Jáma, https://www.openstreetmap.org/way/4387743), ale jednopísmenová předložka, která si zaslouží oddělit od druhého slova nezlomitelnou mezerou, což je co jsem v tom textu měl. Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Do not long for the night, when people vanish in their place. Be careful, do not turn to evil; for you have preferred this to affliction. -- Job 36:20f (NASB) _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/d824622f/attachment.html>

18.1.2018 05:57:11 (#21)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
Ahoj, 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>: zobrazit citaci
> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze > typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet > pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat > pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam > vedet, ze v dany lokalite ma ten text spojit. >
Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale nežijeme v platónském světě názvů, my vyrábíme data pro software a tento software pro reprezentaci textových dat používá Unicode. Proto bychom měli vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z databáze OSM stáhnu seznam všech ulic, chci to tam mít. zobrazit citaci
> Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by nikdy > nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu. >
E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“, tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil správně, nebo jakožecože? zobrazit citaci
> -- Petr Kadlec / Mormegil > > > A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises basne) a > ne minus -. >
„-“ není minus o nic víc než pomlčka (minus je „−“). A „--“ není a nemá být pomlčka. -- Petr Kadlec / Mormegil [1]: http://prirucka.ujc.cas.cz/?id=880 ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/28769eb8/attachment.html>

18.1.2018 06:23:17 (#22)
gravatar

Marián Kyral

<mkyral at email.cz>
2504 2837
---------- Původní e-mail ---------- Od: Petr Kadlec <petr.kadlec na gmail.com> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> Datum: 18. 1. 2018 17:58:17 Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic " Ahoj, 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net(mailto:jzvc na tpfree.net)>: "Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam vedet, ze v dany lokalite ma ten text spojit. " Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale nežijeme v platónském světě názvů, my vyrábíme data pro software a tento software pro reprezentaci textových dat používá Unicode. Proto bychom měli vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z databáze OSM stáhnu seznam všech ulic, chci to tam mít.   " Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V" musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu? Marián ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/518cfb2b/attachment.html>

18.1.2018 06:26:16 (#23)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité znaky jako ekvivalentní. HPM Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>: zobrazit citaci
> > ---------- Původní e-mail ---------- > Od: Petr Kadlec <petr.kadlec na gmail.com> > Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> > Datum: 18. 1. 2018 17:58:17 > Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic > > Ahoj, > > 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>: > > Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze > typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet > pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat > pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam > vedet, ze v dany lokalite ma ten text spojit. > > > Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, > existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale > nežijeme v platónském světě názvů, my vyrábíme data pro software a tento > software pro reprezentaci textových dat používá Unicode. Proto bychom měli > vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit > odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z > databáze OSM stáhnu seznam všech ulic, chci to tam mít. > > > > Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V" > musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké > kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to > musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu? > > Marián > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/4c328c51/attachment.html>

18.1.2018 06:31:38 (#24)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Nominatim tohle zvládá, Overpass (alespoň standardně) nikoliv - ten bere nápisy s přesností na znak. Díky tomu jsem na tyhle problémy přišel. 2018-01-18 18:26 GMT+01:00 Jan Martinec <jan na martinec.name>: zobrazit citaci
> N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité > znaky jako ekvivalentní. > > HPM > > Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>: > >> >> ---------- Původní e-mail ---------- >> Od: Petr Kadlec <petr.kadlec na gmail.com> >> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> >> Datum: 18. 1. 2018 17:58:17 >> Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic >> >> Ahoj, >> >> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>: >> >> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze >> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet >> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat >> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam >> vedet, ze v dany lokalite ma ten text spojit. >> >> >> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, >> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale >> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento >> software pro reprezentaci textových dat používá Unicode. Proto bychom měli >> vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit >> odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z >> databáze OSM stáhnu seznam všech ulic, chci to tam mít. >> >> >> >> Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V" >> musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké >> kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to >> musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu? >> >> Marián >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> >> > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/9dd802af/attachment.html>

18.1.2018 08:45:16 (#25)
gravatar

Lukáš Karas

<lukas.karas at centrum.cz>
59
Overpass to bere s přesností na znak nebo na binární iterpretaci? Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to chyba toho softwaru. Pokud ale v nějakém jazyce nemá být nějaká sekvence znaků samostatně na konci řádku, je potřeba za ní dát nedělitelnou mezeru. Protože tohle si žádný software z prstu nevycucá. To není psaní názvů pro renderer, to je normální psaní textu v unicode. Lukáš Dne čtvrtek 18. ledna 2018 18:31:38 CET Matej Lieskovský napsal(a): zobrazit citaci
> Nominatim tohle zvládá, Overpass (alespoň standardně) nikoliv - ten bere > nápisy s přesností na znak. Díky tomu jsem na tyhle problémy přišel. > > 2018-01-18 18:26 GMT+01:00 Jan Martinec <jan na martinec.name>: > > N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité > > znaky jako ekvivalentní. > > > > HPM > > > > Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>: > >> ---------- Původní e-mail ---------- > >> Od: Petr Kadlec <petr.kadlec na gmail.com> > >> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> > >> Datum: 18. 1. 2018 17:58:17 > >> Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic > >> > >> Ahoj, > >> > >> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>: > >> > >> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze > >> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo > >> drzet > >> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco > >> tagovat > >> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam > >> vedet, ze v dany lokalite ma ten text spojit. > >> > >> > >> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, > >> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale > >> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento > >> software pro reprezentaci textových dat používá Unicode. Proto bychom > >> měli > >> vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit > >> odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z > >> databáze OSM stáhnu seznam všech ulic, chci to tam mít. > >> > >> > >> > >> Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V" > >> musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké > >> kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na > >> to > >> musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu? > >> > >> Marián > >> > >> _______________________________________________ > >> Talk-cz mailing list > >> Talk-cz na openstreetmap.org > >> https://lists.openstreetmap.org/listinfo/talk-cz > > > > _______________________________________________ > > Talk-cz mailing list > > Talk-cz na openstreetmap.org > > https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 455 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/c9d1c29f/attachment.sig>

18.1.2018 09:42:51 (#26)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Thu 2018-01-18 14:41:02, Petr Kadlec wrote: zobrazit citaci
> Ahoj, > > 4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal). > > 2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz>: > > > ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working > > group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v > > nazvech. A podle toho dal. Do te doby... > > > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
Tohle neni ferova argumentace, ze? Pevne mezery nejsou jen v cestine, takze dava smysl to mit konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je pekna kravina. Kazdopadne... data working group. Vsude nebo nikde. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 181 bytes Desc: Digital signature URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/d3ade972/attachment.sig>

18.1.2018 09:46:09 (#27)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
2018-01-18 20:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>: zobrazit citaci
> Overpass to bere s přesností na znak nebo na binární iterpretaci? > Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou > sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to > chyba > toho softwaru. >
Ano, a zjevně je to přesně tak, viz seznam omezení na https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters (pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez diakritiky). V zásadě si Overpass asi představuje, že si to každý ošetří stylem way["name"~"^V[ \u00A0]Tůních$"] O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo to nějak opravit/dodělat. -- Petr Kadlec / Mormegil ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/643ed1f7/attachment.html>

18.1.2018 11:10:10 (#28)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>: zobrazit citaci
> > Budeme se ptát data working group, jestli chtějí v rámci celého světa v > > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém > > Tohle neni ferova argumentace, ze? > > Pevne mezery nejsou jen v cestine, takze dava smysl to mit > konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je > pekna kravina. Kazdopadne... data working group. Vsude nebo nikde. >
Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil… Namátkou (i když přiznávám, že jsem čekal větší užití). https://www.openstreetmap.org/node/2380290743 https://www.openstreetmap.org/relation/1074049 https://www.openstreetmap.org/node/5337546040 https://www.openstreetmap.org/way/454759316 Či dokonce s ještě zajímavějšími variantami… https://www.openstreetmap.org/node/530880275 Každopádně mi to přijde podobné, jako chtít zakazovat třeba pomlčku; jasně, není na klávesnici a „-“ může víceméně vcelku fungovat taky a renderer si to může vyřešit a kdo má vědět, že to mám do Overpass psát takhle atd. A ano, nástrojům zjevně k ideálu ledacos chybí, ale právě proto je potřeba vylepšovat nástroje, ne zhoršovat data; jinak bychom dodnes na počítačích psali bez diakritiky všichni. -- Petr Kadlec / Mormegil ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/51e780b5/attachment.html>

18.1.2018 11:19:00 (#29)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-17, 21:14 GMT, Matej Lieskovský wrote: zobrazit citaci
> @Matěj: Podle ČÚZK žádné díly neexistují a basta! :)
To je další neřešitelná diskuse: je rozhodující ČÚZK nebo cedule na plotě? Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 A philosopher like Plato, according to Luther's colorful imagery, remains like a cow who looks at a new door, refusing to enter?

18.1.2018 11:22:54 (#30)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-18, 16:49 GMT, Jan Martinec wrote: zobrazit citaci
> No...ulice je tam od 13.století, zatímco hospoda vznikla i zanikla v době, > k níž ještě existují pamětníci - jmenovala se hospoda podle ulice, nikoli > naopak (dokonce vedle Jámy byla kavárna Kyvadlo). Velké "J" by tam sice > mělo být podle nového pravopisu, byť je ulice asi pojmenovaná podle morové > jámy, která pravděpodobně pojmenování ani neměla, ale s tou jednoznačností > jména je to hodně vratké ;)
Tak se omlouvám … o jménu blábolím, i když jsem do té hospody chodíval na oběd. A pozitivní na tom je, že alespoň vypadá stejně dobrá jako bývala před těma skoro dvaceti lety. Úžasné. Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 All parts should go together without forcing. You must remember that the parts you are reassembling were disassembled by you. Therefore, if you can't get them together again, there must be a reason. By all means, do not use a hammer. -- IBM maintenance manual, 1925

19.1.2018 01:36:38 (#31)
gravatar

jzvc

<jzvc at tpfree.net>
588
Dne 18.1.2018 v 17:57 Petr Kadlec napsal(a): zobrazit citaci
> Ahoj, > > 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net <mailto:jzvc na tpfree.net>>: > > Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze > typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo > drzet pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes > neco tagovat pro reneder, coz se v OSM vyslovene zapovida. Spravne > by mel reneder sam vedet, ze v dany lokalite ma ten text spojit. > > > Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, > existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale > nežijeme v platónském světě názvů, my vyrábíme data pro software a tento > software pro reprezentaci textových dat používá Unicode. Proto bychom > měli vzít název a podle toho, jak se má správně psát,[1] bychom měli > zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když > si z databáze OSM stáhnu seznam všech ulic, chci to tam mít.
Ja chci a chci a chci ... to je presne tvuj pristup. Nazev se pise s mezerou, a znak nedelitelny mezery v zadnych pravidlech ani v zadnych datech NEEXISTUJE!. Jestli je tvuj SW hloupej a neumi implementovat pravidla pravopisu, je to problem toho SW, ale netahej to do dat, tam to nema co pohledavat. Znak nedelitelny mezery nema ani naprosto nic spolecnyho s unicode, jen tam ma nejakou reprezentaci, stejne jako tuny jinych znaku. Ja zase chci, aby se spravne pouzivaly ligatury, takze ti do name misto tech dvou znaku latinky dam ten jeden znak unicode kterej resi tu konkretni ligaturu. Sem vazne zvedav, jak v tom pak budes neco hledat. Opet, je to vec SW aby to pouzil, ale nema to co pohledavat v datech. Mimochodem, ukaz mi jedinyho cloveka na tyhle planete, kterej kdyz pise text na klavesnici, tak misto mezerniku pouziva ctrl/alt/... . A pak chci taky videt, kde ma nbsp zadat nekdo z telefonu. zobrazit citaci
> > Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by > nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu. > > > E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s > tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“, > tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil > správně, nebo jakožecože?
Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze (a OSM neni nic jineho) funguji. Protoze v datech ma byt castka a oznaceni meny ... zvlast. zobrazit citaci
> > -- Petr Kadlec / Mormegil > > > A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises > basne) a ne minus -. > > > „-“ není minus o nic víc než pomlčka (minus je „−“). A „--“ není a nemá > být pomlčka. > > -- Petr Kadlec / Mormegil > > [1]: http://prirucka.ujc.cas.cz/?id=880 > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

19.1.2018 01:51:42 (#32)
gravatar

Karel Volný

<kavol at seznam.cz>
568
zobrazit citaci
> Ja chci a chci a chci ... to je presne tvuj pristup. Nazev se pise > s mezerou, a znak nedelitelny mezery v zadnych pravidlech ani v zadnych > datech NEEXISTUJE!
popravdě, přístup, kdy někdo normálně vyjádří své zbožné přání, je mi podstatně sympatičtější, než když někdo něco označuje za prostý fakt, bez důkazu a ve zjevném rozporu s realitou - pakliže "v zadnych datech NEEXISTUJE", zřejmě neexistuje ani tato diskuse, neboť ta se rozvinula pod mailem o tom, že v datech OSM nějaké ty nbsp máme ... ... zobrazit citaci
> > > Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by > > > nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec > > > renederu. > > > > E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s > > tím má společného renderer? Jako že když existuje podnik ?Vše za $0,99?, > > tak tam mám psát ?Vše za USD0,99? a je věcí rendereru, aby to vykreslil > > správně, nebo jakožecože? > > Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze > (a OSM neni nic jineho) funguji. Protoze v datech ma byt castka a > oznaceni meny ... zvlast.
rád bych viděl nějakou vzorovou implementaci toho nehloupého SW, ve které bude fungovat výše uvedený příklad, s tím, že označení měny bude zvlášť když tedy, ještě jednou zdůrazňuji z citace: "... v OSM by NIKDY NIKDE byt nemel ..." K. ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 195 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/57e355f8/attachment.sig>

19.1.2018 02:24:00 (#33)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
Ahoj, 2018-01-19 13:36 GMT+01:00 jzvc <jzvc na tpfree.net>: zobrazit citaci
> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net <mailto:jzvc na tpfree.net > >>: > >> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, >> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale >> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento >> software pro reprezentaci textových dat používá Unicode. Proto bychom >> měli vzít název a podle toho, jak se má správně psát,[1] bychom měli >> zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když >> si z databáze OSM stáhnu seznam všech ulic, chci to tam mít. >> > > Ja chci a chci a chci ... to je presne tvuj pristup.
Mohl bys prosím přestat vyskakovat jako čertík z krabičky a normálně argumentovat? Kdyby to aspoň bylo na téma prezidentských voleb nebo něco, ale kvůli mezerám v OSM se snad nemusíme takhle hádat? zobrazit citaci
> Nazev se pise s mezerou, a znak nedelitelny mezery v zadnych pravidlech > ani v zadnych datech NEEXISTUJE!. Jestli je tvuj SW hloupej a neumi > implementovat pravidla pravopisu, je to problem toho SW, ale netahej to do > dat, tam to nema co pohledavat. Znak nedelitelny mezery nema ani naprosto > nic spolecnyho s unicode, jen tam ma nejakou reprezentaci, stejne jako tuny > jinych znaku. >
Unicode specifikuje způsob reprezentace textových dat v počítačích. To je jeho podstata. Součástí toho standardu reprezentace je definice sémantiky těch jednotlivých codepointů. Odkaz třeba na IJP ÚJČ jsem sem dával už předtím. Aby každý software na světě nemusel implementovat pravidla psaní ve všech možných jazycích a kódováních zcela od nuly, vzniknul Unicode. zobrazit citaci
> Ja zase chci, aby se spravne pouzivaly ligatury, takze ti do name misto > tech dvou znaku latinky dam ten jeden znak unicode kterej resi tu konkretni > ligaturu. Sem vazne zvedav, jak v tom pak budes neco hledat. Opet, je to > vec SW aby to pouzil, ale nema to co pohledavat v datech. >
Dalo by se bavit o tom, zda je tam chceme mít, ale myslím, že ligatury jsou v Unicode zpravidla jen jako prezentační forma znaků pro zpětnou kompatibilitu, přičemž mají kompatibilní dekompozicí na ty základní znaky, s tím, že dnes by se to mělo nechat na vykreslování, kterému se pomáhá pomocí označení míst, kde se to chová nestandardně (např. na švu slova), pomocí ZWJ/ZWNJ. Takže z tohohle pohledu by se ZWJ/ZWNJ v datech případně objevit mohly, ale ligatury tam, myslím, nepatří. zobrazit citaci
> Mimochodem, ukaz mi jedinyho cloveka na tyhle planete, kterej kdyz pise > text na klavesnici, tak misto mezerniku pouziva ctrl/alt/... . A pak chci > taky videt, kde ma nbsp zadat nekdo z telefonu. >
Takového neznám, ani nevím, jak to s touto debatou souvisí. Jestli tě zajímá někdo, kdo *navíc* k mezerníku používá ctrl/alt/… (fskutčnosti AltGr), když chce napsat nbsp, tak třeba já. A taky píšu české uvozovky a trojtečku místo tří teček. Ale netvrdím, že jsem normální. A už vůbec netvrdím, že to má být povinné a pokud někdo nenapíše (třeba na telefonu, ale i kdekoli jinde) správnou nezlomitelnou mezeru, tak se má vyhodit z OSM a upálit na hranici. zobrazit citaci
> Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by >> nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec >> renederu. >> >> >> E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s >> tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“, >> tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil >> správně, nebo jakožecože? >> > > Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze (a > OSM neni nic jineho) funguji. Protoze v datech ma byt castka a oznaceni > meny ... zvlast. >
Nech si ty nesmyslné ad hominem útoky a vysvětli mi, jak souvisí oddělená reprezentace částky a označení měny s tím, že se do textového pole pro název má psát správně formátovaný název. Nebo snad chceš říct, že v databázi má být předložka a následující obsah … zvlášť? Anebo to prostě nemá s touto diskusí společného nic? -- Petr Kadlec / Mormegil ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/1157c49d/attachment.html>

19.1.2018 02:49:04 (#34)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Thu 2018-01-18 23:10:10, Petr Kadlec wrote: zobrazit citaci
> 2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>: > > > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v > > > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém > > > > Tohle neni ferova argumentace, ze? > > > > Pevne mezery nejsou jen v cestine, takze dava smysl to mit > > konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je > > pekna kravina. Kazdopadne... data working group. Vsude nebo nikde. > > > > Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde > na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil… > Namátkou (i když přiznávám, že jsem čekal větší užití). > https://www.openstreetmap.org/node/2380290743 > https://www.openstreetmap.org/relation/1074049 > https://www.openstreetmap.org/node/5337546040 > https://www.openstreetmap.org/way/454759316 Či dokonce s ještě > zajímavějšími variantami… https://www.openstreetmap.org/node/530880275
Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne "U&nbsp;Lomu". Kazdopadne se nema cenu hadat tady, tohle je na data working group. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 181 bytes Desc: Digital signature URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/5467a302/attachment.sig>

19.1.2018 02:51:04 (#35)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Thu 2018-01-18 23:10:10, Petr Kadlec wrote: zobrazit citaci
> 2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>: > > > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v > > > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém > > > > Tohle neni ferova argumentace, ze? > > > > Pevne mezery nejsou jen v cestine, takze dava smysl to mit > > konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je > > pekna kravina. Kazdopadne... data working group. Vsude nebo nikde. > > > > Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde > na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil… > Namátkou (i když přiznávám, že jsem čekal větší užití). > https://www.openstreetmap.org/node/2380290743 > https://www.openstreetmap.org/relation/1074049 > https://www.openstreetmap.org/node/5337546040 > https://www.openstreetmap.org/way/454759316 Či dokonce s ještě > zajímavějšími variantami… https://www.openstreetmap.org/node/530880275 > > Každopádně mi to přijde podobné, jako chtít zakazovat třeba pomlčku; jasně, > není na klávesnici a „-“ může víceméně vcelku fungovat taky a renderer si > to může vyřešit a kdo má vědět, že to mám do Overpass psát takhle atd. > > A ano, nástrojům zjevně k ideálu ledacos chybí, ale právě proto je potřeba
Hmm. A nemam pocit ze by mail mel v subjektu pevnou mezeru, nebo ze by ve vete co cituju byly pevny mezery. Proste tam nemaj co delat, to je az veci formatovani pro tisk... Stejne nepatrej do name. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 181 bytes Desc: Digital signature URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/e002760f/attachment.sig>

19.1.2018 03:46:29 (#36)
gravatar

Petr Kadlec

<petr.kadlec at gmail.com>
261 1065
Ahoj, 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>: zobrazit citaci
> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne > "U&nbsp;Lomu". >
To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně, protože se o to postará sám Word. Zcela namátkou: Zápis z jednání Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“ nezlomitelnou mezeru. Je to důkaz, není to důkaz? A co se týče státních databází, tak na ty bych v tomto ohledu moc nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela namátkou: IČO 27799719. -- Petr Kadlec / Mormegil ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/9be600c4/attachment.html>

21.1.2018 01:13:51 (#37)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď. Matej 2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>: zobrazit citaci
> Ahoj, > > 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>: > >> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne >> "U&nbsp;Lomu". >> > > To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou > psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to > nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že > ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně, > protože se o to postará sám Word. Zcela namátkou: Zápis z jednání > Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“ > nezlomitelnou mezeru. Je to důkaz, není to důkaz? > > A co se týče státních databází, tak na ty bych v tomto ohledu moc > nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s > pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně > používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela > namátkou: IČO 27799719. > > -- Petr Kadlec / Mormegil > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180121/c901607f/attachment.html>

21.1.2018 07:17:50 (#38)
gravatar

Martin Janda

<jandam at crcdata.cz>
73
Dobry den, jsem PROTI nedelitelnym mezeram (unicode cislicim). Jako programator v nich vidim spis dalsi problemy pri zpracovani. *) nastroje - JOSM, webove nepodporuji zobrazeni nedelitelnych mezer *) nazev ulice s mezerou a nedelitelnou mezerou neni povazovan za stejny. Mozna pomuze normalizace ale ta znamena docela vyznamny overhead. *) nejsem si jisty ze vsechny adresy/adresni body v ulici dodrzi pouziti nbsp. Jedna ulice muze byt na dvou ways na jedne s nbsp a na druhe s normalni mezerou. *) regexp - myslim ze i tady mohou byt problemy. Nemam zde moc skusenosti *) spravne zobrazeni ma byt reseno rendererem i kdyz nebude fungovat ve vsech pripadech spravne Navrh :-) Pokud chcete resit problem pak je to "Ch Martin JANDA 21. 1. 2018 v 1:13, Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď. > > Matej > > 2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>: >> Ahoj, >> >> 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>: >>> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne >>> "U&nbsp;Lomu". >> >> >> To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně, protože se o to postará sám Word. Zcela namátkou: Zápis z jednání Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“ nezlomitelnou mezeru. Je to důkaz, není to důkaz? >> >> A co se týče státních databází, tak na ty bych v tomto ohledu moc nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela namátkou: IČO 27799719. >> >> -- Petr Kadlec / Mormegil >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180121/2b59b77b/attachment.html>

23.1.2018 05:56:34 (#39)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Ahoj! Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6. Co dál? Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk. Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační válce. Matej 2018-01-21 7:17 GMT+01:00 Martin Janda <jandam na crcdata.cz>: zobrazit citaci
> Dobry den, > > jsem PROTI nedelitelnym mezeram (unicode cislicim). Jako programator v > nich vidim spis dalsi problemy pri zpracovani. > *) nastroje - JOSM, webove nepodporuji zobrazeni nedelitelnych mezer > *) nazev ulice s mezerou a nedelitelnou mezerou neni povazovan za stejny. > Mozna pomuze normalizace ale ta znamena docela vyznamny overhead. > *) nejsem si jisty ze vsechny adresy/adresni body v ulici dodrzi pouziti > nbsp. Jedna ulice muze byt na dvou ways na jedne s nbsp a na druhe s > normalni mezerou. > *) regexp - myslim ze i tady mohou byt problemy. Nemam zde moc skusenosti > *) spravne zobrazeni ma byt reseno rendererem i kdyz nebude fungovat ve > vsech pripadech spravne > > Navrh :-) > Pokud chcete resit problem pak je to "Ch > > > Martin JANDA > > 21. 1. 2018 v 1:13, Matej Lieskovský <lieskovsky.matej na gmail.com>: > > Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď. > > Matej > > 2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>: > >> Ahoj, >> >> 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>: >> >>> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne >>> "U&nbsp;Lomu". >>> >> >> To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou >> psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to >> nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že >> ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně, >> protože se o to postará sám Word. Zcela namátkou: Zápis z jednání >> Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“ >> nezlomitelnou mezeru. Je to důkaz, není to důkaz? >> >> A co se týče státních databází, tak na ty bych v tomto ohledu moc >> nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s >> pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně >> používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela >> namátkou: IČO 27799719. >> >> -- Petr Kadlec / Mormegil >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> >> > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/8f99a217/attachment.html>

23.1.2018 06:44:49 (#40)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
On 23.1.2018 17:56, Matej Lieskovský wrote: zobrazit citaci
> Ahoj! > > Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, > případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6. > > Co dál? > > Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo > nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se > dopracujeme k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje > hlavně nástroje pro přispěvatele a konzumenty) opravdu přijde spíš jako > problém pro Talk. Technicky vzato máme od DWG posvěcení si to nějak > rozhodnout lokálně a problémy s globálními nástroji řešit pak. Velmi rád > bych se vyhnul editační válce. > > Matej
Ahoj, jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných zemí, jestli to někde nějak řeší? To typografické pravidlo o jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby se něčím takovým vůbec zabývali... Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří renderer, zas taková věda to snad není. -- Michal Fabík

23.1.2018 08:34:24 (#41)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do TeXových zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na mezinárodní poměry) relativně hodně. 2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: zobrazit citaci
> On 23.1.2018 17:56, Matej Lieskovský wrote: > >> Ahoj! >> >> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, případně >> se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6. >> >> Co dál? >> >> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo >> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme >> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje >> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk. >> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a >> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační >> válce. >> >> Matej >> > > Ahoj, > jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných > zemí, jestli to někde nějak řeší? To typografické pravidlo o > jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I > když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby > se něčím takovým vůbec zabývali... > > Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří > renderer, zas taková věda to snad není. > > -- > Michal Fabík > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/4312a11d/attachment.html>

23.1.2018 09:01:35 (#42)
gravatar

majka

<majka.zem+talk at gmail.com>
718 2573
Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak ještě Francouze, kteří něco takového řeší. Taková Británie je zvyklá, že jim Angličtinu przní kde kdo, a jsou tak nějak nad věcí. České jednopísmenné předložky zkrátka vypadají mimořádně špatně, pokud jsou oddělené na konci řádku / zalomení, už i dvě písmena se při troše vůle dají skousnout, i když mě to tahá za oči. Z toho bych také odhadla, že jsme ze školy v tomhle ohledu podstatně víc vycepovaní než jiné národy. Když se k tomu přidá ještě problém s kódováním češtiny z dřívějška, byly nedělitelné mezery vlastně jen taková drobnost navíc. Do dat bych ale nedělitelné mezery netahala, kromě jiného z toho kouká nutnost to stále kontrolovat a opravovat. Mít to v datech napůl je podle mého k ničemu, a dosáhnout toho, že to všichni a všude budou respektovat, nevidím jako reálné. Navíc udělat to co nejméně komplikované se mi zkrátka líbí nejvíc. 2018-01-23 20:34 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do TeXových > zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na mezinárodní > poměry) relativně hodně. > > > 2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: > >> On 23.1.2018 17:56, Matej Lieskovský wrote: >> >>> Ahoj! >>> >>> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, >>> případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6. >>> >>> Co dál? >>> >>> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo >>> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme >>> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje >>> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk. >>> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a >>> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační >>> válce. >>> >>> Matej >>> >> >> Ahoj, >> jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných >> zemí, jestli to někde nějak řeší? To typografické pravidlo o >> jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I >> když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby >> se něčím takovým vůbec zabývali... >> >> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří >> renderer, zas taková věda to snad není. >> >> -- >> Michal Fabík >> >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/7cf2a154/attachment.html>

23.1.2018 09:10:12 (#43)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Kontrolování a opravování je proveditelné. Teď řeším ty street relace (a školu), ale pak se klidně můžu podívat na nbsp. S "mít to v datech napůl je k ničemu" souhlasím - proto se mi nelíbí možnost 6. 2018-01-23 21:01 GMT+01:00 majka <majka.zem+talk na gmail.com>: zobrazit citaci
> Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se > vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak > ještě Francouze, kteří něco takového řeší. Taková Británie je zvyklá, že > jim Angličtinu przní kde kdo, a jsou tak nějak nad věcí. > > České jednopísmenné předložky zkrátka vypadají mimořádně špatně, pokud > jsou oddělené na konci řádku / zalomení, už i dvě písmena se při troše vůle > dají skousnout, i když mě to tahá za oči. Z toho bych také odhadla, že jsme > ze školy v tomhle ohledu podstatně víc vycepovaní než jiné národy. Když se > k tomu přidá ještě problém s kódováním češtiny z dřívějška, byly > nedělitelné mezery vlastně jen taková drobnost navíc. > > > > Do dat bych ale nedělitelné mezery netahala, kromě jiného z toho kouká > nutnost to stále kontrolovat a opravovat. Mít to v datech napůl je podle > mého k ničemu, a dosáhnout toho, že to všichni a všude budou respektovat, > nevidím jako reálné. Navíc udělat to co nejméně komplikované se mi zkrátka > líbí nejvíc. > > 2018-01-23 20:34 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: > >> Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do >> TeXových zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na >> mezinárodní poměry) relativně hodně. >> >> >> 2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: >> >>> On 23.1.2018 17:56, Matej Lieskovský wrote: >>> >>>> Ahoj! >>>> >>>> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, >>>> případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6. >>>> >>>> Co dál? >>>> >>>> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo >>>> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme >>>> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje >>>> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk. >>>> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a >>>> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační >>>> válce. >>>> >>>> Matej >>>> >>> >>> Ahoj, >>> jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných >>> zemí, jestli to někde nějak řeší? To typografické pravidlo o >>> jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I >>> když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby >>> se něčím takovým vůbec zabývali... >>> >>> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří >>> renderer, zas taková věda to snad není. >>> >>> -- >>> Michal Fabík >>> >>> >>> _______________________________________________ >>> Talk-cz mailing list >>> Talk-cz na openstreetmap.org >>> https://lists.openstreetmap.org/listinfo/talk-cz >>> >> >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> >> > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/150b3602/attachment.html>

23.1.2018 10:01:39 (#44)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
On 23.1.2018 21:01, majka wrote: zobrazit citaci
> Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se > vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak > ještě Francouze, kteří něco takového řeší.
Nejsem si jistý, jestli myslíš "řeší v OSM" nebo "řeší v rámci typografických zásad", ale pokud to druhé, tak se to týká prakticky všech slovanských jazyků, i když teď z hlavy fakt nevím, jak často v těch jednotlivých jazycích nastává situace, že se něco takového vyskytne v místním názvu. -- Michal Fabík

23.1.2018 10:06:08 (#45)
gravatar

Mikoláš Štrajt

<strajt9 at seznam.cz>
245 40
Nbsp IMHO do dat nepatří. Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve smyslu ASCII/ UTF-8 znak 32). Domnívám se, že nad daty OSM operuje dost věcí, které namejí skutečnou podporu Unicode a spíše zneužívají toho, že UTF-8 je zpětně kompatibilní s ASCII. Kromě toho, bílé znaky se strašně těžko debugují. V diskuzi výše byl zmíněn program vlna. Mám za to, že by bylo lepší nedělitelné mezery přidávat až před vykreslováním v preprocesingu. Například německá verze OSM provádí podobným způsobem transliterace nelatinkových abeced. -- Mikoláš Štrajt  / Severák ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/be7ed6d0/attachment.html>

23.1.2018 10:32:00 (#46)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Zase na druhou stranu platí, že pokud se budeme omezovat na to, co zvládá již existující software, tak se nikdy nikam neposuneme. Minimálně výhledově mi přijde jako správné se posouvat směrem k plnohodnotnému Unicode. Souhlasím, že se bílé znaky blbě debugují, ale minimálně bychom mohli protlačit do editorů možnost zobrazovat bílé znaky. Vlna má základní problém v tom, že musíš hlídat, ve kterém jazyce který název je a spoustu podobných blbostí. Například pokud zahodíme i římské číslice, tak bude potřeba tipovat, zda je to "v" nebo římská číslice pět. Část debaty je vlastně o tom, zda je snažší doplňovat nebo zahazovat nbsp. Mně přijde, že se data vždy snadněji zahazují, ale je otázka, jak často je co z toho potřeba. Ono se taky může stát, že teď budeme nbsp mazat a za pár let zase přidávat, protože se SW zlepší. 2018-01-23 22:06 GMT+01:00 Mikoláš Štrajt <strajt9 na seznam.cz>: zobrazit citaci
> Nbsp IMHO do dat nepatří. > > Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve smyslu > ASCII/UTF-8 znak 32). Domnívám se, že nad daty OSM operuje dost věcí, které > namejí skutečnou podporu Unicode a spíše zneužívají toho, že UTF-8 je > zpětně kompatibilní s ASCII. > > Kromě toho, bílé znaky se strašně těžko debugují. > > V diskuzi výše byl zmíněn program vlna. Mám za to, že by bylo lepší > nedělitelné mezery přidávat až před vykreslováním v preprocesingu. > > Například německá verze OSM provádí podobným způsobem transliterace > nelatinkových abeced. > > -- > Mikoláš Štrajt / Severák > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/78bb69ce/attachment.html>

24.1.2018 08:45:21 (#47)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-23, 21:06 GMT, Mikoláš Štrajt wrote: zobrazit citaci
> Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve > smyslu ASCII/ UTF-8 znak 32). Domnívám se, že nad daty OSM > operuje dost věcí, které namejí skutečnou podporu Unicode > a spíše zneužívají toho, že UTF-8 je zpětně kompatibilní > s ASCII.
Jenom pro upřesnění: &nbsp; je mezera, alespoň patří do kategorie WSpace=Y v Unicode (https://en.wikipedia.org/wiki/Whitespace_character). Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Experience is what you get when you don't get what you want. -- Dan Stanford

24.1.2018 09:23:51 (#48)
gravatar

Jan Dudík

<jan.dudik at gmail.com>
356 733
&nbsp; není mezera, je to html zápis mezery, která jinak není vidět :-) Přijde mi, že tato problematika je zatím příliš futuristická, v době, kdy v mapě chybí ještě sposuta existujících objektů, my už řešíme drobné grafické finesy. (což nemusí být nutně špatně) A druhá věc - jak často nastává případ, že je nutné zalomit dlouhý název, který obsahuje někde kolem poloviny nedělitelnou mezeru? Většina názvů jí obsahuje hned na začátku (V°Jámě, U°Dlouhého mostu), byť se najdou Výjimky (Rokytnice v°Orlických horách, U°Karla°IV.) JAnD --- Ing. Jan Dudík projekce dopravních staveb tel. 777082195 Dne 24. ledna 2018 8:45 Matěj Cepl <mcepl na cepl.eu> napsal(a): zobrazit citaci
> On 2018-01-23, 21:06 GMT, Mikoláš Štrajt wrote: > > Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve > > smyslu ASCII/ UTF-8 znak 32). Domnívám se, že nad daty OSM > > operuje dost věcí, které namejí skutečnou podporu Unicode > > a spíše zneužívají toho, že UTF-8 je zpětně kompatibilní > > s ASCII. > > Jenom pro upřesnění: &nbsp; je mezera, alespoň patří do > kategorie WSpace=Y v Unicode > (https://en.wikipedia.org/wiki/Whitespace_character). > > Matěj > -- > http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz > GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 > > Experience is what you get when you don't get what you want. > -- Dan Stanford > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180124/28532ebe/attachment.html>

24.1.2018 10:17:29 (#49)
gravatar

Lukáš Karas

<lukas.karas at centrum.cz>
59
zobrazit citaci
> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří > renderer, zas taková věda to snad není.
Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla. Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český název špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není. Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka" který to přeci dokázal před deseti lety. Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu napsat renderer kde arabský název obsahuje číslovku! Otevřete trochu svoji mysl a myslete prosím za hranice českého rybníčku. Lukáš ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 455 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180124/97d0f236/attachment.sig>

25.1.2018 08:55:05 (#50)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
2018-01-24 22:17 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>: zobrazit citaci
>> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří >> renderer, zas taková věda to snad není. > > Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta > jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě > zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo > mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla. > > Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český název > špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není. > Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka" který > to přeci dokázal před deseti lety. > > Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit > zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu > napsat renderer kde arabský název obsahuje číslovku!
Tohle mně zas přijde jako argumentace nefungující, neřkuli přímo záměrně zlomyslnou, komunikací mezi uživatelem a autorem rendereru. Přece když budu chtít, aby si japonský renderer správně poradil s nějakým obskurním aspektem české typografie, tak autorovi neřeknu: "V českých názvech máte špatně pevné mezery, spravte si to, tohle si přece můžete vyřešit, vlnka to umí taky". Naopak, vysvětím, proč je to důležité, popíšu jednotlivá pravidla, dám příklady, třeba ukážu _jak_ to ta vlnka dělá (a ne, že už to dělá deset let). Podobně, až budu mít ve svém rendereru problém se zobrazováním arabštiny, zeptám se někoho, kdo umí arabsky. Asi to vidím naivně, ale s jazykovými daty pracuju a přesně taková komunikace je pro mě naprosto normální a v podstatě nevyhnutelná. Podle mě prostě ty pevné mezery jsou tagging for the renderer. Pevná mezera slouží ke správnému _zobrazení_, tj. renderingu, žádnou věcnou informaci nenese. -- Michal Fabík

25.1.2018 09:32:19 (#51)
gravatar

Petr Slavíček, Bc.

<pslavicek at seznam.cz>
12
Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se smí? "Petr _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz " ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/9bf4cd74/attachment.html>

25.1.2018 09:41:30 (#52)
gravatar

Mikoláš Štrajt

<strajt9 at seznam.cz>
245 40
"Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla. Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český název špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není. Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka" který to přeci dokázal před deseti lety. Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu napsat renderer kde arabský název obsahuje číslovku! Otevřete trochu svoji mysl a myslete prosím za hranice českého rybníčku." Jenomže autor rendereru/stylu musí myslet zároveň globálně i lokálně. Musím mít kupříkladu vyřešeny fonty - můžu mít například nějaký primární font, který se mi líbí vzhledem, ale pak musím mít fallback pro arabštinu/ čínštinu/cyrilici. Dále pak může provádět transliteraci nepřeložených názvů (jako to dělá německý styl na https://www.openstreetmap.de/karte.html). Tohle je v praxi celkem užitečné - když neumím azbuku a chci studovat mapu nějakého ruského města, hned se líp zorientuju. V neposlední řadě se často děje, že se názvy na mapě zobrazují v jazyce toho, kdo si mapu prohlíží/provozuje. Mapy.cz zobrazují mapu světa s českými názvy, Kosmosnimki zase s ruskými. Další věc je, že ne všechny typografický/kartografický vychytávky jdou provést ve všech jazycích - kupříkladu mapy.cz mají části obce napsané caps lockem (ŘEPORYJE) oproti samostatným obcím, které jsou bez caps locku (Ořech). Tohle ale jde udělat jen v jazycích, které rozlišují velká a malá písmena. * * * Jinak "cartography labeling" je samostatná věda. A správné vykreslování Unicode je další samostatná věda. -- Mikoláš ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/2becd3db/attachment.html>

25.1.2018 09:45:26 (#53)
gravatar

Lukáš Karas

<lukas.karas at centrum.cz>
59
Ano, řekl bych že je žo naivní pohled. Pevné mezery automaticky nepřidají ani webové prohlížeče za kterými stojí obrovské týmy vývojárů. Proto je potřeba je v datech mít - jak ve webových stránkách i OpenStreetMap. Pokud tvrdíš že se jedná pro tagování pro renderer, protože to slouží pouze ke správnému zobrazení, tak mi tedy vysvětli proč píšeme velká písmena na záčátku názvů a po předložkách? To taky slouží jen ke správnému zobrazební. Vždyť v datech může bez problémů být "kralupy nad vltavou", "na poříčí". To že tam někde mají být velká písmena si přeci může domyslet renderer... Lukáš Dne čtvrtek 25. ledna 2018 8:55:05 CET Michal Fabík napsal(a): zobrazit citaci
> 2018-01-24 22:17 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>: > >> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří > >> renderer, zas taková věda to snad není. > > > > Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako > > spousta > > jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy > > rozumě > > zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. > > Někdo > > mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická > > pravidla. > > > > Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český > > název špatně zobrazuje a že si to přeci může vyřešit. Taková věda to > > přeci není. Ještě těch chudákům vývojářům můžete poradit že exituje > > probram "vlnka" který to přeci dokázal před deseti lety. > > > > Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má > > vykreslit zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) > > nedokážu napsat renderer kde arabský název obsahuje číslovku! > > Tohle mně zas přijde jako argumentace nefungující, neřkuli přímo > záměrně zlomyslnou, komunikací mezi uživatelem a autorem rendereru. > Přece když budu chtít, aby si japonský renderer správně poradil s > nějakým obskurním aspektem české typografie, tak autorovi neřeknu: "V > českých názvech máte špatně pevné mezery, spravte si to, tohle si > přece můžete vyřešit, vlnka to umí taky". Naopak, vysvětím, proč je to > důležité, popíšu jednotlivá pravidla, dám příklady, třeba ukážu _jak_ > to ta vlnka dělá (a ne, že už to dělá deset let). Podobně, až budu mít > ve svém rendereru problém se zobrazováním arabštiny, zeptám se někoho, > kdo umí arabsky. Asi to vidím naivně, ale s jazykovými daty pracuju a > přesně taková komunikace je pro mě naprosto normální a v podstatě > nevyhnutelná. > > Podle mě prostě ty pevné mezery jsou tagging for the renderer. Pevná > mezera slouží ke správnému _zobrazení_, tj. renderingu, žádnou věcnou > informaci nenese. > > -- > Michal Fabík > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 455 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/11cc6e77/attachment.sig>

25.1.2018 11:23:03 (#54)
gravatar

Mikoláš Štrajt

<strajt9 at seznam.cz>
245 40
jak tahle debata pokračuje dál, začínám mít chuť napsat program vlna pro mapnik, abych dokázal, že to jde. ;-) -- Severák ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/9f395a67/attachment.html>

25.1.2018 11:24:48 (#55)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-01-25, 08:32 GMT, Petr Slavíček Bc wrote: zobrazit citaci
> Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se > smí?
Přesně tak. Rozdíl je v tom, že rendererů je mnoho a ještě mnoho jich vznikne a nechceme dělat data, tak aby jeden konkrétní to zvládnul a ostatní ne. Množství rendererů, které pracují s přetahováním předložek na novou řádku? 0 A v budoucnosti takových rendererů vznikne? Hádám, že taky nula. Množství rendererů, kterým se ublíží když budou mít nedělitelnou mezeru v názvu? Nevím, ale řekl bych že se to také bude limitně blížit nule. Matěj -- http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 May you come to the attention of those in authority. May you find what you are looking for. May you live in interesting times. -- claimed to be a Chinese proverb, but its origin is disputed first documented use Frederic R. Coudert, Proceedings of the Academy of Political Science, 1939

25.1.2018 12:00:51 (#56)
gravatar

Michal Fabík

<michal.fabik at gmail.com>
74 3435
2018-01-25 9:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>: zobrazit citaci
> Ano, řekl bych že je žo naivní pohled. Pevné mezery automaticky nepřidají ani > webové prohlížeče za kterými stojí obrovské týmy vývojárů. Proto je potřeba je > v datech mít - jak ve webových stránkách i OpenStreetMap.
Je potřeba je mít v datech, protože nějaké obrovské týmy nějakých vývojářu v nějakém úplně nesouvisejícím projektu fungujícím podle jiných pravidel něco nedělá? No dobře. Navíc se IMHO nedá srovnávat prohlížeč (který počítá s tím, že do něho může být nalito prakticky cokoliv, včetně textů, u kterých se dá jen těžko určit jazyk, ve kterém jsou napsány) a OSM renderer, který může počítat s až puntičkářsky systematizovanými daty. zobrazit citaci
> Pokud tvrdíš že se jedná pro tagování pro renderer, protože to slouží pouze ke > správnému zobrazení, tak mi tedy vysvětli proč píšeme velká písmena na záčátku > názvů a po předložkách? To taky slouží jen ke správnému zobrazební. > Vždyť v datech může bez problémů být "kralupy nad vltavou", "na poříčí". > To že tam někde mají být velká písmena si přeci může domyslet renderer...
Velká písmena jsou nositeli významu. "Černá Hora" je město, "Černá hora" se může jmenovat kdejaký kopec. V ulici, kde bydlím, je kadeřnictví, které se oficiálně jmenuje "Kadeřnictví" - s malým 'k' bych si řekl, že to tam nabouchal nějaký začátečník, který nechápe rozdíl name=* vs. amenity=* vs. description=*. Když uvidím víc velkých písmen vedle sebe, vím, že asi jde o zkratku, a tedy má smysl zjišťovat, jaký je oficiální plný název s rozvinutou zkratkou. Velké písmeno uprostřed slova obvykle znamená, že jde o nějakou moderní složeninu atd. Pevná mezera neříká naprosto nic o popisovaném objektu. Říká jen to, že tato mezera nemá být na konci řádku. -- Michal Fabík

25.1.2018 12:09:21 (#57)
gravatar

Marián Kyral

<mkyral at email.cz>
2504 2837
---------- Původní e-mail ---------- Od: MatějCepl <mcepl na cepl.eu> Komu: talk-cz na openstreetmap.org Datum: 25. 1. 2018 12:03:13 Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic "On 2018-01-25, 08:32 GMT, Petr Slavíček Bc wrote: zobrazit citaci
> Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se > smí?
Přesně tak. Rozdíl je v tom, že rendererů je mnoho a ještě mnoho jich vznikne a nechceme dělat data, tak aby jeden konkrétní to zvládnul a ostatní ne. Množství rendererů, které pracují s přetahováním předložek na novou řádku? 0 A v budoucnosti takových rendererů vznikne? Hádám, že taky nula. Množství rendererů, kterým se ublíží když budou mít nedělitelnou mezeru v názvu? Nevím, ale řekl bych že se to také bude limitně blížit nule. " Zajímavá debata, chvíli souhlasím s jedním, chvíli s druhým. Jak z toho ven? Napadá mně, jestli by nebylo lepší zavést nějakou speciální značku pro render. Když už máme značky pro navigaci a výslovnost. Marián ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/0e990481/attachment.html>

25.1.2018 01:00:54 (#58)
gravatar

Jan Macura

<macurajan at gmail.com>
755 2731
2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: zobrazit citaci
> (...) OSM renderer, který může počítat s až > puntičkářsky systematizovanými daty. >
Tak moc bych si nefandil. H. ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/461975c7/attachment.html>

25.1.2018 02:05:15 (#59)
gravatar

Jakub Jelen

<jakuje at gmail.com>
131 2882
Originalni doraz byl, jestli pouzivat HTML entity &nbsp;, nebo ne. Podle me HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji? Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka diskuze, ktera nevede nikam s desitkami nazoru. Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna reseni podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde mluvime o nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se to mohlo stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se rendery v takovem pripade vubec jmena zalamovat? Mame nejaky priklad? V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by mela byt nedelitelna mezera. Jakub 2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>: zobrazit citaci
> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: > >> (...) OSM renderer, který může počítat s až >> puntičkářsky systematizovanými daty. >> > > Tak moc bych si nefandil. > > H. > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/0b20ddd3/attachment.html>

25.1.2018 10:19:21 (#60)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
@Jakub Jelen: Kdepak, nbsp zmiňuju jen jako relativně časté označení pro zmíněný Unicode znak, který se mi 1) nedaří do Gmailu zadat a 2) není moc dobře vidět. Relevantní dotaz pro Overpas Turbo: http://overpass-turbo.eu/s/vnx 2018-01-25 14:05 GMT+01:00 Jakub Jelen <jakuje na gmail.com>: zobrazit citaci
> Originalni doraz byl, jestli pouzivat HTML entity &nbsp;, nebo ne. Podle me > HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde > explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo > uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji? > > Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro > nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML > entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim > mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez > konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka > diskuze, ktera nevede nikam s desitkami nazoru. > > Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu > na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli > vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna reseni > podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde mluvime o > nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se to mohlo > stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se rendery v > takovem pripade vubec jmena zalamovat? Mame nejaky priklad? > > V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit > podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude > generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by > mela byt nedelitelna mezera. > > Jakub > > > 2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>: >> >> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: >>> >>> (...) OSM renderer, který může počítat s až >>> puntičkářsky systematizovanými daty. >> >> >> Tak moc bych si nefandil. >> >> H. >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

25.1.2018 10:43:08 (#61)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Vypadá to, že minimálně osm.org nbsp řeší správně: https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366 ukazuje, že nic typu "vlna" osm.org nepoužívá https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787 ukazuje, že nedělitelné mezery zobrazí správně (Tedy, alespoň to tak vypadá) U ostatních renderů jsem zatím nenašel vhodný případ. Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka je prostá: chceme nbsp v datech, nebo nikoliv? Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu doplňovat tam, kde ji zatím žádný úsek ulice nemá. 2018-01-25 22:19 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> @Jakub Jelen: Kdepak, nbsp zmiňuju jen jako relativně časté označení > pro zmíněný Unicode znak, který se mi 1) nedaří do Gmailu zadat a 2) > není moc dobře vidět. > > Relevantní dotaz pro Overpas Turbo: http://overpass-turbo.eu/s/vnx > > 2018-01-25 14:05 GMT+01:00 Jakub Jelen <jakuje na gmail.com>: >> Originalni doraz byl, jestli pouzivat HTML entity &nbsp;, nebo ne. Podle me >> HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde >> explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo >> uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji? >> >> Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro >> nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML >> entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim >> mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez >> konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka >> diskuze, ktera nevede nikam s desitkami nazoru. >> >> Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu >> na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli >> vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna reseni >> podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde mluvime o >> nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se to mohlo >> stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se rendery v >> takovem pripade vubec jmena zalamovat? Mame nejaky priklad? >> >> V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit >> podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude >> generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by >> mela byt nedelitelna mezera. >> >> Jakub >> >> >> 2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>: >>> >>> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>: >>>> >>>> (...) OSM renderer, který může počítat s až >>>> puntičkářsky systematizovanými daty. >>> >>> >>> Tak moc bych si nefandil. >>> >>> H. >>> >>> _______________________________________________ >>> Talk-cz mailing list >>> Talk-cz na openstreetmap.org >>> https://lists.openstreetmap.org/listinfo/talk-cz >>> >> >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >>

26.1.2018 12:17:28 (#62)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Vypadá to, že minimálně osm.org nbsp řeší správně: > https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366 > ukazuje, že nic typu "vlna" osm.org nepoužívá > https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787 > ukazuje, že nedělitelné mezery zobrazí správně > (Tedy, alespoň to tak vypadá) > > U ostatních renderů jsem zatím nenašel vhodný případ. > > Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka > je prostá: chceme nbsp v datech, nebo nikoliv? > > Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi > nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých > ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto > problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně > smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se > budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu > doplňovat tam, kde ji zatím žádný úsek ulice nemá.
Zpetne smazat i zpetne doplnit je stejne tezke -- ta mezera jde doplnit algoritmicky -- takze ano, jsem proti 4. (Protoze to rozbije hledani, protoze to neni v oficialnich seznamech, protoze je to tagovani pro renderer, protoze to rozbije lokalni programy snazici se pracovat s OSM daty, a protoze neviditelny znaky jsou skodoliba past na kohokoliv kdo se s timbude snazit pracovat.) DWG navrhovala zeptat se na tagging listu, to by asi byl dalsi rozumny krok. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 181 bytes Desc: Digital signature URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180126/f43de61d/attachment.sig>

26.1.2018 04:01:35 (#63)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Napsal jsem na Tagging. Očekávám flame za 3... 2... 1... Jen tak mimochodem: - hledání to nerozbije, Nominatim umí Unicode Collation - je to v cca polovině oficiálních seznamů, mimo jiné protože office to automaticky doplňuje - teoreticky by se za tagování pro renderer mohly považovat i velká a malá písmena v názvech ulic (OTG jsou celá velkými) - rozumně spolehlivé algoritmické doplnění bude řádově složitější než 100% spolehlivé algoritmické odstranění (leda že bys nám laskavě zveřejnil tvůj program na automatické doplňování nedělitelných mezer) Problém je v tom, že teď nejen že tam ty nedělitelné mezery občas jsou (takže co se má rozbít, to se rozbije), ale taky nejsou zdaleka všude (takže se občas něco renderuje ošklivě a člověka netrkne tak rychle, co se děje) a občas se dvě části TÉ SAMÉ ULICE liší v tom, zda mají nedělitelnou mezeru (takže se rozbije i to, co by jinak nedělitelné mezery zkouslo). 2018-01-26 0:17 GMT+01:00 Pavel Machek <pavel na ucw.cz>: zobrazit citaci
> Ahoj! > >> Vypadá to, že minimálně osm.org nbsp řeší správně: >> https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366 >> ukazuje, že nic typu "vlna" osm.org nepoužívá >> https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787 >> ukazuje, že nedělitelné mezery zobrazí správně >> (Tedy, alespoň to tak vypadá) >> >> U ostatních renderů jsem zatím nenašel vhodný případ. >> >> Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka >> je prostá: chceme nbsp v datech, nebo nikoliv? >> >> Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi >> nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých >> ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto >> problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně >> smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se >> budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu >> doplňovat tam, kde ji zatím žádný úsek ulice nemá. > > Zpetne smazat i zpetne doplnit je stejne tezke -- ta mezera jde > doplnit algoritmicky -- takze ano, jsem proti 4. > > (Protoze to rozbije hledani, protoze to neni v oficialnich seznamech, > protoze je to tagovani pro renderer, protoze to rozbije lokalni > programy snazici se pracovat s OSM daty, a protoze neviditelny znaky > jsou skodoliba past na kohokoliv kdo se s timbude snazit pracovat.) > > DWG navrhovala zeptat se na tagging listu, to by asi byl dalsi rozumny > krok. > > Pavel > -- > (english) http://www.livejournal.com/~pavelmachek > (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

27.1.2018 07:36:38 (#64)
gravatar

Martin Mares

<mj at ucw.cz>
19
Hello, world! Osobně považuji za nejdůležitější pravidlo, že do primárních dat nepatří nic, co jde odvodit algoritmicky. Mimo jiné proto, že udržovat takové věci ručně obvykle vede k chaosu a jakmile je umíme udržovat algoritmicky, tak je tam už nemusíme ukládat :) Označování nedělitelných mezer je v tak jednoduchých českých textech, jaké se vyskytují na mapách, docela jednoduchá úloha. Navíc nevadí, když se tu a tam objeví nějaké false positives. Souhlasím, že nedává smysl, aby každý renderer musel ovládat pravidla pro české zalamování. Jenže renderery potřebují i spoustu jiných jazykově specifických znalostí, třeba pravidla pro transliteraci mezi abecedami. Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat a jehož výstup bude moci využít libovolný renderer. Ale opravdu se teď nenabízím, že ho napíšu :-) Mějte se skvěle -- Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/ Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth "Computers are useless. They can only give you answers." -- Pablo Picasso

28.1.2018 05:16:57 (#65)
gravatar

Jan Macura

<macurajan at gmail.com>
755 2731
Ahoj, 2018-01-27 19:36 GMT+01:00 Martin Mares <mj na ucw.cz>: zobrazit citaci
> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat > co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat > a jehož výstup bude moci využít libovolný renderer. >
To se mi zatím zdá jako nejrozumnější argument v této diskusi. A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším problémem jednopísmených předložek na koncích řádek docela souvisí. H. ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180128/b8a2c874/attachment.html>

31.1.2018 02:56:09 (#66)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" od "Jindřich V. Sálský" (fiktivní příklady). 2018-01-28 17:16 GMT+01:00 Jan Macura <macurajan na gmail.com>: zobrazit citaci
> Ahoj, > > 2018-01-27 19:36 GMT+01:00 Martin Mares <mj na ucw.cz>: >> >> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat >> co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat >> a jehož výstup bude moci využít libovolný renderer. > > > To se mi zatím zdá jako nejrozumnější argument v této diskusi. > A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve > kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych > řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším > problémem jednopísmených předložek na koncích řádek docela souvisí. > > H. > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

31.1.2018 07:20:18 (#67)
gravatar

Jan Macura

<macurajan at gmail.com>
755 2731
2018-01-31 14:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" > od "Jindřich V. Sálský" (fiktivní příklady). >
V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech ulic". Nic víc, nic míň. A na to jsem taky reagoval. H. ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/5073ba77/attachment.html>

31.1.2018 07:58:28 (#68)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. 2018-01-31 19:20 GMT+01:00 Jan Macura <macurajan na gmail.com>: zobrazit citaci
> 2018-01-31 14:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: >> >> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka" >> od "Jindřich V. Sálský" (fiktivní příklady). > > > V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech > ulic". Nic víc, nic míň. A na to jsem taky reagoval. > > H. > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

31.1.2018 08:14:24 (#69)
gravatar

Jan Macura

<macurajan at gmail.com>
755 2731
2018-01-31 19:58 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. >
Aha, to mě nenapadlo. Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem U+2164 ;-) H. ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/14a8a5fa/attachment.html>

31.1.2018 09:48:04 (#70)
gravatar

Karel Volný

<kavol at seznam.cz>
568
Dne středa 31. ledna 2018 20:14:24 CET, Jan Macura napsal(a): zobrazit citaci
> 2018-01-31 19:58 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: > > Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před. > > Aha, to mě nenapadlo. > Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem > U+2164 ;-)
ano, Jindřich [pátý] by takto mohl fungovat ovšem co takový Xindl [iks]? - hm, X není předložka ... a kdyby někdo vymyslel ulici na počest Anny [ká]? (aktuálně se sice na svém webu nazývá s tečkou, ale varianta bez tečky je též dosti rozšířená) přijde mi, že se tu furt vymejšlí rovnák na vohejbák ... *nikdy* to nebudeme mít 100% správně chápat různé druhy mezer obecně jako mezeru je triviální úložka, povětšinou již vyřešená, i ten blbej grep umí [:space:] vyvěštit z obecné mezery, jestli tam zrovna patří nsbp (popř. i něco jiného), je úložka hodná AI kvalitnější než průměrný maturant z češtiny, a vyřešená není - jistě, co se prvého týče, s jistou chybovostí se můžeme smířit, ale pak vzniká otázka, kdyby si někdo chtěl dát tu práci a docílit, aby ten program chyby nedělal, tak jaké má možnosti, nemá-li to být vázáno na konkrétní data? ... co mě napadá je seznam vyjímek, ale čeština má tu krásnou vlastnost, že by určitě brzy vyplulo něco, co se píše stejně, ale má různé významy, a tudíž ta vazba osamoceného písmene může být na obě strany prozradí nám někdo lepší řešení? - co se druhého týče, sice lze argumentovat existencí vlny apod., ale, jak zde již padlo, problém je, kdo to zaháčkuje do všech rendererů, co kdy vznikly a vzniknou? kdo bude nutit člověka na druhém konci světa implementovat nějakou specialitu pro zaprděnou desetimilionovou zemičku, když ani zde mezi zastánci odstranění nbsp se nenajde dobrovolník, co by ten preprocesor napsal? pozn. "renderer" se zde nemusí myslet jen vykreslování mapy, ale obecně cokoli, co když si třeba budu chtít adresy tisknout na obálky nebo jánevímco se dá nad OSM vymyslet, skutečně to všechno pokryjeme, aby to používalo ten (neexistující) preprocesor? obecně dobré pravidlo "nemapovat pro renderer" se zde dovádí ad absurdum, asi jako kdyby někdo řekl "pojďme odstranit u mostů layer, vždyť to se přece dá odvodit a existuje na to i pravidlo, renderer musí vědět, že cesta vede nad řekou" (hm, ne vždy) K. ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 195 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/5a7e799a/attachment.sig>

31.1.2018 10:16:46 (#71)
gravatar

Martin Mares

<mj at ucw.cz>
19
Ahoj, zobrazit citaci
> *nikdy* to nebudeme mít 100% správně
nebudeme. Stejně jako nebudeme mít 100% správně nic jiného. To je myslím lepší přijmout jako fakt, než investovat ohromné množství úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%. Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to. Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují, je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší pravděpodobnost chybné prezentace. Have a nice fortnight -- Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/ Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby

1.2.2018 12:56:42 (#72)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Co přesně se na editaci zkomplikuje, když budeme podporovat nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude mazat diakritiku. 2018-01-31 22:16 GMT+01:00 Martin Mares <mj na ucw.cz>: zobrazit citaci
> Ahoj, > >> *nikdy* to nebudeme mít 100% správně > > nebudeme. Stejně jako nebudeme mít 100% správně nic jiného. > > To je myslím lepší přijmout jako fakt, než investovat ohromné množství > úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%. > > Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších > detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko > zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně > posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt > mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to. > > Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují, > je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou > celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější > udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší > pravděpodobnost chybné prezentace. > > Have a nice fortnight > -- > Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/ > Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth > Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz

5.2.2018 01:40:16 (#73)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Diskuze na Tagging už celkem odezněla. Klidně se na ni podívejte, ale přijde mi, že celkem výrazná většina zastávala názor, že nástroje mají už dávno umět Unicode collation a že typografické nápovědy jsou v datech spíše žádoucí. Zatím jsem neslyšel o ničem, co by se doslova rozbíjelo (Overpass Unicode collation nedělá schválně a mám nápad, co s tím) a taky se neozval nikdo, kdo by byl ochoten napsat ten "jednoduchý" preprocesor. My jsme cca půl na půl, DWG to nevetovalo a Tagging je pro - myslím si, že nedělitelné mezery jsou tudíž akceptovatelné. Pokud se většinový názor změní, nebude problém ty mezery zase smazat. ToDo: - Overpass by mohl získat režim, kdy zadanou hodnotu přeloží na regex simulující Unicode collation - Editorům by prospělo zvýrazňování whitespace Začátek diskuze na Tagging: https://lists.openstreetmap.org/pipermail/tagging/2018-January/034986.html Ať se daří! Matej PS: Doporučuju http://www.babelstone.co.uk/Unicode/whatisit.html 2018-02-01 0:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>: zobrazit citaci
> Co přesně se na editaci zkomplikuje, když budeme podporovat > nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát > dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude > mazat diakritiku. > > 2018-01-31 22:16 GMT+01:00 Martin Mares <mj na ucw.cz>: >> Ahoj, >> >>> *nikdy* to nebudeme mít 100% správně >> >> nebudeme. Stejně jako nebudeme mít 100% správně nic jiného. >> >> To je myslím lepší přijmout jako fakt, než investovat ohromné množství >> úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%. >> >> Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších >> detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko >> zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně >> posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt >> mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to. >> >> Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují, >> je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou >> celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější >> udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší >> pravděpodobnost chybné prezentace. >> >> Have a nice fortnight >> -- >> Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/ >> Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth >> Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz

12.2.2018 02:14:51 (#74)
gravatar

Mirek Dlask

<dlask.m at gmail.com>
196
Ahoj, jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod. Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí. _________________________________________________________________________________________________________________________________________ S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka. Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už jsem začala vymýšlet, co s dokladama, abych nemusela na úřady. ..... Můžeš zjednat nápravu? ..... Z tégémasaryka zdraví ............ ______________________________________________________________________________________________________ Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na wiki jsem našel pouze toto. Ustálené zkratky Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při vyhledávání objektu. Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco jsem přehlédl? Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to ti čerchmanti dělají, že nemají "problémy při vyhledávání objektů"? Mirek Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com> napsal(a): zobrazit citaci
> Ahoj! > > Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu > street relací a tak narážím na různé podivnosti v databázi, kterých bych si > jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té > samé ulice mají různé názvy, což chytá i takové prkotiny, jako je > nedělitelná mezera (nbsp). > > Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k > žádnému konsenzu to (pokud vím) nevedlo. > > Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. > Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou > synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do > tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak > opravovat. > > Co mám dělat? > > 1) Odstraňuj nbsp z názvů ulic > 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp > 3) Tam, kde se vyskytují obě varianty, preferuj tu častější > 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp > 5) Přidávej (ručně) nbsp do názvů ulic > 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně > > Ať se daří, > Matej > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/8e409b85/attachment.html>

12.2.2018 02:33:13 (#75)
gravatar

Matej Lieskovský

<lieskovsky.matej at gmail.com>
78
Ahoj! Zkratky jmen v názvech ulic jsou asi trochu jiné téma, ale určitě to chce se na ně podívat. Co se týče nedělitelných mezer, tak: 1) Zatím jediné dvě mně známé nevýhody jsou "budeme muset dělat Unicode collation" (což je argument i pro odstranění nabodeníček) a "blbě se to zadává" (tak to holt většina nebude zadávat). Filozofické argumenty typu "nepatří to do dat" a "napíšeme na to preprocesor" zatím nedodaly onen triviální preprocesor. 2) Aktuálně mají mírnou převahu lidi pro odstranění, každopádně už jsem s tím (na popud tohoto talku) prudil DWG (těm je to fuk) a globální Tagging (kde jsou spíše pro nedělitelné mezery). Jakou zásadní nevýhodu jsem zatím neslyšel? Máš ten preprocesor? (Sorry, pokud zním trochu hrubě, spěchám) Ať se daří, Matej 2018-02-12 14:14 GMT+01:00 Mirek Dlask <dlask.m na gmail.com>: zobrazit citaci
> Ahoj, > > jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod. > > > Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí. > _________________________________________________________________________________________________________________________________________ > > S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se > složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka. > Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už > jsem začala vymýšlet, co s dokladama, abych nemusela na úřady. > ..... > Můžeš zjednat nápravu? > ..... > Z tégémasaryka zdraví ............ > ______________________________________________________________________________________________________ > > Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na > wiki jsem našel pouze toto. > > Ustálené zkratky > Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při > vyhledávání objektu. > > > Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco jsem > přehlédl? > Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to ti > čerchmanti dělají, že nemají "problémy při vyhledávání objektů"? > > Mirek > > Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com> > napsal(a): >> >> Ahoj! >> >> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu >> street relací a tak narážím na různé podivnosti v databázi, kterých bych si >> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té >> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je >> nedělitelná mezera (nbsp). >> >> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k >> žádnému konsenzu to (pokud vím) nevedlo. >> >> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. >> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou >> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do tagů >> relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak >> opravovat. >> >> Co mám dělat? >> >> 1) Odstraňuj nbsp z názvů ulic >> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp >> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější >> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp >> 5) Přidávej (ručně) nbsp do názvů ulic >> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně >> >> Ať se daří, >> Matej >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >

12.2.2018 02:49:50 (#76)
gravatar

majka

<majka.zem+talk at gmail.com>
718 2573
2018-02-12 14:14 GMT+01:00 Mirek Dlask <dlask.m na gmail.com>: zobrazit citaci
> S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych > se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka >
Tohle krásně ilustruje, jak jsou zavedené konvence odtrhnuté od skutečného stavu, alespoň v ČR. Vychází se totiž víceméně z toho, že oficiální jméno je plný název bez zkratek. Což u nás ani vzdáleně neplatí. Teoreticky, pokud se nepletu: V OSM by mělo být rozepsané celé (nepoužívejte zkratky <https://wiki.openstreetmap.org/wiki/Cs:N%C3%A1zvy#Zkracov.C3.A1n.C3.AD_.28ned.C4.9Bjete_to.29>) a ten zkrácený název by byl v official_name <https://wiki.openstreetmap.org/wiki/Cs:Key:name> Ovšem pak to vede přesně k tomuhle problému - že se na mapě zobrazí jméno, a člověk se diví, kde že to najednou bydlí. Prakticky, a přiznávám se k tomu bez mučení: do jména dávám ty "official_name" vč. zkratek, a rozepisuji alt_name, short_name, sorting_name, pokud jsou třeba. Majka ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/99b6b35f/attachment.html>

12.2.2018 03:31:47 (#77)
gravatar

Jan Dudík

<jan.dudik at gmail.com>
356 733
Jo, toť otázka. https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d vs. https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=x vs. https://mapy.cz/s/2okEA a http://www.c-budejovice.cz/nazvy-budejovickych-ulic --- Ing. Jan Dudík projekce dopravních staveb tel. 777082195 Dne 12. února 2018 14:14 Mirek Dlask <dlask.m na gmail.com> napsal(a): zobrazit citaci
> Ahoj, > > jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod. > > > Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí. > ____________________________________________________________ > ____________________________________________________________ > _________________ > > S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych > se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka. > Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už > jsem začala vymýšlet, co s dokladama, abych nemusela na úřady. > ..... > Můžeš zjednat nápravu? > ..... > Z tégémasaryka zdraví ............ > ____________________________________________________________ > __________________________________________ > > Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? > Na wiki jsem našel pouze toto. > > Ustálené zkratky > Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při > vyhledávání objektu. > > > Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco > jsem přehlédl? > Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to > ti čerchmanti dělají, že nemají "problémy při vyhledávání objektů"? > > Mirek > > Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com> > napsal(a): > >> Ahoj! >> >> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu >> street relací a tak narážím na různé podivnosti v databázi, kterých bych si >> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té >> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je >> nedělitelná mezera (nbsp). >> >> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k >> žádnému konsenzu to (pokud vím) nevedlo. >> >> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. >> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou >> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do >> tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak >> opravovat. >> >> Co mám dělat? >> >> 1) Odstraňuj nbsp z názvů ulic >> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp >> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější >> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp >> 5) Přidávej (ručně) nbsp do názvů ulic >> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně >> >> Ať se daří, >> Matej >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> >> > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/1311ea53/attachment.html>

12.2.2018 08:43:48 (#78)
gravatar

Petr Vozdecký

<vop at seznam.cz>
398 474
Ahoj, začal bych u toho odkazu, který Majka postovala na wiki: "V OSM by mělo být rozepsané celé (nepoužívejte zkratky (https://wiki.openstreetmap.org/wiki/Cs:N%C3%A1zvy#Zkracov.C3.A1n.C3.AD_.28ned.C4.9Bjete_to.29) )". Článek je totiž zjevně překladem anglického originálu a kapitola s původním názvem "Abbreviation (don't do it)" podle mě popisuje to, že mapper nemá automaticky používat zkratky tam, kde je vidí na ceduli a má si zjistit skutečný celý název. Pro diskutované případy s názvy T.G.M. atd. to v českých podmínkách dle mého platí asi do té míry, že nelze slepě napsat zkratku názvu ulice jen proto, že "kratší je to přehlednější", případně "bylo to na ceduli", ale je správné jako název zvolit oficiální název (zde je asi rozhodující názor obce, byť jsem tu vícekrát četl, že komunita upřednostňuje data z RÚIAN). No a Majka asi vcelku správně vidí jako vhodné doplnit databázi OSM o nezkrácené názvy. Otázkou je, které názvy do kterých tagů. Na wiki totiž čtu, že name_official je určen pouze pro názvy států... vop
---------- Původní e-mail ---------- Od: Jan Dudík <jan.dudik na gmail.com> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org> Datum: 12. 2. 2018 15:32:46 Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic " Jo, toť otázka.  https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d (https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d) vs. https:// openstreetmap.cz/#map=18/48.96086/14.47347&layers=x (https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=x) vs.  https:// mapy.cz/s/2okEA(https://mapy.cz/s/2okEA) a http://www.c-budejovice.cz/nazvy- budejovickych-ulic(http://www.c-budejovice.cz/nazvy-budejovickych-ulic) --- Ing. Jan Dudík projekce dopravních staveb tel. 777082195 Dne 12. února 2018 14:14 Mirek Dlask <dlask.m na gmail.com (mailto:dlask.m na gmail.com)> napsal(a): " Ahoj, jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod. Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí. ____________________________________________________________________________ _____________________________________________________________ S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka. Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už jsem začala vymýšlet, co s dokladama, abych nemusela na úřady. ..... Můžeš zjednat nápravu? ..... Z tégémasaryka zdraví ............ ____________________________________________________________________________ __________________________ Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na wiki jsem našel pouze toto. Ustálené zkratky Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při vyhledávání objektu. Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco jsem přehlédl? Ať se podívám na mapy.cz(http://mapy.cz) nebo na google.cz/maps (http://google.cz/maps) zkratky používají. Jak to ti čerchmanti dělají, že nemají "problémy při vyhledávání objektů"? Mirek Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com (mailto:lieskovsky.matej na gmail.com)> napsal(a): " Ahoj! Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu street relací a tak narážím na různé podivnosti v databázi, kterých bych si jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té samé ulice mají různé názvy, což chytá i takové prkotiny, jako je nedělitelná mezera (nbsp). Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k žádnému konsenzu to (pokud vím) nevedlo. Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak opravovat. Co mám dělat? 1) Odstraňuj nbsp z názvů ulic 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp 3) Tam, kde se vyskytují obě varianty, preferuj tu častější 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp 5) Přidávej (ručně) nbsp do názvů ulic 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně Ať se daří, Matej _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org(mailto:Talk-cz na openstreetmap.org) https://lists.openstreetmap.org/listinfo/talk-cz (https://lists.openstreetmap.org/listinfo/talk-cz) " _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org(mailto:Talk-cz na openstreetmap.org) https://lists.openstreetmap.org/listinfo/talk-cz (https://lists.openstreetmap.org/listinfo/talk-cz) " _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz " ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/a67fd193/attachment.html>

12.2.2018 10:23:09 (#79)
gravatar

Jan Sten Adámek

<sten at adamek.online>
38
Ahoj, já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru. IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo „nábř.“. Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené. official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek. Při editaci OSM jsem již také viděl klíč long_name, ale ten není dokumentovaný ani podporovaný Nominatimem. Sten

12.2.2018 10:47:42 (#80)
gravatar

majka

<majka.zem+talk at gmail.com>
718 2573
Problém je, že ty ulice se dlouhým názvem nejmenují a žádná zkratka to není. Tím dlouhým názvem se na tu ulici nemáte šanci doptat - všichni místní budou přemýšlet, o čem to mluvíte. Je to specifický případ, který by se měl i v datech ukázat, nehledě na heslo "rozepisujte zkratky". Nechcete mi snad říct, že je nutné opravit třeba tohle <https://www.openstreetmap.org/node/24569684#map=19/50.07446/14.43052>. 2018-02-12 22:23 GMT+01:00 Jan Sten Adámek <sten na adamek.online>: zobrazit citaci
> Ahoj, > > já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do > short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru. > IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo > „nábř.“. > > Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která > nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými > jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla > Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou > tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba > „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi > křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a > nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš > nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené. > > official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy > oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba > „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek. > Při editaci OSM jsem již také viděl klíč long_name, ale ten není > dokumentovaný ani podporovaný Nominatimem. > > Sten > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/b1db3fb1/attachment.html>

12.2.2018 10:48:01 (#81)
gravatar

Mirek Dlask

<dlask.m at gmail.com>
196
Preprocesor nemám, vystačil bych si s převodní tabulkou. Přesvědčil bych nějakého renderistu, aby si z převodní tabulky udělal UPDATE ..... SET name .... FROM ...... a posoudil bych, jestli výsledek odpovídá vynaloženému úsilí. Pokud ano, stejnou cestou bych 'svoji pravdu' šířil dál. Nevím jak to máš vymyšleno ty. Co když ti do mapy přidám novou odbočku. To ji chceš "ručně" upravit a přidat do relace? Obavu mám ještě z něčeho jiného. Jak dlouho to hodláš vydržet a co potom? V neposlední řadě mi vadí další narušení vazby mezi názvem ulice a názvem ulice na adresních bodech. Ale chápu moje řešení je moc jednoduché. Ty potřebuješ naštvat co nejvíc lidí, udělat okolo co největší humbuk, a nakonec všechno urovnat, aby ses moh v sívíčku poplácat po ramenou jakej seš pašák. Dne 12. února 2018 14:33 Matej Lieskovský <lieskovsky.matej na gmail.com> napsal(a): zobrazit citaci
> Ahoj! > > > Jakou zásadní nevýhodu jsem zatím neslyšel? Máš ten preprocesor? > > (Sorry, pokud zním trochu hrubě, spěchám) > > Ať se daří, > > Matej > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/4feeebc1/attachment.html>

12.2.2018 11:01:11 (#82)
gravatar

Mirek Dlask

<dlask.m at gmail.com>
196
Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana Palova, než jeho křestní jména. Dne 12. února 2018 22:47 majka <majka.zem+talk na gmail.com> napsal(a): zobrazit citaci
> Problém je, že ty ulice se dlouhým názvem nejmenují a žádná zkratka to > není. Tím dlouhým názvem se na tu ulici nemáte šanci doptat - všichni > místní budou přemýšlet, o čem to mluvíte. > > Je to specifický případ, který by se měl i v datech ukázat, nehledě na > heslo "rozepisujte zkratky". Nechcete mi snad říct, že je nutné opravit > třeba tohle > <https://www.openstreetmap.org/node/24569684#map=19/50.07446/14.43052>. > > 2018-02-12 22:23 GMT+01:00 Jan Sten Adámek <sten na adamek.online>: > >> Ahoj, >> >> já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do >> short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru. >> IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo >> „nábř.“. >> >> Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která >> nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými >> jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla >> Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou >> tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba >> „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi >> křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a >> nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš >> nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené. >> >> official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy >> oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba >> „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek. >> Při editaci OSM jsem již také viděl klíč long_name, ale ten není >> dokumentovaný ani podporovaný Nominatimem. >> >> Sten >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> https://lists.openstreetmap.org/listinfo/talk-cz >> > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz > >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/86dbe20b/attachment.html>

13.2.2018 02:30:28 (#83)
gravatar

Jan Sten Adámek

<sten at adamek.online>
38
Problém je, jak to do OSM zapsat. Dovedu si dobře představit, že třeba nábř. Kpt. Jaroše v Jičíně bude někdo hledat jako nábřeží Kapitána Jaroše, protože v Praze se jmenuje takhle (a naopak), a tak by to OSM mělo umět najít. Podle Wiki je name pro plnou formu, kratší forma patří do short_name a žádný long_name není, ale jestli se v ČR ustaví jiná konvence, která bude rozumně fungovat (prosazení long_name či display_name asi není realistické, official_name by bylo spíš pro tu krátkou formu – ta je ta oficiální, možná alt_name?), tak klidně budu používat tu. A taky je otázka, jak řešit TTS, protože pokud bude v name nábř. Kpt. Jaroše, tak to přečte fakt příšerně (viz pravidlo u name, že zkracovat se dá při zpracování dat snadno, ale doplňovat ne; name:pronunciation je reálně nepoužitelné). Takže možná v name rozepisovat zkratky s výjimkou iniciál (které se často čtou jako iniciály), tedy T. G. Masaryka nechat s plným jménem v jiném tagu (alt_name?), ale Masarykovo nám. rozepsat jako Masarykovo náměstí a zkrácenou formu dát do official_name nebo short_name?

13.2.2018 06:52:14 (#84)
gravatar

majka.zem+talk na gmail.com

<majka.zem+talk at gmail.com>
718 2573
13. února 2018 2:30:28 SEČ, "Jan Sten Adámek" <sten na adamek.online> napsal: zobrazit citaci
>Problém je, jak to do OSM zapsat. Dovedu si dobře představit, že třeba >nábř. Kpt. Jaroše v Jičíně bude někdo hledat jako nábřeží Kapitána >Jaroše, >protože v Praze se jmenuje takhle (a naopak), a tak by to OSM mělo umět >najít.
Musela bych se podívat jak jsem přesně zadávala tu Pražskou v ČB, ale hledání funguje i podle alt_name (Pražská třída), short_name (Pražská) a loc_name. Mám pocit, že jsem dávala ještě nějaké "name" navíc. Takhle umí hledat jak Nominatim, tak i třeba Osmand. TTS je věc druhá - "lepší" ty běžné zkratky umí (tř. =třída), nebo je umí nadefinovat v místě (mobilu). Ideální by ale bylo to nadefinovat do tagu pro výslovnost, který se taky řeší. Netuším, jestli už je u něj shoda a/nebo se běžně užívá. Nedávno tu proběhl odkaz na debatu na francouzském talku, kde to probírali.

13.2.2018 09:33:20 (#85)
gravatar

Karel Volný

<kavol at seznam.cz>
568
zdar, zobrazit citaci
> Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už > poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o > náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde > metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým > jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana > Palova, než jeho křestní jména.
tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je tady ten "Slinták", na kterým má vylézt z "krtka" já jsem zase nikdy neslyšel, že by někdo mluvil o "ípé Pavlova", páč je to "Pavlák" (po vzoru "Karlák" nebo "Staromák"), popř. "Ípák" nebo "Ípáč" (a jezdí se tam samozřejmě céčkem) ale nestrávil jsem v Praze zas tak dlouho, a věřím, že kdybych se potkal s nějakou ruskou komunitou, tak ti naopak "Ivana Petroviče" budou preferovat, pokud vím, je to u nich tak nějak zvykem radši než příjmení ... K. ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 195 bytes Desc: This is a digitally signed message part. URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180213/bd0e0c97/attachment.sig>


13.2.2018 11:48:16 (#87)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
Dne 13.2.2018 v 09:33 Karel Volný napsal(a): zobrazit citaci
> zdar, > >> Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už >> poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o >> náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde >> metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým >> jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana >> Palova, než jeho křestní jména. > > tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je tady ten "Slinták", > na kterým má vylézt z "krtka" > > já jsem zase nikdy neslyšel, že by někdo mluvil o "ípé Pavlova", páč je to > "Pavlák" (po vzoru "Karlák" nebo "Staromák"), popř. "Ípák" nebo "Ípáč" (a > jezdí se tam samozřejmě céčkem)
Tak v loc_name bývá kde co (a zrovna flame o tom, jaká je Jediná Správná Přezdívka pro IPP, a co je heretický nesmysl, který jáá nikdy neslyšel, je velmi specifické pražské téma, o kterém se lze bez výsledku hádat neomezeně dlouho); o přezdívky u name=* snad nejde. zobrazit citaci
> > ale nestrávil jsem v Praze zas tak dlouho, a věřím, že kdybych se potkal s > nějakou ruskou komunitou, tak ti naopak "Ivana Petroviče" budou preferovat, > pokud vím, je to u nich tak nějak zvykem radši než příjmení ...
To už je naprostý věštění z čajových lístků, co-by-kdyby po vzoru "na Smíchově prostě je stanice metra Angel, respektive Engel, _protože mi to připadá logický_, byť jsem ten název právě dovymyslel." Navíc ono to ani v ruštině logický není: křestní jméno a patronymum se používá pro osobu, ale ne pro ulici pojmenovanou po osobě: spisovatel byl Nikolaj Vasiljevič, ale ulice je Gogolevský bulvár: https://www.openstreetmap.org/way/30475662 (teda pokud se názvům ulic dá věřit a není to taky nějaký jazykobrusičský výmysl :D ;)) Kromě toho, i pokud by to takto existovalo, tak by to šlo do loc_name:ru, souvislost s name=* je hodně slabá. Zdar, HPM

13.2.2018 02:18:25 (#88)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-02-13, 08:33 GMT, Karel Volný wrote: zobrazit citaci
> tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je > tady ten "Slinták", na kterým má vylézt z "krtka"
Krtkem z Želvy na Slinták s přestupem u Koně? ;) Matěj -- https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Microwave oven? Whaddya mean, it's a microwave oven? I've been watching Channel 4 on the thing for two weeks.

13.2.2018 04:29:15 (#89)
gravatar

Lukas Gebauer

<gebylist at mlp.cz>
68 695
zobrazit citaci
> On 2018-02-13, 08:33 GMT, Karel Volný wrote: > > tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je > > tady ten "Slinták", na kterým má vylézt z "krtka" > > Krtkem z Želvy na Slinták s přestupem u Koně? ;)
To fakt používáte výraz "krtek"? Já to doposud slyšel jen od moravské náplavy. Ale to jsme s tím tématem už poněkud vykolejili... -- Lukas Gebauer. http://synapse.ararat.cz/ - Ararat Synapse - TCP/IP Lib. https://www.geoget.cz/ - Geocaching solution

13.2.2018 04:34:02 (#90)
gravatar

Jan Martinec

<jan at martinec.name>
548 4367
A je to tady, můžeme flejmovat do rána bílého, kdo je větší náplava a jestli se na Moravě opravdu mluví o krtkovi a Slintáku ;) zobrazit citaci
> (a zrovna flame o tom, jaká je Jediná Správná Přezdívka pro IPP, a co je
heretický nesmysl, který jáá nikdy neslyšel, je velmi specifické pražské téma, o kterém se lze bez výsledku hádat neomezeně dlouho) Dne 13. 2. 2018 16:30 napsal uživatel "Lukas Gebauer" <gebylist na mlp.cz>: zobrazit citaci
> > On 2018-02-13, 08:33 GMT, Karel Volný wrote: > > > tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je > > > tady ten "Slinták", na kterým má vylézt z "krtka" > > > > Krtkem z Želvy na Slinták s přestupem u Koně? ;) > > To fakt používáte výraz "krtek"? Já to doposud slyšel jen od moravské > náplavy. > > Ale to jsme s tím tématem už poněkud vykolejili... > > > -- > Lukas Gebauer. > > http://synapse.ararat.cz/ - Ararat Synapse - TCP/IP Lib. > https://www.geoget.cz/ - Geocaching solution > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-cz >
------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180213/da903606/attachment.html>

14.2.2018 12:07:25 (#91)
gravatar

Matěj Cepl

<mcepl at cepl.eu>
185
On 2018-02-13, 15:29 GMT, Lukas Gebauer wrote: zobrazit citaci
> To fakt používáte výraz "krtek"? Já to doposud slyšel jen od > moravské náplavy.
Spíše jako legrace, ale ano občas jsem to slyšel i v normálním provozu. Když už centimetro není dost zajímavé … Matěj -- https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8 Besides, the determined Real Programmer can write Fortran programs in any language. -- Ed Post, Real Programmers Don't Use Pascal

« zpět na výpis měsíce