[Talk-cz] Nedělitelné mezery v názvech ulic
Vlákno 17.1. - 14.2.2018, počet zpráv: 91
Ahoj!
Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
street relací a tak narážím na různé podivnosti v databázi, kterých bych si
jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
nedělitelná mezera (nbsp).
Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
žádnému konsenzu to (pokud vím) nevedlo.
Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy.
Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do
tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
opravovat.
Co mám dělat?
1) Odstraňuj nbsp z názvů ulic
2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
3) Tam, kde se vyskytují obě varianty, preferuj tu častější
4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
5) Přidávej (ručně) nbsp do názvů ulic
6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
Ať se daří,
Matej
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/306fdd04/attachment.html>
On 2018-01-17, 12:49 GMT, Matej Lieskovský wrote:
zobrazit citaci
> 1) Odstraňuj nbsp z názvů ulic
> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější
> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
> 5) Přidávej (ručně) nbsp do názvů ulic
> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
Já se potácím někde mezi 4 a 6. Na jednu stranu je koncept jména
ulice velice nestálý pojem (je skutečně spořilovská Jihovýchodní
IV. 2. díl jiná ulice nežli Jihovýchodní IV 1. díl? Hmm, tohle
dělení jsme také zjevně vzdaly a ty díly vynecháváme), ale nic
lepšího nemáme, a ono to asi souvisí s nejasným konceptem ulice.
Ono není nikde žádná metafyzická odpověď na to, proč Vinohradská
končí na té křižovatce se Starostrašnickou a je z ní najednou
Černokostelecká.
Taky Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
It is the mark of an educated mind to be able to entertain
a thought without accepting it.
-- Aristotle
2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
>
> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>
Trocha teorie - správně by to snad mělo být podle údajů ČÚZK
<http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx>
A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, jen
formálně ulice + správná adresa) v letech 2002, 2008 a 2015.
Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská",
"Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. Musím
to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala alt_name,
protože s tím vyhledávače měly problémy.
A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec
neexistovaly. Jako příklad je ulice U Panelárny <https://mapy.cz/s/2koAm> v
Jindřichově Hradci. Nemovitosti na ní se nacházející používající tuhle
adresu totiž (snad až na jedinou výjimku) do katastru Jindřichova Hradce
vůbec nepatří, a ten název se užíval co já pamatuji minimálně patnáct let,
než byl podle těch informací ČÚZK 11.09.2014 oficiálně zaveden.
Asi jsem Ti moc nepomohla, co říkáš?
Majka
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/694d3a76/attachment.html>
Na neoficiální názvy máme loc_name, ne (křižovatka U Bulhara byl taky kdysi
neofiko název podle tamního trafikanta)? Minimálně Nominatim podle toho
hledat umí.
Co se týče logických důvodů, ty celkem neexistují - jen historické
("Vinohradská končí u vozovny, protože to je poslední výspa civilizace v
malešických polích, dál už je jenom silnice." - no a pak se Praha rozrostla)
Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na římské číslice
v názvech. To je medle ok, ale je to kanonický název, nebo ten má být spíše Ⅱ,
nebo II?
Zdar,
Honza Piškvor Martinec
Dne 17. 1. 2018 14:50 napsal uživatel "majka" <majka.zem+talk na gmail.com>:
2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
>
> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>
Trocha teorie - správně by to snad mělo být podle údajů ČÚZK
<http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx>
A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování, jen
formálně ulice + správná adresa) v letech 2002, 2008 a 2015.
Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská",
"Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední. Musím
to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala alt_name,
protože s tím vyhledávače měly problémy.
A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec
neexistovaly. Jako příklad je ulice U Panelárny <https://mapy.cz/s/2koAm> v
Jindřichově Hradci. Nemovitosti na ní se nacházející používající tuhle
adresu totiž (snad až na jedinou výjimku) do katastru Jindřichova Hradce
vůbec nepatří, a ten název se užíval co já pamatuji minimálně patnáct let,
než byl podle těch informací ČÚZK 11.09.2014 oficiálně zaveden.
Asi jsem Ti moc nepomohla, co říkáš?
Majka
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/a5878864/attachment.html>
On 2018-01-17, 14:10 GMT, Jan Martinec wrote:
zobrazit citaci
> Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na
> římské číslice v názvech. To je medle ok, ale je to kanonický
> název, nebo ten má být spíše Ⅱ, nebo II?
To už mi připadne jako kravina. Nezlomitelná mezera má svoje
výhody, ale Ⅱ mi připadne jako čistý manýrismus.
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Quod fuimus, estis; quod sumus, vos eritis.
To se mi zase povedlo kopnout do něčeho fajného...
O metafyziku mi v tomto případě opravdu moc nejde -
když končí Vinohradská a začíná Černokostelecká,
tak končí Vinohradská a začíná Černokostelecká.
To mě vážně netrápí.
Taky mi nedělá problém přejmenovat celou ulici,
kdykoliv kdy se její název změní.
Když si všimnu, že to opravdu mám přepsat,
tak to díky systému pojede téměř samo.
alt_name a loc_name se zatím taky nehodlám ani dotknout.
O Římských číslicích můžeme debatovat,
ještě chvíli na ně asi nenarazím.
Možná bych se dokonce přikláněl k tomu,
že ty unicode věci jsou možná i dobře,
ale to je na délší debatu.
Teď ale naprosto reálně chci vědět,
zda se ta ulice má jmenovat "K Jezeru" nebo "K Jezeru",
protože naprosto odmítám možnost,
že to jsou dvě různé ulice.
Výhledově to asi chce na wiki napsat,
jak se máme v takovýchto situacích zachovat.
Pokud například zvládneme udržet správné názvy v relacích,
tak bych měl být schopen dohlížet na nbsp a podobné
minimálně pro celou Prahu.
Shodneme se tedy na tom,
že varianta 4 je bezpečná?
Systém bude jen polo-automatický,
takže pokud narazí na něco divného,
tak nejspíše zase napíšu sem.
@Matěj: Podle ČÚZK žádné díly neexistují a basta! :)
Matej
2018-01-17 18:29 GMT+01:00 Matěj Cepl <mcepl na cepl.eu>:
zobrazit citaci
> On 2018-01-17, 14:10 GMT, Jan Martinec wrote:
> > Jinak nejde jen o nbsp, někdo přidává Unicode ekvivalenty na
> > římské číslice v názvech. To je medle ok, ale je to kanonický
> > název, nebo ten má být spíše Ⅱ, nebo II?
>
> To už mi připadne jako kravina. Nezlomitelná mezera má svoje
> výhody, ale Ⅱ mi připadne jako čistý manýrismus.
>
> Matěj
> --
> http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
> GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
>
> Quod fuimus, estis; quod sumus, vos eritis.
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180117/cb938dc0/attachment.html>
Dne 17.1.2018 v 14:49 majka napsal(a):
zobrazit citaci
>
>
> 2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com
> <mailto:lieskovsky.matej na gmail.com>>:
>
>
> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>
>
> Trocha teorie - správně by to snad mělo být podle údajů ČÚZK
To se obavam ze je dost naivni ... vzhledem ke kvalite dat.
Jinak ad nedelitelna mezera, podle me je to zbytecnej udaj navic dost
casto komplikujici spoustu veci (co si budem rikat, je to mnoha editory
nesdelitelna informace a o renederu ani nemluve).
Nehlede na to, ze tam tech znaku znamenajicich totez muze byt vicero ...
Jednak samozrejme unicode ... pak taky napriklad   nebo   to
se nam to komplikuje coz?
A ad unicode znaky ... to bych svym zpusobem prenechal "prirode",
jelikoz a protoze u zdroje to nebude (nejmin po dobu nasich zivotu bude
pro libovolny podobny data unicode sprosty slovo) a na druhou stranu
nema smysl ani nekomu branit to pouzivat.
Ostatne, tech znaku ktery v ceskych podminkach maji vyuzitelnost je
pomerne dost, jen se obavam, ze opet skoncime u toho, ze na klavesnici
nejsou (na ty ostatne neni ani pomlcka).
BTW: To ze ulice vznika z nejakyho obecne pouzivanyho pojmenovani danyho
mista je asi celkem beznej zpusob.
zobrazit citaci
> <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytovani-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-prvky-a-uzemne-evidencni-jednotky.aspx>
>
> A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování,
> jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015.
> Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská",
> "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední.
> Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala
> alt_name, protože s tím vyhledávače měly problémy.
>
> A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec
> neexistovaly. Jako příklad je ulice U Panelárny
> <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se
> nacházející používající tuhle adresu totiž (snad až na jedinou výjimku)
> do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co
> já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK
> 11.09.2014 oficiálně zaveden.
>
> Asi jsem Ti moc nepomohla, co říkáš?
>
> Majka
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
Já bych měl jeden související dotaz.
V naší obci ulice oficiálně jména nemají.
Ovšem třeba do projektu opravy po mně starosta chtěl, abych tam uvedl
určité jméno. Jak případně tagovat takováto neoficiální (= nejsou v žádném
registru) jména?
JAnD
---
Ing. Jan Dudík
projekce dopravních staveb
tel. 777082195
Dne 18. ledna 2018 1:01 jzvc <jzvc na tpfree.net> napsal(a):
zobrazit citaci
> Dne 17.1.2018 v 14:49 majka napsal(a):
>
>>
>>
>> 2018-01-17 13:49 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com
>> <mailto:lieskovsky.matej na gmail.com>>:
>>
>>
>> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>>
>>
>> Trocha teorie - správně by to snad mělo být podle údajů ČÚZK
>>
>
> To se obavam ze je dost naivni ... vzhledem ke kvalite dat.
>
> Jinak ad nedelitelna mezera, podle me je to zbytecnej udaj navic dost
> casto komplikujici spoustu veci (co si budem rikat, je to mnoha editory
> nesdelitelna informace a o renederu ani nemluve).
>
> Nehlede na to, ze tam tech znaku znamenajicich totez muze byt vicero ...
>
> Jednak samozrejme unicode ... pak taky napriklad   nebo   to se
> nam to komplikuje coz?
>
>
> A ad unicode znaky ... to bych svym zpusobem prenechal "prirode", jelikoz
> a protoze u zdroje to nebude (nejmin po dobu nasich zivotu bude pro
> libovolny podobny data unicode sprosty slovo) a na druhou stranu nema smysl
> ani nekomu branit to pouzivat.
>
> Ostatne, tech znaku ktery v ceskych podminkach maji vyuzitelnost je
> pomerne dost, jen se obavam, ze opet skoncime u toho, ze na klavesnici
> nejsou (na ty ostatne neni ani pomlcka).
>
> BTW: To ze ulice vznika z nejakyho obecne pouzivanyho pojmenovani danyho
> mista je asi celkem beznej zpusob.
>
> <http://www.cuzk.cz/Uvod/Produkty-a-sluzby/RUIAN/2-Poskytova
>> ni-udaju-RUIAN-ISUI-VDP/Ciselniky-ISUI/Nizsi-uzemni-
>> prvky-a-uzemne-evidencni-jednotky.aspx>
>>
>> A teď praxe: vím o změně adresy (nejde o přestěhování ani přejmenování,
>> jen formálně ulice + správná adresa) v letech 2002, 2008 a 2015.
>> Celý ten rozdíl se točí kolem toho, jestli je správně uvedeno "Pražská",
>> "Pražská třída" nebo "Pražská tř." Momentálně je správně to poslední.
>> Musím to znovu zkontrolovat v datech, ale kdysi jsem tam přidávala
>> alt_name, protože s tím vyhledávače měly problémy.
>>
>> A nejlepší jsou "zavedené" ulice v určitých městech, které vůbec
>> neexistovaly. Jako příklad je ulice U Panelárny
>> <https://mapy.cz/s/2koAm> v Jindřichově Hradci. Nemovitosti na ní se
>> nacházející používající tuhle adresu totiž (snad až na jedinou výjimku)
>> do katastru Jindřichova Hradce vůbec nepatří, a ten název se užíval co
>> já pamatuji minimálně patnáct let, než byl podle těch informací ČÚZK
>> 11.09.2014 oficiálně zaveden.
>>
>> Asi jsem Ti moc nepomohla, co říkáš?
>>
>> Majka
>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/7191b4c5/attachment.html>
Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích
pak přesunout do name
2018-01-18 6:56 GMT+01:00 Jan Dudík <jan.dudik na gmail.com>:
zobrazit citaci
> Já bych měl jeden související dotaz.
> V naší obci ulice oficiálně jména nemají.
> Ovšem třeba do projektu opravy po mně starosta chtěl, abych tam uvedl
> určité jméno. Jak případně tagovat takováto neoficiální (= nejsou v žádném
> registru) jména?
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/bb381891/attachment.html>
2018-01-18 8:45 GMT+01:00 majka <majka.zem+talk na gmail.com>:
zobrazit citaci
> Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích pak
> přesunout do name
Na cedulích? Jednou mně tady bylo řečeno, že cedule jsou irelevatní a
že směrodatná jsou data ČÚZK.
--
Michal Fabík
On Wed 2018-01-17 13:49:08, Matej Lieskovský wrote:
zobrazit citaci
> Ahoj!
>
> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
> street relací a tak narážím na různé podivnosti v databázi, kterých bych si
> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
> nedělitelná mezera (nbsp).
>
> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
> žádnému konsenzu to (pokud vím) nevedlo.
>
> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy.
> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do
> tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
> opravovat.
>
> Co mám dělat?
>
> 1) Odstraňuj nbsp z názvů ulic
1).
...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working
group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v
nazvech. A podle toho dal. Do te doby...
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: Digital signature
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/b2e7e71b/attachment.sig>
Dne 18.1.2018 v 09:17 Michal Fabík napsal(a):
zobrazit citaci
> 2018-01-18 8:45 GMT+01:00 majka <majka.zem+talk na gmail.com>:
>> Podle mého jednoznačně loc_name. Ve chvíli, kdy se to objeví na cedulích pak
>> přesunout do name
>
> Na cedulích? Jednou mně tady bylo řečeno, že cedule jsou irelevatní a
> že směrodatná jsou data ČÚZK.
>
No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí
na OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to
zmapováno i podle cedule (alt_name?).
(Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím
to o dlouhém večeru přeložit:
https://wiki.openstreetmap.org/wiki/Good_practice#Map_what.27s_on_the_ground
)
Zdar,
HPM
2018-01-18 11:02 GMT+01:00 Jan Martinec <jan na martinec.name>:
zobrazit citaci
> No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí na
> OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to zmapováno i
> podle cedule (alt_name?).
>
> (Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím to o
> dlouhém večeru přeložit:
> https://wiki.openstreetmap.org/wiki/Good_practice#Map_what.27s_on_the_ground
Takhle jo, _i_ podle cedule, do alt_name. Prý by ale cedule (resp.
podoba názvu na ní) nemá sloužit jako zdroj pro name.
--
Michal Fabík---------- Původní e-mail ----------
Od: Michal Fabík <michal.fabik na gmail.com>
Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
Datum: 18. 1. 2018 11:09:54
Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
"2018-01-18 11:02 GMT+01:00 Jan Martinec <jan na martinec.name>:
zobrazit citaci
> No, to se mi nezdá. ČÚZK je sice právně směrodatný zdroj, ale OSM stojí na
> OTGR, čili ověřitelnosti v terénu. Pokud je tam cedule, budiž to zmapováno
i
zobrazit citaci
> podle cedule (alt_name?).
>
> (Tohle je kupodivu anglicky i slovensky, ale česky ne? No vida, zkusím to
o
zobrazit citaci
> dlouhém večeru přeložit:
> https://wiki.openstreetmap.org/wiki/Good_practice#Map_what.27s_on_the_
ground
Takhle jo, _i_ podle cedule, do alt_name. Prý by ale cedule (resp.
podoba názvu na ní) nemá sloužit jako zdroj pro name.
"
Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1. máje", "Kpt.
Jaroše", "Nám. Svobody"...
To je pravda. Do name by se to mělo rozepsat.
Ale jinak nevidím důvod, proč do name tu ceduli nepřepsat.
Marián
"
--
Michal Fabík
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/9d491d48/attachment.html>
On 2018-01-18, 10:18 GMT, Marián Kyral wrote:
zobrazit citaci
> Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1.
> máje", "Kpt. Jaroše", "Nám. Svobody"...
Já jsem měl na mysli spíše ulici V jámě.
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Quod fuimus, estis; quod sumus, vos eritis.---------- Původní e-mail ----------
Od: MatějCepl <mcepl na cepl.eu>
Komu: talk-cz na openstreetmap.org
Datum: 18. 1. 2018 14:02:59
Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
"On 2018-01-18, 10:18 GMT, Marián Kyral wrote:
zobrazit citaci
> Jestli to spíše nebylo míněno tak, že do name nepatří "Tř. 1.
> máje", "Kpt. Jaroše", "Nám. Svobody"...
Já jsem měl na mysli spíše ulici V jámě.
"
Tam je problém, pravidla pravopisu se občas mění a záleží jak se k tomu
postaví místní samospráva (ta co pojmenovává ulice).
Někde se snaží mít to dle pravidel, jinde lpí na starém názvu a někde to
neřeší a píší si to jak chtějí - jinak je to v KM, jinak v registrech, půlka
cedulí tak, druhá půlka jinak. Už nevím, kde jsem to viděl/četl, ale stalo
se, že zastupitelé schválili určitý název, ale do KM se (zřejmě chybou
úředníka) dostalo něco trochu jiného.
Pro případ výše jsou podle mně možné obě možnosti, záleží na kontextu:
V jámě - v nějaké obecné rýze, která jámu připomíná
V Jámě - dané místo je jmenuje Jáma.
Bez bližší znalosti místa je těžké říct, jak je to správně. A už vůbec
nedokáži říct, odkud se to má brát.
Marián
"
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Quod fuimus, estis; quod sumus, vos eritis.
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/7218223a/attachment.html>
Uliční cedule jsou navíc typicky psány CAPS LOCKem, takže to neulehčují.
--
Severák
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/95bd9274/attachment.html>
Ahoj,
4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal).
2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
zobrazit citaci
> ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working
> group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v
> nazvech. A podle toho dal. Do te doby...
>
Budeme se ptát data working group, jestli chtějí v rámci celého světa v
názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
textu se prostě např. po jednopísmenných předložkách píše nezlomitelná
mezera. Ale tahle debata už tu proběhla.
Římské číslice v Unicode jsou úplně jiná situace a do názvů nepatří. Viz
Unicode Standard 10.0.0, kapitola 22.3 (s. 798) [1]; TLDR existují jen
kvůli východoasijským zemím: „For most purposes, it is preferable to
compose the Roman numerals from sequences of the appropriate Latin letters.
However, the uppercase and lowercase variants of the Roman numerals through
12, plus L, C, D, and M, have been encoded in the Number Forms block
(U+2150..U+218F) for compatibility with East Asian standards. Unlike
sequences of Latin letters, these symbols remain upright in vertical
layout. Additionally, in certain locales, compact date formats use Roman
numerals for the month, but may expect the use of a single character.“
-- Petr Kadlec / Mormegil
[1]: https://www.unicode.org/versions/Unicode10.0.0/ch22.pdf
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/19d5a376/attachment.html>
Dne 18.1.2018 v 14:41 Petr Kadlec napsal(a):
zobrazit citaci
> Ahoj,
>
> 4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal).
>
> 2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz
> <mailto:pavel na ucw.cz>>:
>
> ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working
> group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v
> nazvech. A podle toho dal. Do te doby...
>
>
> Budeme se ptát data working group, jestli chtějí v rámci celého světa v
> názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
> textu se prostě např. po jednopísmenných předložkách píše nezlomitelná
> mezera.
Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo
drzet pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco
tagovat pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel
reneder sam vedet, ze v dany lokalite ma ten text spojit.
Ale tahle debata už tu proběhla.
zobrazit citaci
>
> Římské číslice v Unicode jsou úplně jiná situace a do názvů nepatří. Viz
> Unicode Standard 10.0.0, kapitola 22.3 (s. 798) [1]; TLDR existují jen
> kvůli východoasijským zemím: „For most purposes, it is preferable to
> compose the Roman numerals from sequences of the appropriate Latin
> letters. However, the uppercase and lowercase variants of the Roman
> numerals through 12, plus L, C, D, and M, have been encoded in the
> Number Forms block (U+2150..U+218F) for compatibility with East Asian
> standards. Unlike sequences of Latin letters, these symbols remain
> upright in vertical layout. Additionally, in certain locales, compact
> date formats use Roman numerals for the month, but may expect the use of
> a single character.“
Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by nikdy
nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu. Na
druhou stranu existuji znaky, trebas (c), coz ve skutecnosti je jeden
znak, a tudiz by to i jako jeden znak melo byt pouzivano.
zobrazit citaci
>
> -- Petr Kadlec / Mormegil
A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises basne) a
ne minus -.
zobrazit citaci
>
> [1]: https://www.unicode.org/versions/Unicode10.0.0/ch22.pdf
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
No...ulice je tam od 13.století, zatímco hospoda vznikla i zanikla v době,
k níž ještě existují pamětníci - jmenovala se hospoda podle ulice, nikoli
naopak (dokonce vedle Jámy byla kavárna Kyvadlo). Velké "J" by tam sice
mělo být podle nového pravopisu, byť je ulice asi pojmenovaná podle morové
jámy, která pravděpodobně pojmenování ani neměla, ale s tou jednoznačností
jména je to hodně vratké ;)
Zdar,
HPM
Dne 18. 1. 2018 16:02 napsal uživatel "Matěj Cepl" <mcepl na cepl.eu>:
On 2018-01-18, 13:30 GMT, Marián Kyral wrote:
zobrazit citaci
> Tam je problém, pravidla pravopisu se občas mění a záleží jak
> se k tomu postaví místní samospráva (ta co pojmenovává ulice).
Point nebylo velké nebo malé písmeno (a tady je zcela nepochybně
velké, protože se jedná o bývalou hospodu Jáma,
https://www.openstreetmap.org/way/4387743), ale jednopísmenová
předložka, která si zaslouží oddělit od druhého slova
nezlomitelnou mezerou, což je co jsem v tom textu měl.
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Do not long for the night, when people vanish in their place.
Be careful, do not turn to evil; for you have preferred this to
affliction.
-- Job 36:20f (NASB)
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/d824622f/attachment.html>
Ahoj,
2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>:
zobrazit citaci
> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet
> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat
> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam
> vedet, ze v dany lokalite ma ten text spojit.
>
Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
software pro reprezentaci textových dat používá Unicode. Proto bychom měli
vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit
odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z
databáze OSM stáhnu seznam všech ulic, chci to tam mít.
zobrazit citaci
> Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by nikdy
> nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu.
>
E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s
tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“,
tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil
správně, nebo jakožecože?
zobrazit citaci
> -- Petr Kadlec / Mormegil
>
>
> A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises basne) a
> ne minus -.
>
„-“ není minus o nic víc než pomlčka (minus je „−“). A „--“ není a nemá být
pomlčka.
-- Petr Kadlec / Mormegil
[1]: http://prirucka.ujc.cas.cz/?id=880
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/28769eb8/attachment.html>---------- Původní e-mail ----------
Od: Petr Kadlec <petr.kadlec na gmail.com>
Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
Datum: 18. 1. 2018 17:58:17
Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
"
Ahoj,
2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net(mailto:jzvc na tpfree.net)>:
"Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet
pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat
pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam
vedet, ze v dany lokalite ma ten text spojit.
"
Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera, existuje
název, v němž se nesmí na nějakém místě zalomit řádek. My ale nežijeme v
platónském světě názvů, my vyrábíme data pro software a tento software pro
reprezentaci textových dat používá Unicode. Proto bychom měli vzít název a
podle toho, jak se má správně psát,[1] bychom měli zvolit odpovídající
reprezentaci v Unicode. Nejde jen o renderer. Když si z databáze OSM stáhnu
seznam všech ulic, chci to tam mít.
"
Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V"
musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké
kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to
musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu?
Marián
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/518cfb2b/attachment.html>
N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité
znaky jako ekvivalentní.
HPM
Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>:
zobrazit citaci
>
> ---------- Původní e-mail ----------
> Od: Petr Kadlec <petr.kadlec na gmail.com>
> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
> Datum: 18. 1. 2018 17:58:17
> Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
>
> Ahoj,
>
> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>:
>
> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet
> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat
> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam
> vedet, ze v dany lokalite ma ten text spojit.
>
>
> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
> software pro reprezentaci textových dat používá Unicode. Proto bychom měli
> vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit
> odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z
> databáze OSM stáhnu seznam všech ulic, chci to tam mít.
>
>
>
> Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V"
> musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké
> kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to
> musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu?
>
> Marián
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/4c328c51/attachment.html>
Nominatim tohle zvládá, Overpass (alespoň standardně) nikoliv - ten bere
nápisy s přesností na znak. Díky tomu jsem na tyhle problémy přišel.
2018-01-18 18:26 GMT+01:00 Jan Martinec <jan na martinec.name>:
zobrazit citaci
> N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité
> znaky jako ekvivalentní.
>
> HPM
>
> Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>:
>
>>
>> ---------- Původní e-mail ----------
>> Od: Petr Kadlec <petr.kadlec na gmail.com>
>> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
>> Datum: 18. 1. 2018 17:58:17
>> Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
>>
>> Ahoj,
>>
>> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>:
>>
>> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
>> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo drzet
>> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco tagovat
>> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam
>> vedet, ze v dany lokalite ma ten text spojit.
>>
>>
>> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
>> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
>> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
>> software pro reprezentaci textových dat používá Unicode. Proto bychom měli
>> vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit
>> odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z
>> databáze OSM stáhnu seznam všech ulic, chci to tam mít.
>>
>>
>>
>> Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V"
>> musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké
>> kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na to
>> musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu?
>>
>> Marián
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/9dd802af/attachment.html>
Overpass to bere s přesností na znak nebo na binární iterpretaci?
Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou
sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to chyba
toho softwaru.
Pokud ale v nějakém jazyce nemá být nějaká sekvence znaků samostatně na konci
řádku, je potřeba za ní dát nedělitelnou mezeru. Protože tohle si žádný
software z prstu nevycucá. To není psaní názvů pro renderer, to je normální
psaní textu v unicode.
Lukáš
Dne čtvrtek 18. ledna 2018 18:31:38 CET Matej Lieskovský napsal(a):
zobrazit citaci
> Nominatim tohle zvládá, Overpass (alespoň standardně) nikoliv - ten bere
> nápisy s přesností na znak. Díky tomu jsem na tyhle problémy přišel.
>
> 2018-01-18 18:26 GMT+01:00 Jan Martinec <jan na martinec.name>:
> > N i O mají plnou podporu Unicode, tj. měly by "vidět" všechny mezerovité
> > znaky jako ekvivalentní.
> >
> > HPM
> >
> > Dne 18. 1. 2018 18:24 napsal uživatel "Marián Kyral" <mkyral na email.cz>:
> >> ---------- Původní e-mail ----------
> >> Od: Petr Kadlec <petr.kadlec na gmail.com>
> >> Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
> >> Datum: 18. 1. 2018 17:58:17
> >> Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
> >>
> >> Ahoj,
> >>
> >> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net>:
> >>
> >> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
> >> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo
> >> drzet
> >> pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes neco
> >> tagovat
> >> pro reneder, coz se v OSM vyslovene zapovida. Spravne by mel reneder sam
> >> vedet, ze v dany lokalite ma ten text spojit.
> >>
> >>
> >> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
> >> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
> >> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
> >> software pro reprezentaci textových dat používá Unicode. Proto bychom
> >> měli
> >> vzít název a podle toho, jak se má správně psát,[1] bychom měli zvolit
> >> odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když si z
> >> databáze OSM stáhnu seznam všech ulic, chci to tam mít.
> >>
> >>
> >>
> >> Takže pokud pak budu tu ulici hledat, tak si musím pamatovat, že za "V"
> >> musím napsat nezalomitelnou mezeru, jinak mi třeba nominatin najde velké
> >> kulové? U něj by to ještě šlo nějak ošetřit, ale třeba u Overpass už na
> >> to
> >> musím myslet já. Sám to za mně neudělá. Nekomplikuješ nám to tak trochu?
> >>
> >> Marián
> >>
> >> _______________________________________________
> >> Talk-cz mailing list
> >> Talk-cz na openstreetmap.org
> >> https://lists.openstreetmap.org/listinfo/talk-cz
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/c9d1c29f/attachment.sig>
On Thu 2018-01-18 14:41:02, Petr Kadlec wrote:
zobrazit citaci
> Ahoj,
>
> 4 nebo 3 (nebo 5, ale to je jiná práce, úplně bych to s tímhle nemíchal).
>
> 2018-01-18 10:46 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>
> > ...Tedy ve skutecnosti... 1). Pripadne se zeptat na data working
> > group, co si o tom mysli, a jestli chteji v ramci celeho sveta nbsp v
> > nazvech. A podle toho dal. Do te doby...
> >
>
> Budeme se ptát data working group, jestli chtějí v rámci celého světa v
> názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
Tohle neni ferova argumentace, ze?
Pevne mezery nejsou jen v cestine, takze dava smysl to mit
konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je
pekna kravina. Kazdopadne... data working group. Vsude nebo nikde.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: Digital signature
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/d3ade972/attachment.sig>
2018-01-18 20:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:
zobrazit citaci
> Overpass to bere s přesností na znak nebo na binární iterpretaci?
> Ptám se protože i pitomá česká diakritika se dá v unicode zapsat různou
> sekvencí bytů... Pokud nějaký software neumí pracovat s unicode, je to
> chyba
> toho softwaru.
>
Ano, a zjevně je to přesně tak, viz seznam omezení na
https://wiki.openstreetmap.org/wiki/Overpass_API/Language_Guide#Accents_and_decorated_characters
(pokud vstup není v NFC, nebude to fungovat; třeba „way["name"="Na
Rybníčku"]“; i když tohle se dá ještě relativně snadno řešit automaticky
na vstupu (dokud se pohybujeme v češtině, kde se nic složitějšího
nevyskytuje)). O složitějších případech nemluvě (jako třeba hledání bez
diakritiky).
V zásadě si Overpass asi představuje, že si to každý ošetří stylem
way["name"~"^V[ \u00A0]Tůních$"]
O implementaci Overpassu nic moc nevím, takže netuším, kolik práce by bylo
to nějak opravit/dodělat.
-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/643ed1f7/attachment.html>
2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
zobrazit citaci
> > Budeme se ptát data working group, jestli chtějí v rámci celého světa v
> > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
>
> Tohle neni ferova argumentace, ze?
>
> Pevne mezery nejsou jen v cestine, takze dava smysl to mit
> konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je
> pekna kravina. Kazdopadne... data working group. Vsude nebo nikde.
>
Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde
na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil…
Namátkou (i když přiznávám, že jsem čekal větší užití).
https://www.openstreetmap.org/node/2380290743
https://www.openstreetmap.org/relation/1074049
https://www.openstreetmap.org/node/5337546040
https://www.openstreetmap.org/way/454759316 Či dokonce s ještě
zajímavějšími variantami… https://www.openstreetmap.org/node/530880275
Každopádně mi to přijde podobné, jako chtít zakazovat třeba pomlčku; jasně,
není na klávesnici a „-“ může víceméně vcelku fungovat taky a renderer si
to může vyřešit a kdo má vědět, že to mám do Overpass psát takhle atd.
A ano, nástrojům zjevně k ideálu ledacos chybí, ale právě proto je potřeba
vylepšovat nástroje, ne zhoršovat data; jinak bychom dodnes na počítačích
psali bez diakritiky všichni.
-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180118/51e780b5/attachment.html>
On 2018-01-17, 21:14 GMT, Matej Lieskovský wrote:
zobrazit citaci
> @Matěj: Podle ČÚZK žádné díly neexistují a basta! :)
To je další neřešitelná diskuse: je rozhodující ČÚZK nebo cedule
na plotě?
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
A philosopher like Plato, according to Luther's colorful imagery,
remains like a cow who looks at a new door, refusing to enter?
On 2018-01-18, 16:49 GMT, Jan Martinec wrote:
zobrazit citaci
> No...ulice je tam od 13.století, zatímco hospoda vznikla i zanikla v době,
> k níž ještě existují pamětníci - jmenovala se hospoda podle ulice, nikoli
> naopak (dokonce vedle Jámy byla kavárna Kyvadlo). Velké "J" by tam sice
> mělo být podle nového pravopisu, byť je ulice asi pojmenovaná podle morové
> jámy, která pravděpodobně pojmenování ani neměla, ale s tou jednoznačností
> jména je to hodně vratké ;)
Tak se omlouvám … o jménu blábolím, i když jsem do té hospody
chodíval na oběd. A pozitivní na tom je, že alespoň vypadá
stejně dobrá jako bývala před těma skoro dvaceti lety. Úžasné.
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
All parts should go together without forcing. You must remember
that the parts you are reassembling were disassembled by you.
Therefore, if you can't get them together again, there must be a
reason. By all means, do not use a hammer.
-- IBM maintenance manual, 1925
Dne 18.1.2018 v 17:57 Petr Kadlec napsal(a):
zobrazit citaci
> Ahoj,
>
> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net <mailto:jzvc na tpfree.net>>:
>
> Ne, nepise, nic jako nezalomitelna mezera neexistuje. To je pouze
> typograficka pomucka pro SW, ktery neumi jinak rict, ze by neco melo
> drzet pri sobe. Ve skutecnosti je to exaktne totez, jako kdyz budes
> neco tagovat pro reneder, coz se v OSM vyslovene zapovida. Spravne
> by mel reneder sam vedet, ze v dany lokalite ma ten text spojit.
>
>
> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
> software pro reprezentaci textových dat používá Unicode. Proto bychom
> měli vzít název a podle toho, jak se má správně psát,[1] bychom měli
> zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když
> si z databáze OSM stáhnu seznam všech ulic, chci to tam mít.
Ja chci a chci a chci ... to je presne tvuj pristup. Nazev se pise s
mezerou, a znak nedelitelny mezery v zadnych pravidlech ani v zadnych
datech NEEXISTUJE!. Jestli je tvuj SW hloupej a neumi implementovat
pravidla pravopisu, je to problem toho SW, ale netahej to do dat, tam to
nema co pohledavat. Znak nedelitelny mezery nema ani naprosto nic
spolecnyho s unicode, jen tam ma nejakou reprezentaci, stejne jako tuny
jinych znaku.
Ja zase chci, aby se spravne pouzivaly ligatury, takze ti do name misto
tech dvou znaku latinky dam ten jeden znak unicode kterej resi tu
konkretni ligaturu. Sem vazne zvedav, jak v tom pak budes neco hledat.
Opet, je to vec SW aby to pouzil, ale nema to co pohledavat v datech.
Mimochodem, ukaz mi jedinyho cloveka na tyhle planete, kterej kdyz pise
text na klavesnici, tak misto mezerniku pouziva ctrl/alt/... . A pak
chci taky videt, kde ma nbsp zadat nekdo z telefonu.
zobrazit citaci
>
> Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by
> nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec renederu.
>
>
> E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s
> tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“,
> tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil
> správně, nebo jakožecože?
Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze
(a OSM neni nic jineho) funguji. Protoze v datech ma byt castka a
oznaceni meny ... zvlast.
zobrazit citaci
>
> -- Petr Kadlec / Mormegil
>
>
> A mimochodem, v textu se pise pomlcka – (pripadne — pokud pises
> basne) a ne minus -.
>
>
> „-“ není minus o nic víc než pomlčka (minus je „−“). A „--“ není a nemá
> být pomlčka.
>
> -- Petr Kadlec / Mormegil
>
> [1]: http://prirucka.ujc.cas.cz/?id=880
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
zobrazit citaci
> Ja chci a chci a chci ... to je presne tvuj pristup. Nazev se pise
> s mezerou, a znak nedelitelny mezery v zadnych pravidlech ani v zadnych
> datech NEEXISTUJE!
popravdě, přístup, kdy někdo normálně vyjádří své zbožné přání, je mi
podstatně sympatičtější, než když někdo něco označuje za prostý fakt, bez
důkazu a ve zjevném rozporu s realitou - pakliže "v zadnych datech
NEEXISTUJE", zřejmě neexistuje ani tato diskuse, neboť ta se rozvinula pod
mailem o tom, že v datech OSM nějaké ty nbsp máme ...
...
zobrazit citaci
> > > Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by
> > > nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec
> > > renederu.
> >
> > E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s
> > tím má společného renderer? Jako že když existuje podnik ?Vše za $0,99?,
> > tak tam mám psát ?Vše za USD0,99? a je věcí rendereru, aby to vykreslil
> > správně, nebo jakožecože?
>
> Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze
> (a OSM neni nic jineho) funguji. Protoze v datech ma byt castka a
> oznaceni meny ... zvlast.
rád bych viděl nějakou vzorovou implementaci toho nehloupého SW, ve které bude
fungovat výše uvedený příklad, s tím, že označení měny bude zvlášť
když tedy, ještě jednou zdůrazňuji z citace: "... v OSM by NIKDY NIKDE byt
nemel ..."
K.
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 195 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/57e355f8/attachment.sig>
Ahoj,
2018-01-19 13:36 GMT+01:00 jzvc <jzvc na tpfree.net>:
zobrazit citaci
> 2018-01-18 17:36 GMT+01:00 jzvc <jzvc na tpfree.net <mailto:jzvc na tpfree.net
> >>:
>
>> Ano, v platónském světě názvů ulic neexistuje nezalomitelná mezera,
>> existuje název, v němž se nesmí na nějakém místě zalomit řádek. My ale
>> nežijeme v platónském světě názvů, my vyrábíme data pro software a tento
>> software pro reprezentaci textových dat používá Unicode. Proto bychom
>> měli vzít název a podle toho, jak se má správně psát,[1] bychom měli
>> zvolit odpovídající reprezentaci v Unicode. Nejde jen o renderer. Když
>> si z databáze OSM stáhnu seznam všech ulic, chci to tam mít.
>>
>
> Ja chci a chci a chci ... to je presne tvuj pristup.
Mohl bys prosím přestat vyskakovat jako čertík z krabičky a normálně
argumentovat? Kdyby to aspoň bylo na téma prezidentských voleb nebo něco,
ale kvůli mezerám v OSM se snad nemusíme takhle hádat?
zobrazit citaci
> Nazev se pise s mezerou, a znak nedelitelny mezery v zadnych pravidlech
> ani v zadnych datech NEEXISTUJE!. Jestli je tvuj SW hloupej a neumi
> implementovat pravidla pravopisu, je to problem toho SW, ale netahej to do
> dat, tam to nema co pohledavat. Znak nedelitelny mezery nema ani naprosto
> nic spolecnyho s unicode, jen tam ma nejakou reprezentaci, stejne jako tuny
> jinych znaku.
>
Unicode specifikuje způsob reprezentace textových dat v počítačích. To je
jeho podstata. Součástí toho standardu reprezentace je definice sémantiky
těch jednotlivých codepointů. Odkaz třeba na IJP ÚJČ jsem sem dával už
předtím. Aby každý software na světě nemusel implementovat pravidla psaní
ve všech možných jazycích a kódováních zcela od nuly, vzniknul Unicode.
zobrazit citaci
> Ja zase chci, aby se spravne pouzivaly ligatury, takze ti do name misto
> tech dvou znaku latinky dam ten jeden znak unicode kterej resi tu konkretni
> ligaturu. Sem vazne zvedav, jak v tom pak budes neco hledat. Opet, je to
> vec SW aby to pouzil, ale nema to co pohledavat v datech.
>
Dalo by se bavit o tom, zda je tam chceme mít, ale myslím, že ligatury jsou
v Unicode zpravidla jen jako prezentační forma znaků pro zpětnou
kompatibilitu, přičemž mají kompatibilní dekompozicí na ty základní znaky,
s tím, že dnes by se to mělo nechat na vykreslování, kterému se pomáhá
pomocí označení míst, kde se to chová nestandardně (např. na švu slova),
pomocí ZWJ/ZWNJ. Takže z tohohle pohledu by se ZWJ/ZWNJ v datech případně
objevit mohly, ale ligatury tam, myslím, nepatří.
zobrazit citaci
> Mimochodem, ukaz mi jedinyho cloveka na tyhle planete, kterej kdyz pise
> text na klavesnici, tak misto mezerniku pouziva ctrl/alt/... . A pak chci
> taky videt, kde ma nbsp zadat nekdo z telefonu.
>
Takového neznám, ani nevím, jak to s touto debatou souvisí. Jestli tě
zajímá někdo, kdo *navíc* k mezerníku používá ctrl/alt/… (fskutčnosti
AltGr), když chce napsat nbsp, tak třeba já. A taky píšu české uvozovky a
trojtečku místo tří teček. Ale netvrdím, že jsem normální. A už vůbec
netvrdím, že to má být povinné a pokud někdo nenapíše (třeba na telefonu,
ale i kdekoli jinde) správnou nezlomitelnou mezeru, tak se má vyhodit z OSM
a upálit na hranici.
zobrazit citaci
> Ve skutecnosti ma trebas dolar znak pro svoji menu, ale v OSM by
>> nikdy nikde byt nemel, tam by mel byt kod meny. Opet je to vec
>> renederu.
>>
>>
>> E? Kde v OSM se v jakém kontextu [ne]vyskytuje jaký znak pro měnu a co s
>> tím má společného renderer? Jako že když existuje podnik „Vše za $0,99“,
>> tak tam mám psát „Vše za USD0,99“ a je věcí rendereru, aby to vykreslil
>> správně, nebo jakožecože?
>>
>
> Ne, to je jen o tom ze podle vseho naprosto nerozumis tomu jak databaze (a
> OSM neni nic jineho) funguji. Protoze v datech ma byt castka a oznaceni
> meny ... zvlast.
>
Nech si ty nesmyslné ad hominem útoky a vysvětli mi, jak souvisí oddělená
reprezentace částky a označení měny s tím, že se do textového pole pro
název má psát správně formátovaný název. Nebo snad chceš říct, že v
databázi má být předložka a následující obsah … zvlášť? Anebo to prostě
nemá s touto diskusí společného nic?
-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/1157c49d/attachment.html>
On Thu 2018-01-18 23:10:10, Petr Kadlec wrote:
zobrazit citaci
> 2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>
> > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v
> > > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
> >
> > Tohle neni ferova argumentace, ze?
> >
> > Pevne mezery nejsou jen v cestine, takze dava smysl to mit
> > konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je
> > pekna kravina. Kazdopadne... data working group. Vsude nebo nikde.
> >
>
> Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde
> na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil…
> Namátkou (i když přiznávám, že jsem čekal větší užití).
> https://www.openstreetmap.org/node/2380290743
> https://www.openstreetmap.org/relation/1074049
> https://www.openstreetmap.org/node/5337546040
> https://www.openstreetmap.org/way/454759316 Či dokonce s ještě
> zajímavějšími variantami… https://www.openstreetmap.org/node/530880275
Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne
"U Lomu".
Kazdopadne se nema cenu hadat tady, tohle je na data working group.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: Digital signature
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/5467a302/attachment.sig>
On Thu 2018-01-18 23:10:10, Petr Kadlec wrote:
zobrazit citaci
> 2018-01-18 21:42 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>
> > > Budeme se ptát data working group, jestli chtějí v rámci celého světa v
> > > názvem používat tečky, velká písmena, mezery, azbuku, … atd.? V českém
> >
> > Tohle neni ferova argumentace, ze?
> >
> > Pevne mezery nejsou jen v cestine, takze dava smysl to mit
> > konzistentni pres cely svet. Osobne si myslim ze mit je v name="" je
> > pekna kravina. Kazdopadne... data working group. Vsude nebo nikde.
> >
>
> Pravidlo o jednopísmenných předložkách je jen české. A jako že by se nikde
> na světě nezlomitelné mezery vůbec nepoužívaly, to bych taky netvrdil…
> Namátkou (i když přiznávám, že jsem čekal větší užití).
> https://www.openstreetmap.org/node/2380290743
> https://www.openstreetmap.org/relation/1074049
> https://www.openstreetmap.org/node/5337546040
> https://www.openstreetmap.org/way/454759316 Či dokonce s ještě
> zajímavějšími variantami… https://www.openstreetmap.org/node/530880275
>
> Každopádně mi to přijde podobné, jako chtít zakazovat třeba pomlčku; jasně,
> není na klávesnici a „-“ může víceméně vcelku fungovat taky a renderer si
> to může vyřešit a kdo má vědět, že to mám do Overpass psát takhle atd.
>
> A ano, nástrojům zjevně k ideálu ledacos chybí, ale právě proto je potřeba
Hmm. A nemam pocit ze by mail mel v subjektu pevnou mezeru, nebo ze by
ve vete co cituju byly pevny mezery. Proste tam nemaj co delat, to je
az veci formatovani pro tisk... Stejne nepatrej do name.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: Digital signature
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/e002760f/attachment.sig>
Ahoj,
2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
zobrazit citaci
> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne
> "U Lomu".
>
To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou
psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to
nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že
ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně,
protože se o to postará sám Word. Zcela namátkou: Zápis z jednání
Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“
nezlomitelnou mezeru. Je to důkaz, není to důkaz?
A co se týče státních databází, tak na ty bych v tomto ohledu moc
nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s
pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně
používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela
namátkou: IČO 27799719.
-- Petr Kadlec / Mormegil
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180119/9be600c4/attachment.html>
Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď.
Matej
2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>:
zobrazit citaci
> Ahoj,
>
> 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>
>> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne
>> "U Lomu".
>>
>
> To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou
> psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to
> nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že
> ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně,
> protože se o to postará sám Word. Zcela namátkou: Zápis z jednání
> Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“
> nezlomitelnou mezeru. Je to důkaz, není to důkaz?
>
> A co se týče státních databází, tak na ty bych v tomto ohledu moc
> nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s
> pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně
> používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela
> namátkou: IČO 27799719.
>
> -- Petr Kadlec / Mormegil
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180121/c901607f/attachment.html>
Dobry den,
jsem PROTI nedelitelnym mezeram (unicode cislicim). Jako programator v nich vidim spis dalsi problemy pri zpracovani.
*) nastroje - JOSM, webove nepodporuji zobrazeni nedelitelnych mezer
*) nazev ulice s mezerou a nedelitelnou mezerou neni povazovan za stejny. Mozna pomuze normalizace ale ta znamena docela vyznamny overhead.
*) nejsem si jisty ze vsechny adresy/adresni body v ulici dodrzi pouziti nbsp. Jedna ulice muze byt na dvou ways na jedne s nbsp a na druhe s normalni mezerou.
*) regexp - myslim ze i tady mohou byt problemy. Nemam zde moc skusenosti
*) spravne zobrazeni ma byt reseno rendererem i kdyz nebude fungovat ve vsech pripadech spravne
Navrh :-)
Pokud chcete resit problem pak je to "Ch
Martin JANDA
21. 1. 2018 v 1:13, Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď.
>
> Matej
>
> 2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>:
>> Ahoj,
>>
>> 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>>> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne
>>> "U Lomu".
>>
>>
>> To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně, protože se o to postará sám Word. Zcela namátkou: Zápis z jednání Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“ nezlomitelnou mezeru. Je to důkaz, není to důkaz?
>>
>> A co se týče státních databází, tak na ty bych v tomto ohledu moc nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela namátkou: IČO 27799719.
>>
>> -- Petr Kadlec / Mormegil
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180121/2b59b77b/attachment.html>
Ahoj!
Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, případně
se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6.
Co dál?
Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo nechceme.
Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme k
výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje pro
přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk.
Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a
problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační
válce.
Matej
2018-01-21 7:17 GMT+01:00 Martin Janda <jandam na crcdata.cz>:
zobrazit citaci
> Dobry den,
>
> jsem PROTI nedelitelnym mezeram (unicode cislicim). Jako programator v
> nich vidim spis dalsi problemy pri zpracovani.
> *) nastroje - JOSM, webove nepodporuji zobrazeni nedelitelnych mezer
> *) nazev ulice s mezerou a nedelitelnou mezerou neni povazovan za stejny.
> Mozna pomuze normalizace ale ta znamena docela vyznamny overhead.
> *) nejsem si jisty ze vsechny adresy/adresni body v ulici dodrzi pouziti
> nbsp. Jedna ulice muze byt na dvou ways na jedne s nbsp a na druhe s
> normalni mezerou.
> *) regexp - myslim ze i tady mohou byt problemy. Nemam zde moc skusenosti
> *) spravne zobrazeni ma byt reseno rendererem i kdyz nebude fungovat ve
> vsech pripadech spravne
>
> Navrh :-)
> Pokud chcete resit problem pak je to "Ch
>
>
> Martin JANDA
>
> 21. 1. 2018 v 1:13, Matej Lieskovský <lieskovsky.matej na gmail.com>:
>
> Dobrá, ráno napíšu na DWG. Ozvu se, až budeme mít odpověď.
>
> Matej
>
> 2018-01-19 15:46 GMT+01:00 Petr Kadlec <petr.kadlec na gmail.com>:
>
>> Ahoj,
>>
>> 2018-01-19 14:49 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
>>
>>> Myslim ze v oficialnich dokumentech se ulice jmenuje "U Lomu" ne
>>> "U Lomu".
>>>
>>
>> To se těžko hodnotí. Co je ten oficiální dokument? Je to vytištěný/rukou
>> psaný papír? Je to forma ve Wordu? Ve vytištěné/rukou psané formě to
>> nepoznáš, když se to zrovna nezalomí (což by zase naopak naznačovalo, že
>> ten člověk neumí správně psát), ve Wordu to naopak dost často bude správně,
>> protože se o to postará sám Word. Zcela namátkou: Zápis z jednání
>> Místopisné komise Rady HMP z 27.4.2011 používá ve zmíněné ulici „K jelenám“
>> nezlomitelnou mezeru. Je to důkaz, není to důkaz?
>>
>> A co se týče státních databází, tak na ty bych v tomto ohledu moc
>> nespoléhal. Ostatně, v takovém obchodním rejstříku se stát neobtěžuje ani s
>> pomlčkami. I když máš zakladatelskou dokumentaci, ve které se zjevně
>> používá pomlčka, nahlížení do OR ukazuje název se spojovníkem. Zcela
>> namátkou: IČO 27799719.
>>
>> -- Petr Kadlec / Mormegil
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/8f99a217/attachment.html>
On 23.1.2018 17:56, Matej Lieskovský wrote:
zobrazit citaci
> Ahoj!
>
> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami,
> případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6.
>
> Co dál?
>
> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo
> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se
> dopracujeme k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje
> hlavně nástroje pro přispěvatele a konzumenty) opravdu přijde spíš jako
> problém pro Talk. Technicky vzato máme od DWG posvěcení si to nějak
> rozhodnout lokálně a problémy s globálními nástroji řešit pak. Velmi rád
> bych se vyhnul editační válce.
>
> Matej
Ahoj,
jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných
zemí, jestli to někde nějak řeší? To typografické pravidlo o
jednopísmenných předložkách na konci řádku se zdaleka netýká jen
češtiny. I když je fakt, že asi málokterá z lokálních komunit je na
takové úrovni, aby se něčím takovým vůbec zabývali...
Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
renderer, zas taková věda to snad není.
--
Michal Fabík
Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do TeXových
zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na mezinárodní
poměry) relativně hodně.
2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
zobrazit citaci
> On 23.1.2018 17:56, Matej Lieskovský wrote:
>
>> Ahoj!
>>
>> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami, případně
>> se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6.
>>
>> Co dál?
>>
>> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo
>> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme
>> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje
>> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk.
>> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a
>> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační
>> válce.
>>
>> Matej
>>
>
> Ahoj,
> jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných
> zemí, jestli to někde nějak řeší? To typografické pravidlo o
> jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I
> když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby
> se něčím takovým vůbec zabývali...
>
> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
> renderer, zas taková věda to snad není.
>
> --
> Michal Fabík
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/4312a11d/attachment.html>
Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se
vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak
ještě Francouze, kteří něco takového řeší. Taková Británie je zvyklá, že
jim Angličtinu przní kde kdo, a jsou tak nějak nad věcí.
České jednopísmenné předložky zkrátka vypadají mimořádně špatně, pokud jsou
oddělené na konci řádku / zalomení, už i dvě písmena se při troše vůle dají
skousnout, i když mě to tahá za oči. Z toho bych také odhadla, že jsme ze
školy v tomhle ohledu podstatně víc vycepovaní než jiné národy. Když se k
tomu přidá ještě problém s kódováním češtiny z dřívějška, byly nedělitelné
mezery vlastně jen taková drobnost navíc.
Do dat bych ale nedělitelné mezery netahala, kromě jiného z toho kouká
nutnost to stále kontrolovat a opravovat. Mít to v datech napůl je podle
mého k ničemu, a dosáhnout toho, že to všichni a všude budou respektovat,
nevidím jako reálné. Navíc udělat to co nejméně komplikované se mi zkrátka
líbí nejvíc.
2018-01-23 20:34 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do TeXových
> zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na mezinárodní
> poměry) relativně hodně.
>
>
> 2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
>
>> On 23.1.2018 17:56, Matej Lieskovský wrote:
>>
>>> Ahoj!
>>>
>>> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami,
>>> případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6.
>>>
>>> Co dál?
>>>
>>> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo
>>> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme
>>> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje
>>> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk.
>>> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a
>>> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační
>>> válce.
>>>
>>> Matej
>>>
>>
>> Ahoj,
>> jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných
>> zemí, jestli to někde nějak řeší? To typografické pravidlo o
>> jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I
>> když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby
>> se něčím takovým vůbec zabývali...
>>
>> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
>> renderer, zas taková věda to snad není.
>>
>> --
>> Michal Fabík
>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/7cf2a154/attachment.html>
Kontrolování a opravování je proveditelné. Teď řeším ty street relace (a
školu), ale pak se klidně můžu podívat na nbsp.
S "mít to v datech napůl je k ničemu" souhlasím - proto se mi nelíbí
možnost 6.
2018-01-23 21:01 GMT+01:00 majka <majka.zem+talk na gmail.com>:
zobrazit citaci
> Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se
> vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak
> ještě Francouze, kteří něco takového řeší. Taková Británie je zvyklá, že
> jim Angličtinu przní kde kdo, a jsou tak nějak nad věcí.
>
> České jednopísmenné předložky zkrátka vypadají mimořádně špatně, pokud
> jsou oddělené na konci řádku / zalomení, už i dvě písmena se při troše vůle
> dají skousnout, i když mě to tahá za oči. Z toho bych také odhadla, že jsme
> ze školy v tomhle ohledu podstatně víc vycepovaní než jiné národy. Když se
> k tomu přidá ještě problém s kódováním češtiny z dřívějška, byly
> nedělitelné mezery vlastně jen taková drobnost navíc.
>
>
>
> Do dat bych ale nedělitelné mezery netahala, kromě jiného z toho kouká
> nutnost to stále kontrolovat a opravovat. Mít to v datech napůl je podle
> mého k ničemu, a dosáhnout toho, že to všichni a všude budou respektovat,
> nevidím jako reálné. Navíc udělat to co nejméně komplikované se mi zkrátka
> líbí nejvíc.
>
> 2018-01-23 20:34 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
>
>> Možná relevantní pozorování: Program VLNA, který doplňuje nbsp do
>> TeXových zdrojáků je český výmysl. Je možné, že tohle prostě řešíme (na
>> mezinárodní poměry) relativně hodně.
>>
>>
>> 2018-01-23 18:44 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
>>
>>> On 23.1.2018 17:56, Matej Lieskovský wrote:
>>>
>>>> Ahoj!
>>>>
>>>> Ohledně nbsp: DWG tvrdí, že si to když tak máme rozhodnout sami,
>>>> případně se zeptat na Tagging (nikoliv na Talk). Hlasují pro možnost 6.
>>>>
>>>> Co dál?
>>>>
>>>> Mně se možnost 6 fakt nelíbí, prostě buď tam ty nbsp chceme, nebo
>>>> nechceme. Můžu napsat na Tagging, ale 1) nejsem si jist, zda se dopracujeme
>>>> k výsledku 2) tohle mi (vzhledem k tomu, že to ovlivňuje hlavně nástroje
>>>> pro přispěvatele a konzumenty) opravdu přijde spíš jako problém pro Talk.
>>>> Technicky vzato máme od DWG posvěcení si to nějak rozhodnout lokálně a
>>>> problémy s globálními nástroji řešit pak. Velmi rád bych se vyhnul editační
>>>> válce.
>>>>
>>>> Matej
>>>>
>>>
>>> Ahoj,
>>> jen takový nápad: co se zeptat v komunitách (na mailing listech) jiných
>>> zemí, jestli to někde nějak řeší? To typografické pravidlo o
>>> jednopísmenných předložkách na konci řádku se zdaleka netýká jen češtiny. I
>>> když je fakt, že asi málokterá z lokálních komunit je na takové úrovni, aby
>>> se něčím takovým vůbec zabývali...
>>>
>>> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
>>> renderer, zas taková věda to snad není.
>>>
>>> --
>>> Michal Fabík
>>>
>>>
>>> _______________________________________________
>>> Talk-cz mailing list
>>> Talk-cz na openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-cz
>>>
>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/150b3602/attachment.html>
On 23.1.2018 21:01, majka wrote:
zobrazit citaci
> Netroufám si mluvit za jiné jazyky jako nějaký expert. Ale z toho, co se
> vyskytuje po Evropě, bych to odhadla na nás, možná bratry Slováky a pak
> ještě Francouze, kteří něco takového řeší.
Nejsem si jistý, jestli myslíš "řeší v OSM" nebo "řeší v rámci
typografických zásad", ale pokud to druhé, tak se to týká prakticky
všech slovanských jazyků, i když teď z hlavy fakt nevím, jak často v
těch jednotlivých jazycích nastává situace, že se něco takového vyskytne
v místním názvu.
--
Michal Fabík
Nbsp IMHO do dat nepatří.
Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve smyslu ASCII/
UTF-8 znak 32). Domnívám se, že nad daty OSM operuje dost věcí, které namejí
skutečnou podporu Unicode a spíše zneužívají toho, že UTF-8 je zpětně
kompatibilní s ASCII.
Kromě toho, bílé znaky se strašně těžko debugují.
V diskuzi výše byl zmíněn program vlna. Mám za to, že by bylo lepší
nedělitelné mezery přidávat až před vykreslováním v preprocesingu.
Například německá verze OSM provádí podobným způsobem transliterace
nelatinkových abeced.
--
Mikoláš Štrajt / Severák
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/be7ed6d0/attachment.html>
Zase na druhou stranu platí, že pokud se budeme omezovat na to, co zvládá
již existující software, tak se nikdy nikam neposuneme. Minimálně výhledově
mi přijde jako správné se posouvat směrem k plnohodnotnému Unicode.
Souhlasím, že se bílé znaky blbě debugují, ale minimálně bychom mohli
protlačit do editorů možnost zobrazovat bílé znaky.
Vlna má základní problém v tom, že musíš hlídat, ve kterém jazyce který
název je a spoustu podobných blbostí. Například pokud zahodíme i římské
číslice, tak bude potřeba tipovat, zda je to "v" nebo římská číslice pět.
Část debaty je vlastně o tom, zda je snažší doplňovat nebo zahazovat nbsp.
Mně přijde, že se data vždy snadněji zahazují, ale je otázka, jak často je
co z toho potřeba. Ono se taky může stát, že teď budeme nbsp mazat a za pár
let zase přidávat, protože se SW zlepší.
2018-01-23 22:06 GMT+01:00 Mikoláš Štrajt <strajt9 na seznam.cz>:
zobrazit citaci
> Nbsp IMHO do dat nepatří.
>
> Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve smyslu
> ASCII/UTF-8 znak 32). Domnívám se, že nad daty OSM operuje dost věcí, které
> namejí skutečnou podporu Unicode a spíše zneužívají toho, že UTF-8 je
> zpětně kompatibilní s ASCII.
>
> Kromě toho, bílé znaky se strašně těžko debugují.
>
> V diskuzi výše byl zmíněn program vlna. Mám za to, že by bylo lepší
> nedělitelné mezery přidávat až před vykreslováním v preprocesingu.
>
> Například německá verze OSM provádí podobným způsobem transliterace
> nelatinkových abeced.
>
> --
> Mikoláš Štrajt / Severák
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180123/78bb69ce/attachment.html>
On 2018-01-23, 21:06 GMT, Mikoláš Štrajt wrote:
zobrazit citaci
> Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve
> smyslu ASCII/ UTF-8 znak 32). Domnívám se, že nad daty OSM
> operuje dost věcí, které namejí skutečnou podporu Unicode
> a spíše zneužívají toho, že UTF-8 je zpětně kompatibilní
> s ASCII.
Jenom pro upřesnění: je mezera, alespoň patří do
kategorie WSpace=Y v Unicode
(https://en.wikipedia.org/wiki/Whitespace_character).
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Experience is what you get when you don't get what you want.
-- Dan Stanford
není mezera, je to html zápis mezery, která jinak není vidět :-)
Přijde mi, že tato problematika je zatím příliš futuristická, v době, kdy v
mapě chybí ještě sposuta existujících objektů, my už řešíme drobné grafické
finesy. (což nemusí být nutně špatně)
A druhá věc - jak často nastává případ, že je nutné zalomit dlouhý název,
který obsahuje někde kolem poloviny nedělitelnou mezeru?
Většina názvů jí obsahuje hned na začátku (V°Jámě, U°Dlouhého mostu), byť
se najdou Výjimky (Rokytnice v°Orlických horách, U°Karla°IV.)
JAnD
---
Ing. Jan Dudík
projekce dopravních staveb
tel. 777082195
Dne 24. ledna 2018 8:45 Matěj Cepl <mcepl na cepl.eu> napsal(a):
zobrazit citaci
> On 2018-01-23, 21:06 GMT, Mikoláš Štrajt wrote:
> > Důvod je jednoduchý - nejsou vidět a zároveň nejsou mezera (ve
> > smyslu ASCII/ UTF-8 znak 32). Domnívám se, že nad daty OSM
> > operuje dost věcí, které namejí skutečnou podporu Unicode
> > a spíše zneužívají toho, že UTF-8 je zpětně kompatibilní
> > s ASCII.
>
> Jenom pro upřesnění: je mezera, alespoň patří do
> kategorie WSpace=Y v Unicode
> (https://en.wikipedia.org/wiki/Whitespace_character).
>
> Matěj
> --
> http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
> GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
>
> Experience is what you get when you don't get what you want.
> -- Dan Stanford
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180124/28532ebe/attachment.html>
zobrazit citaci
> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
> renderer, zas taková věda to snad není.
Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta
jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě
zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo
mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla.
Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český název
špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není.
Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka" který
to přeci dokázal před deseti lety.
Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit
zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu
napsat renderer kde arabský název obsahuje číslovku!
Otevřete trochu svoji mysl a myslete prosím za hranice českého rybníčku.
Lukáš
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180124/97d0f236/attachment.sig>
2018-01-24 22:17 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:
zobrazit citaci
>> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
>> renderer, zas taková věda to snad není.
>
> Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta
> jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě
> zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo
> mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla.
>
> Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český název
> špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není.
> Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka" který
> to přeci dokázal před deseti lety.
>
> Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit
> zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu
> napsat renderer kde arabský název obsahuje číslovku!
Tohle mně zas přijde jako argumentace nefungující, neřkuli přímo
záměrně zlomyslnou, komunikací mezi uživatelem a autorem rendereru.
Přece když budu chtít, aby si japonský renderer správně poradil s
nějakým obskurním aspektem české typografie, tak autorovi neřeknu: "V
českých názvech máte špatně pevné mezery, spravte si to, tohle si
přece můžete vyřešit, vlnka to umí taky". Naopak, vysvětím, proč je to
důležité, popíšu jednotlivá pravidla, dám příklady, třeba ukážu _jak_
to ta vlnka dělá (a ne, že už to dělá deset let). Podobně, až budu mít
ve svém rendereru problém se zobrazováním arabštiny, zeptám se někoho,
kdo umí arabsky. Asi to vidím naivně, ale s jazykovými daty pracuju a
přesně taková komunikace je pro mě naprosto normální a v podstatě
nevyhnutelná.
Podle mě prostě ty pevné mezery jsou tagging for the renderer. Pevná
mezera slouží ke správnému _zobrazení_, tj. renderingu, žádnou věcnou
informaci nenese.
--
Michal Fabík
Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se
smí?
"Petr
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/9bf4cd74/attachment.html>
"Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako spousta
jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy rozumě
zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec. Někdo
mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická pravidla.
Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český
název
špatně zobrazuje a že si to přeci může vyřešit. Taková věda to přeci není.
Ještě těch chudákům vývojářům můžete poradit že exituje probram "vlnka"
který
to přeci dokázal před deseti lety.
Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má vykreslit
zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů) nedokážu
napsat renderer kde arabský název obsahuje číslovku!
Otevřete trochu svoji mysl a myslete prosím za hranice českého rybníčku."
Jenomže autor rendereru/stylu musí myslet zároveň globálně i lokálně.
Musím mít kupříkladu vyřešeny fonty - můžu mít například nějaký primární
font, který se mi líbí vzhledem, ale pak musím mít fallback pro arabštinu/
čínštinu/cyrilici.
Dále pak může provádět transliteraci nepřeložených názvů (jako to dělá
německý styl na https://www.openstreetmap.de/karte.html). Tohle je v praxi
celkem užitečné - když neumím azbuku a chci studovat mapu nějakého ruského
města, hned se líp zorientuju.
V neposlední řadě se často děje, že se názvy na mapě zobrazují v jazyce
toho, kdo si mapu prohlíží/provozuje. Mapy.cz zobrazují mapu světa s českými
názvy, Kosmosnimki zase s ruskými.
Další věc je, že ne všechny typografický/kartografický vychytávky jdou
provést ve všech jazycích - kupříkladu mapy.cz mají části obce napsané caps
lockem (ŘEPORYJE) oproti samostatným obcím, které jsou bez caps locku
(Ořech). Tohle ale jde udělat jen v jazycích, které rozlišují velká a malá
písmena.
* * *
Jinak "cartography labeling" je samostatná věda. A správné vykreslování
Unicode je další samostatná věda.
--
Mikoláš
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/2becd3db/attachment.html>
Ano, řekl bych že je žo naivní pohled. Pevné mezery automaticky nepřidají ani
webové prohlížeče za kterými stojí obrovské týmy vývojárů. Proto je potřeba je
v datech mít - jak ve webových stránkách i OpenStreetMap.
Pokud tvrdíš že se jedná pro tagování pro renderer, protože to slouží pouze ke
správnému zobrazení, tak mi tedy vysvětli proč píšeme velká písmena na záčátku
názvů a po předložkách? To taky slouží jen ke správnému zobrazební.
Vždyť v datech může bez problémů být "kralupy nad vltavou", "na poříčí".
To že tam někde mají být velká písmena si přeci může domyslet renderer...
Lukáš
Dne čtvrtek 25. ledna 2018 8:55:05 CET Michal Fabík napsal(a):
zobrazit citaci
> 2018-01-24 22:17 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:
> >> Jinak za mě taky nedělitelné mezery do tagů nedávat, ať si to ošetří
> >> renderer, zas taková věda to snad není.
> >
> > Tohle mi přijde hrozně lokální pohled na problematiku (podobně jako
> > spousta
> > jiných věcí co se zde na listu řeší). Já bych rád aby se české názvy
> > rozumě
> > zalamovaly a zobrazovaly i v rendereru který si napíše třeba Japonec.
> > Někdo
> > mimoevropský nebude vůbec řešit jaké tu v Česku máme typografická
> > pravidla.
> >
> > Zkuste u nějakého renrereru na githubu vytvořit issue že se nějaký český
> > název špatně zobrazuje a že si to přeci může vyřešit. Taková věda to
> > přeci není. Ještě těch chudákům vývojářům můžete poradit že exituje
> > probram "vlnka" který to přeci dokázal před deseti lety.
> >
> > Stejně tak já nedokážu posoudit jestli se arabské jméno hospody má
> > vykreslit zleva doprava nebo zprava doleva a už vůbec (bez unicode hitnů)
> > nedokážu napsat renderer kde arabský název obsahuje číslovku!
>
> Tohle mně zas přijde jako argumentace nefungující, neřkuli přímo
> záměrně zlomyslnou, komunikací mezi uživatelem a autorem rendereru.
> Přece když budu chtít, aby si japonský renderer správně poradil s
> nějakým obskurním aspektem české typografie, tak autorovi neřeknu: "V
> českých názvech máte špatně pevné mezery, spravte si to, tohle si
> přece můžete vyřešit, vlnka to umí taky". Naopak, vysvětím, proč je to
> důležité, popíšu jednotlivá pravidla, dám příklady, třeba ukážu _jak_
> to ta vlnka dělá (a ne, že už to dělá deset let). Podobně, až budu mít
> ve svém rendereru problém se zobrazováním arabštiny, zeptám se někoho,
> kdo umí arabsky. Asi to vidím naivně, ale s jazykovými daty pracuju a
> přesně taková komunikace je pro mě naprosto normální a v podstatě
> nevyhnutelná.
>
> Podle mě prostě ty pevné mezery jsou tagging for the renderer. Pevná
> mezera slouží ke správnému _zobrazení_, tj. renderingu, žádnou věcnou
> informaci nenese.
>
> --
> Michal Fabík
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 455 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/11cc6e77/attachment.sig>
jak tahle debata pokračuje dál, začínám mít chuť napsat program vlna pro
mapnik, abych dokázal, že to jde. ;-)
--
Severák
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/9f395a67/attachment.html>
On 2018-01-25, 08:32 GMT, Petr Slavíček Bc wrote:
zobrazit citaci
> Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se
> smí?
Přesně tak. Rozdíl je v tom, že rendererů je mnoho a ještě mnoho
jich vznikne a nechceme dělat data, tak aby jeden konkrétní to
zvládnul a ostatní ne. Množství rendererů, které pracují
s přetahováním předložek na novou řádku? 0 A v budoucnosti
takových rendererů vznikne? Hádám, že taky nula. Množství
rendererů, kterým se ublíží když budou mít nedělitelnou mezeru
v názvu? Nevím, ale řekl bych že se to také bude limitně blížit
nule.
Matěj
--
http://matej.ceplovi.cz/blog/, Jabber: mcepl<at>ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
May you come to the attention of those in authority.
May you find what you are looking for.
May you live in interesting times.
-- claimed to be a Chinese proverb, but its origin is disputed
first documented use
Frederic R. Coudert, Proceedings of the Academy of
Political Science, 1939
2018-01-25 9:45 GMT+01:00 Lukáš Karas <lukas.karas na centrum.cz>:
zobrazit citaci
> Ano, řekl bych že je žo naivní pohled. Pevné mezery automaticky nepřidají ani
> webové prohlížeče za kterými stojí obrovské týmy vývojárů. Proto je potřeba je
> v datech mít - jak ve webových stránkách i OpenStreetMap.
Je potřeba je mít v datech, protože nějaké obrovské týmy nějakých
vývojářu v nějakém úplně nesouvisejícím projektu fungujícím podle
jiných pravidel něco nedělá? No dobře. Navíc se IMHO nedá srovnávat
prohlížeč (který počítá s tím, že do něho může být nalito prakticky
cokoliv, včetně textů, u kterých se dá jen těžko určit jazyk, ve
kterém jsou napsány) a OSM renderer, který může počítat s až
puntičkářsky systematizovanými daty.
zobrazit citaci
> Pokud tvrdíš že se jedná pro tagování pro renderer, protože to slouží pouze ke
> správnému zobrazení, tak mi tedy vysvětli proč píšeme velká písmena na záčátku
> názvů a po předložkách? To taky slouží jen ke správnému zobrazební.
> Vždyť v datech může bez problémů být "kralupy nad vltavou", "na poříčí".
> To že tam někde mají být velká písmena si přeci může domyslet renderer...
Velká písmena jsou nositeli významu. "Černá Hora" je město, "Černá
hora" se může jmenovat kdejaký kopec. V ulici, kde bydlím, je
kadeřnictví, které se oficiálně jmenuje "Kadeřnictví" - s malým 'k'
bych si řekl, že to tam nabouchal nějaký začátečník, který nechápe
rozdíl name=* vs. amenity=* vs. description=*. Když uvidím víc velkých
písmen vedle sebe, vím, že asi jde o zkratku, a tedy má smysl
zjišťovat, jaký je oficiální plný název s rozvinutou zkratkou. Velké
písmeno uprostřed slova obvykle znamená, že jde o nějakou moderní
složeninu atd.
Pevná mezera neříká naprosto nic o popisovaném objektu. Říká jen to,
že tato mezera nemá být na konci řádku.
--
Michal Fabík---------- Původní e-mail ----------
Od: MatějCepl <mcepl na cepl.eu>
Komu: talk-cz na openstreetmap.org
Datum: 25. 1. 2018 12:03:13
Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
"On 2018-01-25, 08:32 GMT, Petr Slavíček Bc wrote:
zobrazit citaci
> Mapovat pro render se nesmí (teda nemělo by), ale psát text pro render se
> smí?
Přesně tak. Rozdíl je v tom, že rendererů je mnoho a ještě mnoho
jich vznikne a nechceme dělat data, tak aby jeden konkrétní to
zvládnul a ostatní ne. Množství rendererů, které pracují
s přetahováním předložek na novou řádku? 0 A v budoucnosti
takových rendererů vznikne? Hádám, že taky nula. Množství
rendererů, kterým se ublíží když budou mít nedělitelnou mezeru
v názvu? Nevím, ale řekl bych že se to také bude limitně blížit
nule.
"
Zajímavá debata, chvíli souhlasím s jedním, chvíli s druhým. Jak z toho ven?
Napadá mně, jestli by nebylo lepší zavést nějakou speciální značku pro
render. Když už máme značky pro navigaci a výslovnost.
Marián
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/0e990481/attachment.html>
2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
zobrazit citaci
> (...) OSM renderer, který může počítat s až
> puntičkářsky systematizovanými daty.
>
Tak moc bych si nefandil.
H.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/461975c7/attachment.html>
Originalni doraz byl, jestli pouzivat HTML entity , nebo ne. Podle me
HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde
explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo
uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji?
Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro
nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML
entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim
mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez
konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka
diskuze, ktera nevede nikam s desitkami nazoru.
Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu
na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli
vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna
reseni podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde
mluvime o nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se
to mohlo stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se
rendery v takovem pripade vubec jmena zalamovat? Mame nejaky priklad?
V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit
podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude
generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by
mela byt nedelitelna mezera.
Jakub
2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>:
zobrazit citaci
> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
>
>> (...) OSM renderer, který může počítat s až
>> puntičkářsky systematizovanými daty.
>>
>
> Tak moc bych si nefandil.
>
> H.
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180125/0b20ddd3/attachment.html>
@Jakub Jelen: Kdepak, nbsp zmiňuju jen jako relativně časté označení
pro zmíněný Unicode znak, který se mi 1) nedaří do Gmailu zadat a 2)
není moc dobře vidět.
Relevantní dotaz pro Overpas Turbo: http://overpass-turbo.eu/s/vnx
2018-01-25 14:05 GMT+01:00 Jakub Jelen <jakuje na gmail.com>:
zobrazit citaci
> Originalni doraz byl, jestli pouzivat HTML entity , nebo ne. Podle me
> HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde
> explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo
> uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji?
>
> Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro
> nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML
> entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim
> mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez
> konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka
> diskuze, ktera nevede nikam s desitkami nazoru.
>
> Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu
> na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli
> vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna reseni
> podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde mluvime o
> nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se to mohlo
> stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se rendery v
> takovem pripade vubec jmena zalamovat? Mame nejaky priklad?
>
> V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit
> podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude
> generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by
> mela byt nedelitelna mezera.
>
> Jakub
>
>
> 2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>:
>>
>> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
>>>
>>> (...) OSM renderer, který může počítat s až
>>> puntičkářsky systematizovanými daty.
>>
>>
>> Tak moc bych si nefandil.
>>
>> H.
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
Vypadá to, že minimálně osm.org nbsp řeší správně:
https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366
ukazuje, že nic typu "vlna" osm.org nepoužívá
https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787
ukazuje, že nedělitelné mezery zobrazí správně
(Tedy, alespoň to tak vypadá)
U ostatních renderů jsem zatím nenašel vhodný případ.
Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka
je prostá: chceme nbsp v datech, nebo nikoliv?
Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi
nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých
ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto
problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně
smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se
budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu
doplňovat tam, kde ji zatím žádný úsek ulice nemá.
2018-01-25 22:19 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> @Jakub Jelen: Kdepak, nbsp zmiňuju jen jako relativně časté označení
> pro zmíněný Unicode znak, který se mi 1) nedaří do Gmailu zadat a 2)
> není moc dobře vidět.
>
> Relevantní dotaz pro Overpas Turbo: http://overpass-turbo.eu/s/vnx
>
> 2018-01-25 14:05 GMT+01:00 Jakub Jelen <jakuje na gmail.com>:
>> Originalni doraz byl, jestli pouzivat HTML entity , nebo ne. Podle me
>> HTML entity by nemely byt v tagu name (i kdyz jsem to nenasel nikde
>> explicitne zakazane, ani povolene, doporucovane nebo nedoporucovane). Nebo
>> uz mame nejake pripady, kde se HTML entity v nazvu pouzivaji?
>>
>> Druha otazka je, jestli pouzivat nejakou unicode reprezentaci pro
>> nedelitelnou mezeru, ktera by nevyzadovala, aby render interpretoval HTML
>> entity. To mi prijde jako rozumnejsi moznost, pokud se neukaze, ze by s tim
>> mohly byt nejake problemy s vyhledavanim, vyslovnosti, atd. Ale bez
>> konkretniho pripadu, ukazky a zkusenosti je to stale pouze teoreticka
>> diskuze, ktera nevede nikam s desitkami nazoru.
>>
>> Mnohem lepe by se rozhodovalo, kdyby v puvodnim emailu bylo nekolik odkazu
>> na nejak konkretni priklady, ktere Matej zatim nasel, kde bychom si mohli
>> vysledky prohlednout v zivych renderech, vyzkouset, jaka je pro ruzna reseni
>> podpora, popripade kde se ktere rendery snazi neco zalamovat. Zde mluvime o
>> nazvech ulic, ktere se kresli podel cary ulice. Pripad, kde by se to mohlo
>> stat mi prijde pouze, kdyz mame velmi kratkou ulici, ale snazi se rendery v
>> takovem pripade vubec jmena zalamovat? Mame nejaky priklad?
>>
>> V tu chvili, kdy budeme vymysleno co s temito daty, neni problem pouzit
>> podobny program jako vlna, ktery hromadne zmeni, doporuci, nebo bude
>> generovat varovani, ze v tomto miste pred touto jednoznakovou predlozkou by
>> mela byt nedelitelna mezera.
>>
>> Jakub
>>
>>
>> 2018-01-25 13:00 GMT+01:00 Jan Macura <macurajan na gmail.com>:
>>>
>>> 2018-01-25 12:00 GMT+01:00 Michal Fabík <michal.fabik na gmail.com>:
>>>>
>>>> (...) OSM renderer, který může počítat s až
>>>> puntičkářsky systematizovanými daty.
>>>
>>>
>>> Tak moc bych si nefandil.
>>>
>>> H.
>>>
>>> _______________________________________________
>>> Talk-cz mailing list
>>> Talk-cz na openstreetmap.org
>>> https://lists.openstreetmap.org/listinfo/talk-cz
>>>
>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
Ahoj!
zobrazit citaci
> Vypadá to, že minimálně osm.org nbsp řeší správně:
> https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366
> ukazuje, že nic typu "vlna" osm.org nepoužívá
> https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787
> ukazuje, že nedělitelné mezery zobrazí správně
> (Tedy, alespoň to tak vypadá)
>
> U ostatních renderů jsem zatím nenašel vhodný případ.
>
> Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka
> je prostá: chceme nbsp v datech, nebo nikoliv?
>
> Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi
> nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých
> ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto
> problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně
> smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se
> budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu
> doplňovat tam, kde ji zatím žádný úsek ulice nemá.
Zpetne smazat i zpetne doplnit je stejne tezke -- ta mezera jde
doplnit algoritmicky -- takze ano, jsem proti 4.
(Protoze to rozbije hledani, protoze to neni v oficialnich seznamech,
protoze je to tagovani pro renderer, protoze to rozbije lokalni
programy snazici se pracovat s OSM daty, a protoze neviditelny znaky
jsou skodoliba past na kohokoliv kdo se s timbude snazit pracovat.)
DWG navrhovala zeptat se na tagging listu, to by asi byl dalsi rozumny
krok.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: Digital signature
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180126/f43de61d/attachment.sig>
Napsal jsem na Tagging. Očekávám flame za 3... 2... 1...
Jen tak mimochodem:
- hledání to nerozbije, Nominatim umí Unicode Collation
- je to v cca polovině oficiálních seznamů, mimo jiné protože office
to automaticky doplňuje
- teoreticky by se za tagování pro renderer mohly považovat i velká a
malá písmena v názvech ulic (OTG jsou celá velkými)
- rozumně spolehlivé algoritmické doplnění bude řádově složitější než
100% spolehlivé algoritmické odstranění (leda že bys nám laskavě
zveřejnil tvůj program na automatické doplňování nedělitelných mezer)
Problém je v tom, že teď nejen že tam ty nedělitelné mezery občas jsou
(takže co se má rozbít, to se rozbije), ale taky nejsou zdaleka všude
(takže se občas něco renderuje ošklivě a člověka netrkne tak rychle,
co se děje) a občas se dvě části TÉ SAMÉ ULICE liší v tom, zda mají
nedělitelnou mezeru (takže se rozbije i to, co by jinak nedělitelné
mezery zkouslo).
2018-01-26 0:17 GMT+01:00 Pavel Machek <pavel na ucw.cz>:
zobrazit citaci
> Ahoj!
>
>> Vypadá to, že minimálně osm.org nbsp řeší správně:
>> https://www.openstreetmap.org/way/34942987#map=19/50.09373/14.46366
>> ukazuje, že nic typu "vlna" osm.org nepoužívá
>> https://www.openstreetmap.org/node/3226473433#map=19/50.09439/14.34787
>> ukazuje, že nedělitelné mezery zobrazí správně
>> (Tedy, alespoň to tak vypadá)
>>
>> U ostatních renderů jsem zatím nenašel vhodný případ.
>>
>> Ano, já hlavně řeším názvy ulic (kde je zalamování vzácné), ale otázka
>> je prostá: chceme nbsp v datech, nebo nikoliv?
>>
>> Zatím to nevypadá, že bychom se měli shodnout. Aktuální stav je asi
>> nejhorší možný: máme nbsp v datech, ale ne vždy a ani ne na celých
>> ulicích najednou. Je někdo silně proti tomu, abych do vyřešení tohoto
>> problému fungoval podle možnosti 4 a pak když tak ty mezery hromadně
>> smazal? Budeme alespoň mít celé ulice se stejným názvem a nbsp se
>> budou snadněji mazat, než zpětně doplňovat. Současně ale nbsp nebudu
>> doplňovat tam, kde ji zatím žádný úsek ulice nemá.
>
> Zpetne smazat i zpetne doplnit je stejne tezke -- ta mezera jde
> doplnit algoritmicky -- takze ano, jsem proti 4.
>
> (Protoze to rozbije hledani, protoze to neni v oficialnich seznamech,
> protoze je to tagovani pro renderer, protoze to rozbije lokalni
> programy snazici se pracovat s OSM daty, a protoze neviditelny znaky
> jsou skodoliba past na kohokoliv kdo se s timbude snazit pracovat.)
>
> DWG navrhovala zeptat se na tagging listu, to by asi byl dalsi rozumny
> krok.
>
> Pavel
> --
> (english) http://www.livejournal.com/~pavelmachek
> (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
Hello, world!
Osobně považuji za nejdůležitější pravidlo, že do primárních dat nepatří
nic, co jde odvodit algoritmicky. Mimo jiné proto, že udržovat takové věci
ručně obvykle vede k chaosu a jakmile je umíme udržovat algoritmicky, tak
je tam už nemusíme ukládat :)
Označování nedělitelných mezer je v tak jednoduchých českých textech,
jaké se vyskytují na mapách, docela jednoduchá úloha. Navíc nevadí, když
se tu a tam objeví nějaké false positives.
Souhlasím, že nedává smysl, aby každý renderer musel ovládat pravidla pro
české zalamování. Jenže renderery potřebují i spoustu jiných jazykově
specifických znalostí, třeba pravidla pro transliteraci mezi abecedami.
Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat
co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat
a jehož výstup bude moci využít libovolný renderer.
Ale opravdu se teď nenabízím, že ho napíšu :-)
Mějte se skvěle
--
Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/
Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
"Computers are useless. They can only give you answers." -- Pablo Picasso
Ahoj,
2018-01-27 19:36 GMT+01:00 Martin Mares <mj na ucw.cz>:
zobrazit citaci
> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat
> co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat
> a jehož výstup bude moci využít libovolný renderer.
>
To se mi zatím zdá jako nejrozumnější argument v této diskusi.
A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve
kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych
řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším
problémem jednopísmených předložek na koncích řádek docela souvisí.
H.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180128/b8a2c874/attachment.html>
Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
od "Jindřich V. Sálský" (fiktivní příklady).
2018-01-28 17:16 GMT+01:00 Jan Macura <macurajan na gmail.com>:
zobrazit citaci
> Ahoj,
>
> 2018-01-27 19:36 GMT+01:00 Martin Mares <mj na ucw.cz>:
>>
>> Proto by mi dávalo daleko lepší smysl ukládat toho do primárních dat
>> co nejméně a napsat preprocesor, který bude umět tyto věci odvozovat
>> a jehož výstup bude moci využít libovolný renderer.
>
>
> To se mi zatím zdá jako nejrozumnější argument v této diskusi.
> A neexistuje třeba už nějaký takový preprocesor? Vybavuji si článek, ve
> kterém nějaký tým řešil, jak lépe zalamovat popisky v mapě (dokonce bych
> řekl, že to bylo pro OSM Carto), tak aby to vypadalo hezky. To s naším
> problémem jednopísmených předložek na koncích řádek docela souvisí.
>
> H.
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
2018-01-31 14:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
> od "Jindřich V. Sálský" (fiktivní příklady).
>
V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech
ulic". Nic víc, nic míň. A na to jsem taky reagoval.
H.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/5073ba77/attachment.html>
Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.
2018-01-31 19:20 GMT+01:00 Jan Macura <macurajan na gmail.com>:
zobrazit citaci
> 2018-01-31 14:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
>>
>> Opravdu chci vidět preprocesor, který zvládne rozpoznat "Dům V. Hálka"
>> od "Jindřich V. Sálský" (fiktivní příklady).
>
>
> V předmětu tohoto vlákna stále ještě stojí "Nedělitelné mezery v názvech
> ulic". Nic víc, nic míň. A na to jsem taky reagoval.
>
> H.
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
2018-01-31 19:58 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.
>
Aha, to mě nenapadlo.
Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem
U+2164 ;-)
H.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/14a8a5fa/attachment.html>
Dne středa 31. ledna 2018 20:14:24 CET, Jan Macura napsal(a):
zobrazit citaci
> 2018-01-31 19:58 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
> > Vždyť jo. V prvním případě má být nbsp za "V.", v druhém před.
>
> Aha, to mě nenapadlo.
> Chmno, tak ten by musel mít ten druhý řetězec uložený s Unicode znakem
> U+2164 ;-)
ano, Jindřich [pátý] by takto mohl fungovat
ovšem co takový Xindl [iks]?
- hm, X není předložka ... a kdyby někdo vymyslel ulici na počest Anny [ká]?
(aktuálně se sice na svém webu nazývá s tečkou, ale varianta bez tečky je též
dosti rozšířená)
přijde mi, že se tu furt vymejšlí rovnák na vohejbák ...
*nikdy* to nebudeme mít 100% správně
chápat různé druhy mezer obecně jako mezeru je triviální úložka, povětšinou
již vyřešená, i ten blbej grep umí [:space:]
vyvěštit z obecné mezery, jestli tam zrovna patří nsbp (popř. i něco jiného),
je úložka hodná AI kvalitnější než průměrný maturant z češtiny, a vyřešená
není
- jistě, co se prvého týče, s jistou chybovostí se můžeme smířit, ale pak
vzniká otázka, kdyby si někdo chtěl dát tu práci a docílit, aby ten program
chyby nedělal, tak jaké má možnosti, nemá-li to být vázáno na konkrétní data?
... co mě napadá je seznam vyjímek, ale čeština má tu krásnou vlastnost, že by
určitě brzy vyplulo něco, co se píše stejně, ale má různé významy, a tudíž ta
vazba osamoceného písmene může být na obě strany
prozradí nám někdo lepší řešení?
- co se druhého týče, sice lze argumentovat existencí vlny apod., ale, jak zde
již padlo, problém je, kdo to zaháčkuje do všech rendererů, co kdy vznikly a
vzniknou?
kdo bude nutit člověka na druhém konci světa implementovat nějakou specialitu
pro zaprděnou desetimilionovou zemičku, když ani zde mezi zastánci odstranění
nbsp se nenajde dobrovolník, co by ten preprocesor napsal?
pozn. "renderer" se zde nemusí myslet jen vykreslování mapy, ale obecně
cokoli, co když si třeba budu chtít adresy tisknout na obálky nebo jánevímco
se dá nad OSM vymyslet, skutečně to všechno pokryjeme, aby to používalo ten
(neexistující) preprocesor?
obecně dobré pravidlo "nemapovat pro renderer" se zde dovádí ad absurdum, asi
jako kdyby někdo řekl "pojďme odstranit u mostů layer, vždyť to se přece dá
odvodit a existuje na to i pravidlo, renderer musí vědět, že cesta vede nad
řekou" (hm, ne vždy)
K.
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 195 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180131/5a7e799a/attachment.sig>
Ahoj,
zobrazit citaci
> *nikdy* to nebudeme mít 100% správně
nebudeme. Stejně jako nebudeme mít 100% správně nic jiného.
To je myslím lepší přijmout jako fakt, než investovat ohromné množství
úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%.
Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších
detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko
zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně
posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt
mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to.
Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují,
je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou
celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější
udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší
pravděpodobnost chybné prezentace.
Have a nice fortnight
--
Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/
Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby
Co přesně se na editaci zkomplikuje, když budeme podporovat
nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát
dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude
mazat diakritiku.
2018-01-31 22:16 GMT+01:00 Martin Mares <mj na ucw.cz>:
zobrazit citaci
> Ahoj,
>
>> *nikdy* to nebudeme mít 100% správně
>
> nebudeme. Stejně jako nebudeme mít 100% správně nic jiného.
>
> To je myslím lepší přijmout jako fakt, než investovat ohromné množství
> úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%.
>
> Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších
> detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko
> zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně
> posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt
> mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to.
>
> Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují,
> je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou
> celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější
> udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší
> pravděpodobnost chybné prezentace.
>
> Have a nice fortnight
> --
> Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/
> Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
> Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
Diskuze na Tagging už celkem odezněla. Klidně se na ni podívejte, ale
přijde mi, že celkem výrazná většina zastávala názor, že nástroje mají
už dávno umět Unicode collation a že typografické nápovědy jsou v
datech spíše žádoucí. Zatím jsem neslyšel o ničem, co by se doslova
rozbíjelo (Overpass Unicode collation nedělá schválně a mám nápad, co
s tím) a taky se neozval nikdo, kdo by byl ochoten napsat ten
"jednoduchý" preprocesor.
My jsme cca půl na půl, DWG to nevetovalo a Tagging je pro - myslím
si, že nedělitelné mezery jsou tudíž akceptovatelné. Pokud se
většinový názor změní, nebude problém ty mezery zase smazat.
ToDo:
- Overpass by mohl získat režim, kdy zadanou hodnotu přeloží na regex
simulující Unicode collation
- Editorům by prospělo zvýrazňování whitespace
Začátek diskuze na Tagging:
https://lists.openstreetmap.org/pipermail/tagging/2018-January/034986.html
Ať se daří!
Matej
PS: Doporučuju http://www.babelstone.co.uk/Unicode/whatisit.html
2018-02-01 0:56 GMT+01:00 Matej Lieskovský <lieskovsky.matej na gmail.com>:
zobrazit citaci
> Co přesně se na editaci zkomplikuje, když budeme podporovat
> nedělitelné mezery? To, že na to budeme muset myslet, když budeme psát
> dotaz do Overpassu? Podobnými argumenty budeme za chvíli zase všude
> mazat diakritiku.
>
> 2018-01-31 22:16 GMT+01:00 Martin Mares <mj na ucw.cz>:
>> Ahoj,
>>
>>> *nikdy* to nebudeme mít 100% správně
>>
>> nebudeme. Stejně jako nebudeme mít 100% správně nic jiného.
>>
>> To je myslím lepší přijmout jako fakt, než investovat ohromné množství
>> úsilí do něčeho, co bude mít místo 99% úspěšnosti 99.9%.
>>
>> Chci-li podle dat OSM vytvořit papírovou mapu, vyladím si ji do nejmenších
>> detailů. To často znamená ručně předělávat algoritmická rozhodnutí i v daleko
>> zásadnějších věcech než dělitelnost mezer: například je často potřeba ručně
>> posunout nějakou značku, přemístit či zrušit popisek, nakreslit nějaký objekt
>> mimo měřítko atd. Je to spousta práce, ale výsledek stojí za to.
>>
>> Na druhou stranu, u online mapy zobrazující data, která lidé pořád upravují,
>> je taková snaha o dokonalost spíše škodlivá -- nedokonalosti v datech budou
>> celkovému dojmu škodit víc než nedokonalosti v prezentaci. Proto je důležitější
>> udržet editaci dat co nejjednodušší, i kdyby to stálo o zlomek procenta vyšší
>> pravděpodobnost chybné prezentace.
>>
>> Have a nice fortnight
>> --
>> Martin `MJ' Mares <mj na ucw.cz> http://mj.ucw.cz/
>> Faculty of Math and Physics, Charles University, Prague, Czech Rep., Earth
>> Some people, when confronted with a problem, think "I know, I'll use XML." Now they have two problems. -- P. J. Eby
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
Ahoj,
jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod.
Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí.
_________________________________________________________________________________________________________________________________________
S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se
složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka.
Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už
jsem začala vymýšlet, co s dokladama, abych nemusela na úřady.
.....
Můžeš zjednat nápravu?
.....
Z tégémasaryka zdraví ............
______________________________________________________________________________________________________
Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na
wiki jsem našel pouze toto.
Ustálené zkratky
Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při
vyhledávání objektu.
Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco
jsem přehlédl?
Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to
ti čerchmanti dělají, že nemají "problémy při vyhledávání objektů"?
Mirek
Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com>
napsal(a):
zobrazit citaci
> Ahoj!
>
> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
> street relací a tak narážím na různé podivnosti v databázi, kterých bych si
> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
> nedělitelná mezera (nbsp).
>
> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
> žádnému konsenzu to (pokud vím) nevedlo.
>
> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy.
> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do
> tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
> opravovat.
>
> Co mám dělat?
>
> 1) Odstraňuj nbsp z názvů ulic
> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější
> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
> 5) Přidávej (ručně) nbsp do názvů ulic
> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>
> Ať se daří,
> Matej
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/8e409b85/attachment.html>
Ahoj!
Zkratky jmen v názvech ulic jsou asi trochu jiné téma, ale určitě to
chce se na ně podívat.
Co se týče nedělitelných mezer, tak:
1) Zatím jediné dvě mně známé nevýhody jsou "budeme muset dělat
Unicode collation" (což je argument i pro odstranění nabodeníček) a
"blbě se to zadává" (tak to holt většina nebude zadávat). Filozofické
argumenty typu "nepatří to do dat" a "napíšeme na to preprocesor"
zatím nedodaly onen triviální preprocesor.
2) Aktuálně mají mírnou převahu lidi pro odstranění, každopádně už
jsem s tím (na popud tohoto talku) prudil DWG (těm je to fuk) a
globální Tagging (kde jsou spíše pro nedělitelné mezery).
Jakou zásadní nevýhodu jsem zatím neslyšel? Máš ten preprocesor?
(Sorry, pokud zním trochu hrubě, spěchám)
Ať se daří,
Matej
2018-02-12 14:14 GMT+01:00 Mirek Dlask <dlask.m na gmail.com>:
zobrazit citaci
> Ahoj,
>
> jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod.
>
>
> Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí.
> _________________________________________________________________________________________________________________________________________
>
> S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se
> složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka.
> Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už
> jsem začala vymýšlet, co s dokladama, abych nemusela na úřady.
> .....
> Můžeš zjednat nápravu?
> .....
> Z tégémasaryka zdraví ............
> ______________________________________________________________________________________________________
>
> Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na
> wiki jsem našel pouze toto.
>
> Ustálené zkratky
> Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při
> vyhledávání objektu.
>
>
> Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco jsem
> přehlédl?
> Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to ti
> čerchmanti dělají, že nemají "problémy při vyhledávání objektů"?
>
> Mirek
>
> Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com>
> napsal(a):
>>
>> Ahoj!
>>
>> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
>> street relací a tak narážím na různé podivnosti v databázi, kterých bych si
>> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
>> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
>> nedělitelná mezera (nbsp).
>>
>> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
>> žádnému konsenzu to (pokud vím) nevedlo.
>>
>> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy.
>> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
>> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do tagů
>> relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
>> opravovat.
>>
>> Co mám dělat?
>>
>> 1) Odstraňuj nbsp z názvů ulic
>> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
>> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější
>> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
>> 5) Přidávej (ručně) nbsp do názvů ulic
>> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>>
>> Ať se daří,
>> Matej
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
2018-02-12 14:14 GMT+01:00 Mirek Dlask <dlask.m na gmail.com>:
zobrazit citaci
> S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych
> se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka
>
Tohle krásně ilustruje, jak jsou zavedené konvence odtrhnuté od skutečného
stavu, alespoň v ČR. Vychází se totiž víceméně z toho, že oficiální jméno
je plný název bez zkratek. Což u nás ani vzdáleně neplatí.
Teoreticky, pokud se nepletu:
V OSM by mělo být rozepsané celé (nepoužívejte zkratky
<https://wiki.openstreetmap.org/wiki/Cs:N%C3%A1zvy#Zkracov.C3.A1n.C3.AD_.28ned.C4.9Bjete_to.29>)
a ten zkrácený název by byl v official_name
<https://wiki.openstreetmap.org/wiki/Cs:Key:name>
Ovšem pak to vede přesně k tomuhle problému - že se na mapě zobrazí jméno,
a člověk se diví, kde že to najednou bydlí.
Prakticky, a přiznávám se k tomu bez mučení:
do jména dávám ty "official_name" vč. zkratek, a rozepisuji alt_name,
short_name, sorting_name, pokud jsou třeba.
Majka
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/99b6b35f/attachment.html>
Jo, toť otázka.
https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d vs.
https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=x vs.
https://mapy.cz/s/2okEA a
http://www.c-budejovice.cz/nazvy-budejovickych-ulic
---
Ing. Jan Dudík
projekce dopravních staveb
tel. 777082195
Dne 12. února 2018 14:14 Mirek Dlask <dlask.m na gmail.com> napsal(a):
zobrazit citaci
> Ahoj,
>
> jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod.
>
>
> Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí.
> ____________________________________________________________
> ____________________________________________________________
> _________________
>
> S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych
> se složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka.
> Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už
> jsem začala vymýšlet, co s dokladama, abych nemusela na úřady.
> .....
> Můžeš zjednat nápravu?
> .....
> Z tégémasaryka zdraví ............
> ____________________________________________________________
> __________________________________________
>
> Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav?
> Na wiki jsem našel pouze toto.
>
> Ustálené zkratky
> Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při
> vyhledávání objektu.
>
>
> Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco
> jsem přehlédl?
> Ať se podívám na mapy.cz nebo na google.cz/maps zkratky používají. Jak to
> ti čerchmanti dělají, že nemají "problémy při vyhledávání objektů"?
>
> Mirek
>
> Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com>
> napsal(a):
>
>> Ahoj!
>>
>> Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
>> street relací a tak narážím na různé podivnosti v databázi, kterých bych si
>> jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
>> samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
>> nedělitelná mezera (nbsp).
>>
>> Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
>> žádnému konsenzu to (pokud vím) nevedlo.
>>
>> Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy.
>> Část důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
>> synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do
>> tagů relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
>> opravovat.
>>
>> Co mám dělat?
>>
>> 1) Odstraňuj nbsp z názvů ulic
>> 2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
>> 3) Tam, kde se vyskytují obě varianty, preferuj tu častější
>> 4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
>> 5) Přidávej (ručně) nbsp do názvů ulic
>> 6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
>>
>> Ať se daří,
>> Matej
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/1311ea53/attachment.html>
Ahoj,
začal bych u toho odkazu, který Majka postovala na wiki: "V OSM by mělo být
rozepsané celé (nepoužívejte zkratky
(https://wiki.openstreetmap.org/wiki/Cs:N%C3%A1zvy#Zkracov.C3.A1n.C3.AD_.28ned.C4.9Bjete_to.29)
)". Článek je totiž zjevně překladem anglického originálu a kapitola s
původním názvem "Abbreviation (don't do it)" podle mě popisuje to, že mapper
nemá automaticky používat zkratky tam, kde je vidí na ceduli a má si zjistit
skutečný celý název.
Pro diskutované případy s názvy T.G.M. atd. to v českých podmínkách dle mého
platí asi do té míry, že nelze slepě napsat zkratku názvu ulice jen proto,
že "kratší je to přehlednější", případně "bylo to na ceduli", ale je správné
jako název zvolit oficiální název (zde je asi rozhodující názor obce, byť
jsem tu vícekrát četl, že komunita upřednostňuje data z RÚIAN).
No a Majka asi vcelku správně vidí jako vhodné doplnit databázi OSM o
nezkrácené názvy. Otázkou je, které názvy do kterých tagů. Na wiki totiž
čtu, že name_official je určen pouze pro názvy států...
vop
---------- Původní e-mail ----------
Od: Jan Dudík <jan.dudik na gmail.com>
Komu: OpenStreetMap Czech Republic <talk-cz na openstreetmap.org>
Datum: 12. 2. 2018 15:32:46
Předmět: Re: [Talk-cz] Nedělitelné mezery v názvech ulic
"
Jo, toť otázka.
https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d
(https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=d) vs. https://
openstreetmap.cz/#map=18/48.96086/14.47347&layers=x
(https://openstreetmap.cz/#map=18/48.96086/14.47347&layers=x) vs. https://
mapy.cz/s/2okEA(https://mapy.cz/s/2okEA) a http://www.c-budejovice.cz/nazvy-
budejovickych-ulic(http://www.c-budejovice.cz/nazvy-budejovickych-ulic)
---
Ing. Jan Dudík
projekce dopravních staveb
tel. 777082195
Dne 12. února 2018 14:14 Mirek Dlask <dlask.m na gmail.com
(mailto:dlask.m na gmail.com)> napsal(a):
"
Ahoj,
jsem pro 1). Nedělitelné mezery mají více nevýhod, než výhod.
Navíc jsem od známé dostal takovou drobnou prosbu, snad se sem hodí.
____________________________________________________________________________
_____________________________________________________________
S hrůzou jsem zjistila, že už nebydlím v ulici T. G. Masaryka. Aniž bych se
složitě stěhovala, bydlím v ulici Tomáše Garrigue Masaryka.
Naštěstí se nezbláznilo město, ale pouze mapa, kterou si mi doporučil. Už
jsem začala vymýšlet, co s dokladama, abych nemusela na úřady.
.....
Můžeš zjednat nápravu?
.....
Z tégémasaryka zdraví ............
____________________________________________________________________________
__________________________
Rád bych odpověděl a nevím co. Je to chyba, nebo schválený, chtěný stav? Na
wiki jsem našel pouze toto.
Ustálené zkratky
Nepoužíváme ustálené zkratky "nám.", "ryb.". Způsobují problémy při
vyhledávání objektu.
Ani zmínka o tom, že by se neměly používat zkratky křestních jmen. Něco jsem
přehlédl?
Ať se podívám na mapy.cz(http://mapy.cz) nebo na google.cz/maps
(http://google.cz/maps) zkratky používají. Jak to ti čerchmanti dělají, že
nemají "problémy při vyhledávání objektů"?
Mirek
Dne 17. ledna 2018 13:49 Matej Lieskovský <lieskovsky.matej na gmail.com
(mailto:lieskovsky.matej na gmail.com)> napsal(a):
"
Ahoj!
Pomalu pracuju na tom již zmiňovaném systému na polo-automatickou údržbu
street relací a tak narážím na různé podivnosti v databázi, kterých bych si
jinak nevšiml. Třeba mě to upozorňuje na to, když jednotlivé segmenty té
samé ulice mají různé názvy, což chytá i takové prkotiny, jako je
nedělitelná mezera (nbsp).
Vím, že se tady před rokem vedl flame na téma nedělitelných mezer a k
žádnému konsenzu to (pokud vím) nevedlo.
Přijde mi rozumné, aby všechny segmenty ulice měly identické name tagy. Část
důvodu, proč celé tyhle street relace dělám je i snaha o automatickou
synchronizaci name:<lg> tagů napříč všemi segmenty. Když napíšu nbsp do tagů
relace, tak mi to asi náhodní editoři nerozbijou a jsem ochoten to pak
opravovat.
Co mám dělat?
1) Odstraňuj nbsp z názvů ulic
2) Tam, kde se vyskytují obě varianty, preferuj tu bez nbsp
3) Tam, kde se vyskytují obě varianty, preferuj tu častější
4) Tam, kde se vyskytují obě varianty, preferuj tu s nbsp
5) Přidávej (ručně) nbsp do názvů ulic
6) Celý koncept toho, že se má ulice jmenovat stejně, je špatně
Ať se daří,
Matej
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org(mailto:Talk-cz na openstreetmap.org)
https://lists.openstreetmap.org/listinfo/talk-cz
(https://lists.openstreetmap.org/listinfo/talk-cz)
"
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org(mailto:Talk-cz na openstreetmap.org)
https://lists.openstreetmap.org/listinfo/talk-cz
(https://lists.openstreetmap.org/listinfo/talk-cz)
"
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
"
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/a67fd193/attachment.html>
Ahoj,
já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru. IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo „nábř.“.
Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené.
official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek. Při editaci OSM jsem již také viděl klíč long_name, ale ten není dokumentovaný ani podporovaný Nominatimem.
Sten
Problém je, že ty ulice se dlouhým názvem nejmenují a žádná zkratka to
není. Tím dlouhým názvem se na tu ulici nemáte šanci doptat - všichni
místní budou přemýšlet, o čem to mluvíte.
Je to specifický případ, který by se měl i v datech ukázat, nehledě na
heslo "rozepisujte zkratky". Nechcete mi snad říct, že je nutné opravit
třeba tohle
<https://www.openstreetmap.org/node/24569684#map=19/50.07446/14.43052>.
2018-02-12 22:23 GMT+01:00 Jan Sten Adámek <sten na adamek.online>:
zobrazit citaci
> Ahoj,
>
> já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do
> short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru.
> IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo
> „nábř.“.
>
> Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která
> nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými
> jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla
> Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou
> tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba
> „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi
> křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a
> nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš
> nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené.
>
> official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy
> oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba
> „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek.
> Při editaci OSM jsem již také viděl klíč long_name, ale ten není
> dokumentovaný ani podporovaný Nominatimem.
>
> Sten
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/b1db3fb1/attachment.html>
Preprocesor nemám, vystačil bych si s převodní tabulkou. Přesvědčil bych
nějakého renderistu, aby si z převodní tabulky udělal UPDATE ..... SET
name .... FROM ...... a posoudil bych, jestli výsledek odpovídá
vynaloženému úsilí. Pokud ano, stejnou cestou bych 'svoji pravdu' šířil dál.
Nevím jak to máš vymyšleno ty. Co když ti do mapy přidám novou odbočku. To
ji chceš "ručně" upravit a přidat do relace?
Obavu mám ještě z něčeho jiného. Jak dlouho to hodláš vydržet a co potom?
V neposlední řadě mi vadí další narušení vazby mezi názvem ulice a názvem
ulice na adresních bodech.
Ale chápu moje řešení je moc jednoduché. Ty potřebuješ naštvat co nejvíc
lidí, udělat okolo co největší humbuk, a nakonec všechno urovnat, aby ses
moh v sívíčku poplácat po ramenou jakej seš pašák.
Dne 12. února 2018 14:33 Matej Lieskovský <lieskovsky.matej na gmail.com>
napsal(a):
zobrazit citaci
> Ahoj!
>
>
> Jakou zásadní nevýhodu jsem zatím neslyšel? Máš ten preprocesor?
>
> (Sorry, pokud zním trochu hrubě, spěchám)
>
> Ať se daří,
>
> Matej
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/4feeebc1/attachment.html>
Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už
poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o
náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde
metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým
jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana
Palova, než jeho křestní jména.
Dne 12. února 2018 22:47 majka <majka.zem+talk na gmail.com> napsal(a):
zobrazit citaci
> Problém je, že ty ulice se dlouhým názvem nejmenují a žádná zkratka to
> není. Tím dlouhým názvem se na tu ulici nemáte šanci doptat - všichni
> místní budou přemýšlet, o čem to mluvíte.
>
> Je to specifický případ, který by se měl i v datech ukázat, nehledě na
> heslo "rozepisujte zkratky". Nechcete mi snad říct, že je nutné opravit
> třeba tohle
> <https://www.openstreetmap.org/node/24569684#map=19/50.07446/14.43052>.
>
> 2018-02-12 22:23 GMT+01:00 Jan Sten Adámek <sten na adamek.online>:
>
>> Ahoj,
>>
>> já dávám do name plný název (bez jakýchkoliv zkrácenin, podle Wiki) a do
>> short_name zkrácený tvar, takže to Nominatim najde i podle krátkého tvaru.
>> IMO je to stejné, jako když název v RÚIAN používá „nám.“, „tř.“ nebo
>> „nábř.“.
>>
>> Mapy.cz i Google mají asi nějakou tabulku pro plná jména, která
>> nezobrazují, protože je umí vyhledávat a přitom se nenechají zmást chybnými
>> jmény: „Karla Jaroslava Mašky“ najde K. J. Mašky, Blansko, ale „Karla
>> Jaromíra Mašky“ již ne. Ale vypadá to na (polo-)automaticky generovanou
>> tabulku, protože obsahuje (pro ruční zpracování) očividné chyby: třeba
>> „Jarmily Václava Živcových“ je na Mapy.cz nutné zadat bez „a“ mezi
>> křestními jmény (J. V. Živcových, Rudná), ale opět se nenechá zmást a
>> nenajde „Jaroslavy Václava Živcových“; Google tohle jméno ulice nejspíš
>> nedokázal rozluštit, protože se mi jej nepodařilo najít jinak než zkrácené.
>>
>> official_name by asi také šlo použít, ale to je IMO spíš pro případy, kdy
>> oficiální jméno obsahuje navíc slova, která se běžně v name neuvádí (třeba
>> „Kostel svatého Jiří“ pro name „svatý Jiří“), ne pro rozepisování zkratek.
>> Při editaci OSM jsem již také viděl klíč long_name, ale ten není
>> dokumentovaný ani podporovaný Nominatimem.
>>
>> Sten
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180212/86dbe20b/attachment.html>
Problém je, jak to do OSM zapsat. Dovedu si dobře představit, že třeba
nábř. Kpt. Jaroše v Jičíně bude někdo hledat jako nábřeží Kapitána Jaroše,
protože v Praze se jmenuje takhle (a naopak), a tak by to OSM mělo umět
najít. Podle Wiki je name pro plnou formu, kratší forma patří do short_name
a žádný long_name není, ale jestli se v ČR ustaví jiná konvence, která bude
rozumně fungovat (prosazení long_name či display_name asi není realistické,
official_name by bylo spíš pro tu krátkou formu – ta je ta oficiální, možná
alt_name?), tak klidně budu používat tu. A taky je otázka, jak řešit TTS,
protože pokud bude v name nábř. Kpt. Jaroše, tak to přečte fakt příšerně
(viz pravidlo u name, že zkracovat se dá při zpracování dat snadno, ale
doplňovat ne; name:pronunciation je reálně nepoužitelné). Takže možná v
name rozepisovat zkratky s výjimkou iniciál (které se často čtou jako
iniciály), tedy T. G. Masaryka nechat s plným jménem v jiném tagu
(alt_name?), ale Masarykovo nám. rozepsat jako Masarykovo náměstí a
zkrácenou formu dát do official_name nebo short_name?
13. února 2018 2:30:28 SEČ, "Jan Sten Adámek" <sten na adamek.online> napsal:
zobrazit citaci
>Problém je, jak to do OSM zapsat. Dovedu si dobře představit, že třeba
>nábř. Kpt. Jaroše v Jičíně bude někdo hledat jako nábřeží Kapitána
>Jaroše,
>protože v Praze se jmenuje takhle (a naopak), a tak by to OSM mělo umět
>najít.
Musela bych se podívat jak jsem přesně zadávala tu Pražskou v ČB, ale hledání funguje i podle alt_name (Pražská třída), short_name (Pražská) a loc_name. Mám pocit, že jsem dávala ještě nějaké "name" navíc.
Takhle umí hledat jak Nominatim, tak i třeba Osmand.
TTS je věc druhá - "lepší" ty běžné zkratky umí (tř. =třída), nebo je umí nadefinovat v místě (mobilu). Ideální by ale bylo to nadefinovat do tagu pro výslovnost, který se taky řeší. Netuším, jestli už je u něj shoda a/nebo se běžně užívá. Nedávno tu proběhl odkaz na debatu na francouzském talku, kde to probírali.
zdar,
zobrazit citaci
> Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už
> poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o
> náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde
> metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým
> jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana
> Palova, než jeho křestní jména.
tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je tady ten "Slinták",
na kterým má vylézt z "krtka"
já jsem zase nikdy neslyšel, že by někdo mluvil o "ípé Pavlova", páč je to
"Pavlák" (po vzoru "Karlák" nebo "Staromák"), popř. "Ípák" nebo "Ípáč" (a
jezdí se tam samozřejmě céčkem)
ale nestrávil jsem v Praze zas tak dlouho, a věřím, že kdybych se potkal s
nějakou ruskou komunitou, tak ti naopak "Ivana Petroviče" budou preferovat,
pokud vím, je to u nich tak nějak zvykem radši než příjmení ...
K.
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 195 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180213/bd0e0c97/attachment.sig>
Dne 13.2.2018 v 09:33 Karel Volný napsal(a):
zobrazit citaci
> zdar,
>
>> Díky Majko za odkaz a nakonec i za tu I. P. Pavlova. Vážně jsem za svůj už
>> poměrně dlouhý život, neslyšel o nikom kdo by místo ípé Pavlova mluvil o
>> náměstí Ivana Petroviče Pavlova. Nevím co na to cizinec, který přijde
>> metrem na I. P. Pavlova a naráz se ocitne na náměstí s podivným dlouhým
>> jménem. Dovolím si tvrdit, že většina evropanů zná lépe slintající psa pana
>> Palova, než jeho křestní jména.
>
> tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je tady ten "Slinták",
> na kterým má vylézt z "krtka"
>
> já jsem zase nikdy neslyšel, že by někdo mluvil o "ípé Pavlova", páč je to
> "Pavlák" (po vzoru "Karlák" nebo "Staromák"), popř. "Ípák" nebo "Ípáč" (a
> jezdí se tam samozřejmě céčkem)
Tak v loc_name bývá kde co (a zrovna flame o tom, jaká je Jediná Správná
Přezdívka pro IPP, a co je heretický nesmysl, který jáá nikdy neslyšel,
je velmi specifické pražské téma, o kterém se lze bez výsledku hádat
neomezeně dlouho); o přezdívky u name=* snad nejde.
zobrazit citaci
>
> ale nestrávil jsem v Praze zas tak dlouho, a věřím, že kdybych se potkal s
> nějakou ruskou komunitou, tak ti naopak "Ivana Petroviče" budou preferovat,
> pokud vím, je to u nich tak nějak zvykem radši než příjmení ...
To už je naprostý věštění z čajových lístků, co-by-kdyby po vzoru "na
Smíchově prostě je stanice metra Angel, respektive Engel, _protože mi to
připadá logický_, byť jsem ten název právě dovymyslel." Navíc ono to ani
v ruštině logický není: křestní jméno a patronymum se používá pro osobu,
ale ne pro ulici pojmenovanou po osobě: spisovatel byl Nikolaj
Vasiljevič, ale ulice je Gogolevský bulvár:
https://www.openstreetmap.org/way/30475662 (teda pokud se názvům ulic dá
věřit a není to taky nějaký jazykobrusičský výmysl :D ;))
Kromě toho, i pokud by to takto existovalo, tak by to šlo do
loc_name:ru, souvislost s name=* je hodně slabá.
Zdar,
HPM
On 2018-02-13, 08:33 GMT, Karel Volný wrote:
zobrazit citaci
> tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je
> tady ten "Slinták", na kterým má vylézt z "krtka"
Krtkem z Želvy na Slinták s přestupem u Koně? ;)
Matěj
--
https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Microwave oven? Whaddya mean, it's a microwave oven? I've been
watching Channel 4 on the thing for two weeks.
zobrazit citaci
> On 2018-02-13, 08:33 GMT, Karel Volný wrote:
> > tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je
> > tady ten "Slinták", na kterým má vylézt z "krtka"
>
> Krtkem z Želvy na Slinták s přestupem u Koně? ;)
To fakt používáte výraz "krtek"? Já to doposud slyšel jen od moravské
náplavy.
Ale to jsme s tím tématem už poněkud vykolejili...
--
Lukas Gebauer.
http://synapse.ararat.cz/ - Ararat Synapse - TCP/IP Lib.
https://www.geoget.cz/ - Geocaching solution
A je to tady, můžeme flejmovat do rána bílého, kdo je větší náplava a
jestli se na Moravě opravdu mluví o krtkovi a Slintáku ;)
zobrazit citaci
> (a zrovna flame o tom, jaká je Jediná Správná Přezdívka pro IPP, a co je
heretický nesmysl, který jáá nikdy neslyšel, je velmi specifické pražské
téma, o kterém se lze bez výsledku hádat neomezeně dlouho)
Dne 13. 2. 2018 16:30 napsal uživatel "Lukas Gebauer" <gebylist na mlp.cz>:
zobrazit citaci
> > On 2018-02-13, 08:33 GMT, Karel Volný wrote:
> > > tak naokraj, cizinec z Moravy bude stejně hledat, kdeže je
> > > tady ten "Slinták", na kterým má vylézt z "krtka"
> >
> > Krtkem z Želvy na Slinták s přestupem u Koně? ;)
>
> To fakt používáte výraz "krtek"? Já to doposud slyšel jen od moravské
> náplavy.
>
> Ale to jsme s tím tématem už poněkud vykolejili...
>
>
> --
> Lukas Gebauer.
>
> http://synapse.ararat.cz/ - Ararat Synapse - TCP/IP Lib.
> https://www.geoget.cz/ - Geocaching solution
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20180213/da903606/attachment.html>
On 2018-02-13, 15:29 GMT, Lukas Gebauer wrote:
zobrazit citaci
> To fakt používáte výraz "krtek"? Já to doposud slyšel jen od
> moravské náplavy.
Spíše jako legrace, ale ano občas jsem to slyšel i v normálním
provozu. Když už centimetro není dost zajímavé …
Matěj
--
https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Besides, the determined Real Programmer can write Fortran
programs in any language.
-- Ed Post, Real Programmers Don't Use Pascal« zpět na výpis měsíce