[Talk-cz] Špatná velikost písmen v názvech ulic importovaných z UIR-ADR
Vlákno 6.7. - 7.7.2016, počet zpráv: 7
Ahoj, možná se toto téma již v listu řešilo, ale žádné vlákno jsem nenašel.
Případně mě omluvte.
Píšu aplikaci nad knihovnou OSM Scout, při importu Česka jsem si všiml že ve
výsledné databázi chybí mnoho adres. Po dalším zkoumání jsem zjistil že
hodnota "addr:street" neodpovídá žádné blízké ulici (knihovna se snaží z adres
vytvořit stromovou strukturu, pokud nenajde odkazovanou ulici, náměstí nebo
sídliště..., adresu nepřidá do databáze). Po dalším zkoumání jsem zjistil že
mnoho adresních bodů má špatnou velikost písmen v tagu "addr:street",
například v ulici "V Olšinách" je mnoho (96) adres které mají ulici uvedenou
jako "V olšinách".
Hledání ulic jsem v knihovně udělal chytřejší, aby ignorovalo velikost písmen.
Nevím ale jestli její autor přijme merge request. V každém případě si myslím
že data v OSM by měla být opravena. Ale není to na ruční práci, jen v Praze
jsem našel 10 tisíc záznamů. Je tu někdo by byl schopný napsat automatický
script? Mohu dodat log z importu kde jsou chyby vypsány...
Lukáš
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 473 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/56aedc3f/attachment.sig>
Dne 6.7.2016 v 09:41 Lukáš Karas napsal(a):
zobrazit citaci
> Ahoj, možná se toto téma již v listu řešilo, ale žádné vlákno jsem nenašel.
> Případně mě omluvte.
>
> Píšu aplikaci nad knihovnou OSM Scout, při importu Česka jsem si všiml že ve
> výsledné databázi chybí mnoho adres. Po dalším zkoumání jsem zjistil že
> hodnota "addr:street" neodpovídá žádné blízké ulici (knihovna se snaží z adres
> vytvořit stromovou strukturu, pokud nenajde odkazovanou ulici, náměstí nebo
> sídliště..., adresu nepřidá do databáze). Po dalším zkoumání jsem zjistil že
> mnoho adresních bodů má špatnou velikost písmen v tagu "addr:street",
> například v ulici "V Olšinách" je mnoho (96) adres které mají ulici uvedenou
> jako "V olšinách".
>
> Hledání ulic jsem v knihovně udělal chytřejší, aby ignorovalo velikost písmen.
> Nevím ale jestli její autor přijme merge request. V každém případě si myslím
> že data v OSM by měla být opravena. Ale není to na ruční práci, jen v Praze
> jsem našel 10 tisíc záznamů. Je tu někdo by byl schopný napsat automatický
> script? Mohu dodat log z importu kde jsou chyby vypsány...
>
> Lukáš
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
A jak je to v RUIANu? Stejně? Tak to by pak bylo potřeba opravit tam.
Což znamená nahlásit na ČÚZK, ti to přepošlou daným úředníkům a ti s tím
možná něco udělají. A pak se to při update dostane až do OSM.
Ale pokud je to v RUIANu správně, tak by se to mělo v OSM opravit. Možná
by stačilo, kdyby to Petr Vejsada zakomponoval do update skriptu. Ale
nevím jak je na tom teď s časem, nějakou dobu se tu už neukázal.
Jinak mi připadá ignorování velikosti písma při hledání jako docela
dobrá vlastnost, která by měla být implementována. Stejně tak i nějaká
odolnost proti překlepům. To sice nevím jak se dělá, ale určitě by bylo
fajn, kdyby mi při hledání ulice "Na Olinách" byla nabídnuta i ulice "Na
Olšinách".
Marián
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/8625fbb0/attachment.html>
Dne středa 6. července 2016 10:00:36 CEST Marián Kyral napsal(a):
zobrazit citaci
> Dne 6.7.2016 v 09:41 Lukáš Karas napsal(a):
> > Ahoj, možná se toto téma již v listu řešilo, ale žádné vlákno jsem
> > nenašel.
> > Případně mě omluvte.
> >
> > Píšu aplikaci nad knihovnou OSM Scout, při importu Česka jsem si všiml že
> > ve výsledné databázi chybí mnoho adres. Po dalším zkoumání jsem zjistil
> > že hodnota "addr:street" neodpovídá žádné blízké ulici (knihovna se snaží
> > z adres vytvořit stromovou strukturu, pokud nenajde odkazovanou ulici,
> > náměstí nebo sídliště..., adresu nepřidá do databáze). Po dalším zkoumání
> > jsem zjistil že mnoho adresních bodů má špatnou velikost písmen v tagu
> > "addr:street", například v ulici "V Olšinách" je mnoho (96) adres které
> > mají ulici uvedenou jako "V olšinách".
> >
> > Hledání ulic jsem v knihovně udělal chytřejší, aby ignorovalo velikost
> > písmen. Nevím ale jestli její autor přijme merge request. V každém
> > případě si myslím že data v OSM by měla být opravena. Ale není to na
> > ruční práci, jen v Praze jsem našel 10 tisíc záznamů. Je tu někdo by byl
> > schopný napsat automatický script? Mohu dodat log z importu kde jsou
> > chyby vypsány...
> >
> > Lukáš
> >
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
>
> A jak je to v RUIANu? Stejně? Tak to by pak bylo potřeba opravit tam.
> Což znamená nahlásit na ČÚZK, ti to přepošlou daným úředníkům a ti s tím
> možná něco udělají. A pak se to při update dostane až do OSM.
>
> Ale pokud je to v RUIANu správně, tak by se to mělo v OSM opravit. Možná
> by stačilo, kdyby to Petr Vejsada zakomponoval do update skriptu. Ale
> nevím jak je na tom teď s časem, nějakou dobu se tu už neukázal.
>
>
> Jinak mi připadá ignorování velikosti písma při hledání jako docela
> dobrá vlastnost, která by měla být implementována. Stejně tak i nějaká
> odolnost proti překlepům. To sice nevím jak se dělá, ale určitě by bylo
> fajn, kdyby mi při hledání ulice "Na Olinách" byla nabídnuta i ulice "Na
> Olšinách".
>
> Marián
Jo, v katastru je to stejně tak blbě. Například:
Stavební objekt: č. p. 2515, č. p. 2516, č. p. 2517, č. p. 2539
Ulice: Buková, Osiková, Pod lipami
lipami by mělo být s velkým písmenem, v OSM je ulice správně "Pod Lipami".
Koukám že RUIAN obsahuje formulář pro zasílání oprav [1]. Obsahuje tam ale
vtipnou poznámku: "Návrhy na změny velikosti písmen budou zamítnuty
automaticky."
Co to sakra je?
Pokud existuje script kterým se provádí automatický import periodicky,
mohl bych se pokusit jej rozšířit o opravu známých chyb... Najdu jej někde
veřejně, třeba na githubu?
Lukáš
1) http://reklamace.cuzk.cz/formular/index.php?source=R%C3%9AIAN&field=ul-dnu&desc=Zm%C4%9Bna+n%C3%A1zvu+existuj%C3%ADc%C3%AD
+ulice&logged=-3&action=form
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 473 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/70aea5a5/attachment.sig>
Ahoj,
už ten nadpis máš špatně. Pro import aktualizaci adres se už dost dlouho
používá RUIAN. http://vdp.cuzk.cz/
Chybějící adresy se sice už řešily, ale jak je vidět nevyřešily. Na vině je
rozpor mezi stavovým výpisem (měsíčně) a aktualizacemi ve výměnném formátu
RUIAN.
Co to je špatná velikost písmen? http://prirucka.ujc.cas.cz/?id=186 kde se
píše.
PČP jsou závazná pouze pro školní jazykovou výuku. Pro ostatní uživatele
češtiny mají jen formu doporučení. Některé obecní, městské úřady
a magistráty stále setrvávají u staršího způsobu psaní, zejména pokud jde
o předložková spojení (viz bod 2.1
<http://prirucka.ujc.cas.cz/?id=186#ref_id_41_2_1>). Starší způsob psaní
často odůvodňují tím, že změna by pro ně byla finančně náročná.
Tedy. Ve škole musíš PČP dodržovat, pokud zasedneš v obecní komisi pro
pojmenování ulic, můžeš se na pravidla vybodnout.
Dne 6. července 2016 9:41 Lukáš Karas <lukas.karas na centrum.cz> napsal(a):
zobrazit citaci
> Ahoj, možná se toto téma již v listu řešilo, ale žádné vlákno jsem nenašel.
> Případně mě omluvte.
>
> Píšu aplikaci nad knihovnou OSM Scout, při importu Česka jsem si všiml že
> ve
> výsledné databázi chybí mnoho adres. Po dalším zkoumání jsem zjistil že
> hodnota "addr:street" neodpovídá žádné blízké ulici (knihovna se snaží z
> adres
> vytvořit stromovou strukturu, pokud nenajde odkazovanou ulici, náměstí nebo
> sídliště..., adresu nepřidá do databáze). Po dalším zkoumání jsem zjistil
> že
> mnoho adresních bodů má špatnou velikost písmen v tagu "addr:street",
> například v ulici "V Olšinách" je mnoho (96) adres které mají ulici
> uvedenou
> jako "V olšinách".
>
> Hledání ulic jsem v knihovně udělal chytřejší, aby ignorovalo velikost
> písmen.
> Nevím ale jestli její autor přijme merge request. V každém případě si
> myslím
> že data v OSM by měla být opravena. Ale není to na ruční práci, jen v Praze
> jsem našel 10 tisíc záznamů. Je tu někdo by byl schopný napsat automatický
> script? Mohu dodat log z importu kde jsou chyby vypsány...
>
> Lukáš
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/3ef7dad8/attachment.html>
Dne středa 6. července 2016 10:54:30 CEST Mirek Dlask napsal(a):
zobrazit citaci
> Ahoj,
> už ten nadpis máš špatně. Pro import aktualizaci adres se už dost dlouho
> používá RUIAN. http://vdp.cuzk.cz/
Dobrá. To není zas tak podstatné. Vycházel jsem z tagu source:addr=uir_adr
zobrazit citaci
> Chybějící adresy se sice už řešily, ale jak je vidět nevyřešily. Na vině je
> rozpor mezi stavovým výpisem (měsíčně) a aktualizacemi ve výměnném formátu
> RUIAN.
> Co to je špatná velikost písmen? http://prirucka.ujc.cas.cz/?id=186 kde se
> píše.
Nejsem grammar nazi. Stejně tak chápu že pokud si například zastupitelé v
Litomyšli odhlasují že se bude jejich město jmenovat "LyTomišl" tak bychom to
měli v OSM datech upravit. Ale tady jde o očividnou chybu v RUIAN datech.
Ve všech materiálech Prahy 3 se ulice "Pod Lipami" píše s velkým "L" (stejně
tak ostatní). V RUIANu je ale s malým písmenem. Neřešil bych to, kdyby to
nedělalo problémy v OSM Scout knihovně, která se snaží vytvořit index adres
jako stromovou strukturu.
zobrazit citaci
>
> PČP jsou závazná pouze pro školní jazykovou výuku. Pro ostatní uživatele
> češtiny mají jen formu doporučení. Některé obecní, městské úřady
> a magistráty stále setrvávají u staršího způsobu psaní, zejména pokud jde
> o předložková spojení (viz bod 2.1
> <http://prirucka.ujc.cas.cz/?id=186#ref_id_41_2_1>). Starší způsob psaní
> často odůvodňují tím, že změna by pro ně byla finančně náročná.
>
> Tedy. Ve škole musíš PČP dodržovat, pokud zasedneš v obecní komisi pro
> pojmenování ulic, můžeš se na pravidla vybodnout.
>
> Dne 6. července 2016 9:41 Lukáš Karas <lukas.karas na centrum.cz> napsal(a):
> > Ahoj, možná se toto téma již v listu řešilo, ale žádné vlákno jsem
> > nenašel.
> > Případně mě omluvte.
> >
> > Píšu aplikaci nad knihovnou OSM Scout, při importu Česka jsem si všiml že
> > ve
> > výsledné databázi chybí mnoho adres. Po dalším zkoumání jsem zjistil že
> > hodnota "addr:street" neodpovídá žádné blízké ulici (knihovna se snaží z
> > adres
> > vytvořit stromovou strukturu, pokud nenajde odkazovanou ulici, náměstí
> > nebo
> > sídliště..., adresu nepřidá do databáze). Po dalším zkoumání jsem zjistil
> > že
> > mnoho adresních bodů má špatnou velikost písmen v tagu "addr:street",
> > například v ulici "V Olšinách" je mnoho (96) adres které mají ulici
> > uvedenou
> > jako "V olšinách".
> >
> > Hledání ulic jsem v knihovně udělal chytřejší, aby ignorovalo velikost
> > písmen.
> > Nevím ale jestli její autor přijme merge request. V každém případě si
> > myslím
> > že data v OSM by měla být opravena. Ale není to na ruční práci, jen v
> > Praze
> > jsem našel 10 tisíc záznamů. Je tu někdo by byl schopný napsat automatický
> > script? Mohu dodat log z importu kde jsou chyby vypsány...
> >
> > Lukáš
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 473 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/6acffdfe/attachment.sig>
...
zobrazit citaci
> Koukám že RUIAN obsahuje formulář pro zasílání oprav [1]. Obsahuje tam ale
> vtipnou poznámku: "Návrhy na změny velikosti písmen budou zamítnuty
> automaticky."
>
> Co to sakra je?
to je přesně tohle:
"Starší způsob psaní často odůvodňují tím, že změna by pro ně byla finančně
náročná."
- tu nahlášenou chybu musí někdo zpracovat ... sám jsi napsal, že je to v řádu
deset tisíc jenom v Praze
(a vůbec bych se nedivil, kdyby to bylo i tak trochu na truc vůči těm koninám,
co jazykovědci vymýšlí)
K.
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 181 bytes
Desc: This is a digitally signed message part.
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20160706/be2798b9/attachment.sig>
On Wed, Jul 06, 2016 at 11:37:17AM +0200, Karel Volný wrote:
zobrazit citaci
> ...
> > Koukám že RUIAN obsahuje formulář pro zasílání oprav [1]. Obsahuje tam ale
> > vtipnou poznámku: "Návrhy na změny velikosti písmen budou zamítnuty
> > automaticky."
> >
> > Co to sakra je?
>
> to je přesně tohle:
>
> "Starší způsob psaní často odůvodňují tím, že změna by pro ně byla finančně
> náročná."
>
> - tu nahlášenou chybu musí někdo zpracovat ... sám jsi napsal, že je to v řádu
> deset tisíc jenom v Praze
>
> (a vůbec bych se nedivil, kdyby to bylo i tak trochu na truc vůči těm koninám,
> co jazykovědci vymýšlí)
>
> K.
Jako ... cekal bych, ze v RUIAN budou udaje v souladu se skutecnosti, tedy vcetne
spravne velikosti pismen ('spravne' ve smyslu, jak to obec pojmenovala).
Myslim, ze ta poznamka "Návrhy na změny velikosti písmen budou zamítnuty automaticky"
znamena, ze obec nebude prejmenovavat ulici, nikoliv ze si RUIAN odmita opravit data.
A pokud nazev ulice nekoresponduje s adresnim mistem v te ulici, tak je to chyba v datech,
kterou muze RUIAN odhalit a opravit i automaticky.
Martin Hejna« zpět na výpis měsíce