« zpět na výpis měsíce |

[Talk-cz] Adresy a is_in, RUIAN

Vlákno 1.1. - 2.1.2014, počet zpráv: 11


1.1.2014 04:20:41 (#1)
gravatar

Petr Vejsada

<osm at propsychology.cz>
516
Ještě jednou zdravím, chci se optat - poskytnout námět ohledně sjednocení adres. Docela mi vadí, že Nominatim neumí použít tag is_in, který se v databázi vyskytuje dosti často. Pak se nedá nalézt konkrétní dům, obzvláště v menších sídlech bez ulic. Ve větších sídlech si najdu ulici a tam se už podle orientačního čísla dá konkrétní dům nalézt, i když také ne vždy snadno. Třeba tehdy, když je k dispozici jen číslo popisné. V těch menších sídlech vůbec nemám tušení, kde bych měl dům hledat. Napadlo mě, zda se neuvažovalo o kompletním importu z RUIAN s následným (nebo současným) automatickým smazáním stávajících adresních bodů. To by asi šlo algoritmizovat podle vzdálenosti, něco jako: - vezmu nový adresní bod z RUIAN - podívám se kolem do vzdálenosti třeba 20 metrů, zda tam už adresní bod příslušného místa není. Pokud je, smazat a nahradit novým. Pokud není, jen přidat nový. Mohou nastat situace, kdy se stávající adresní bod nepodaří identifikovat. Chtělo by to zkusit. Snažil jsem se naimportovat RUIAN do postgisu, ale je asi zase nějaký nový formát a nezdařila se mi konverze z GML. Pokud by chodil import do postgisu, asi bych se v případě volného času pustil do pokusů.? -- Petr

1.1.2014 04:57:29 (#2)
gravatar

Dalibor Jelínek

<dalibor at dalibor.cz>
415 1552
Ahoj, Nominatim umi najit dum v mensich sidlech bez ulic, pokud je a adrese addr:place. Osobne se to snazim to vsech adres, tam kde mapuju, doplnovat. Zdravi, Dalibor
-----Original Message----- From: Petr Vejsada [mailto:osm na propsychology.cz] Sent: Wednesday, January 1, 2014 4:21 PM To: talk-cz na openstreetmap.org Subject: [Talk-cz] Adresy a is_in, RUIAN Ještě jednou zdravím, chci se optat - poskytnout námět ohledně sjednocení adres. Docela mi vadí, že Nominatim neumí použít tag is_in, který se v databázi vyskytuje dosti často. Pak se nedá nalézt konkrétní dům, obzvláště v menších sídlech bez ulic. Ve větších sídlech si najdu ulici a tam se už podle orientačního čísla dá konkrétní dům nalézt, i když také ne vždy snadno. Třeba tehdy, když je k dispozici jen číslo popisné. V těch menších sídlech vůbec nemám tušení, kde bych měl dům hledat. Napadlo mě, zda se neuvažovalo o kompletním importu z RUIAN s následným (nebo současným) automatickým smazáním stávajících adresních bodů. To by asi šlo algoritmizovat podle vzdálenosti, něco jako: - vezmu nový adresní bod z RUIAN - podívám se kolem do vzdálenosti třeba 20 metrů, zda tam už adresní bod příslušného místa není. Pokud je, smazat a nahradit novým. Pokud není, jen přidat nový. Mohou nastat situace, kdy se stávající adresní bod nepodaří identifikovat. Chtělo by to zkusit. Snažil jsem se naimportovat RUIAN do postgisu, ale je asi zase nějaký nový formát a nezdařila se mi konverze z GML. Pokud by chodil import do postgisu, asi bych se v případě volného času pustil do pokusů.? -- Petr _______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz

1.1.2014 08:54:21 (#3)
gravatar

Petr Vejsada

<osm at propsychology.cz>
516
Ahoj, díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se, že automaticky.. Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z nich má tag is_in a tedy 2.425 adresních míst tento tag nemá. Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852), cestách (4.375) i relacích (2). Mapnik vykresluje adresy jen u bodů. Podle pravidel na http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku. Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první), které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a rozhodnout, co s tím. Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000 adres dohledatelnými by nebylo špatné. -- Petr Dne St 1. ledna 2014 16:57:29, Dalibor Jelínek napsal(a): zobrazit citaci
> Ahoj, > Nominatim umi najit dum v mensich sidlech bez ulic, > pokud je a adrese addr:place. > Osobne se to snazim to vsech adres, tam kde mapuju, doplnovat. > > Zdravi, > Dalibor >

1.1.2014 09:07:06 (#4)
gravatar

"Petr Morávek [Xificurk]"

<petr at pada.cz>
139
Dne 1.1.2014 20:54, Petr Vejsada napsal(a): zobrazit citaci
> Ahoj, > > díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se, > že automaticky.. > > Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z > nich má tag is_in a tedy 2.425 adresních míst tento tag nemá. > > Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852), > cestách (4.375) i relacích (2). > > Mapnik vykresluje adresy jen u bodů. Podle pravidel na > http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na > cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku. > > Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první), > které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako > addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a > rozhodnout, co s tím. > > Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do > toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000 > adres dohledatelnými by nebylo špatné. > > -- > Petr
Ahoj, (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z této databáze. Zdraví, Petr Morávek aka Xificurk

2.1.2014 12:10:55 (#5)
gravatar

Petr Vejsada

<osm at propsychology.cz>
516
Ahoj, díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech být cokoli. Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních místech: count | k | v --------+-----------------+------------------------------ 1 | source | http://www.autolibra.cz/ 1 | source | http://www.pension-libra.cz/ 1 | source | ruian 1 | source:addr | mvcr:adresa;ruian 1 | source:name | wikipedia 2 | source | local knowledge 3 | source:position | cuzk:km 45 | source | cuzk:kn 46 | source | cuzk:km 309 | source | mvcr:adresa 684 | source:loc | cuzk:km 1091 | source:addr | mvcr:adresa 202194 | source:addr | ruian S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a napsat do is_in nějaký nesmysl. Kolik jich bude? Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place? (víceméně řečnické otázky). To vyvolává další otázky, jako třeba: Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude? číslo popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v katastrálním území i bez znalosti ulice. To dnes v Nominatimu nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou. V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o zavedení městských částí? (Praha 1, Praha 2 atd.) Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce: Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry contains non-closed rings Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position 3490 within geometry a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také přidal projekci 5514, takže nevím. Jdu spát _) -- Petr Dne St 1. ledna 2014 21:07:06, Petr Morávek [Xificurk] napsal(a): zobrazit citaci
> Ahoj, > > (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat > parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by > bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z > této databáze.

2.1.2014 12:51:28 (#6)
gravatar

"Petr Morávek [Xificurk]"

<petr at pada.cz>
139
Dne 2.1.2014 00:10, Petr Vejsada napsal(a): zobrazit citaci
> Ahoj, > > díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech > být cokoli. > > Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních > místech: > > count | k | v > --------+-----------------+------------------------------ > 1 | source | http://www.autolibra.cz/ > 1 | source | http://www.pension-libra.cz/ > 1 | source | ruian > 1 | source:addr | mvcr:adresa;ruian > 1 | source:name | wikipedia > 2 | source | local knowledge > 3 | source:position | cuzk:km > 45 | source | cuzk:kn > 46 | source | cuzk:km > 309 | source | mvcr:adresa > 684 | source:loc | cuzk:km > 1091 | source:addr | mvcr:adresa > 202194 | source:addr | ruian > > S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a > napsat do is_in nějaký nesmysl. Kolik jich bude?
Nemám tušení... ona to totiž není jen otázka toho, jestli to někdo od "importu" zeditoval nebo ne. Já totiž vůbec nemám přehled, co, kdo, při jakém importu do tohodle tagu házel, ty ano, je to někde rozumně zdokumentováno? Myslím si, že pokud se něco opravuje, tak by se to mělo opravit pořádně. zobrazit citaci
> Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place? > (víceméně řečnické otázky).
To je dobrá otázka, před nedávnem jsme se o tom v jednom vlákně bavili... zobrazit citaci
> To vyvolává další otázky, jako třeba: > > Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude?
Taky už jsem psal ve vedlejším vlákně (včetně odůvodnění) - já jsem pro to "všude" a obsahem by měl být název části obce. zobrazit citaci
> číslo > popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v > katastrálním území i bez znalosti ulice.
Tady se pleteš, č.p. není jedinečné v katastrálním území, ale v "části obce". zobrazit citaci
> To dnes v Nominatimu nelze. Pak je tu > další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou. > V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o > zavedení městských částí? (Praha 1, Praha 2 atd.)
Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1, 2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích. zobrazit citaci
> Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože > nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce: > > Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry > contains non-closed rings > Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position > 3490 within geometry
Co přesně pouštíš za příkaz? Já jsem RUIAN importoval před pár dny bez problémů. zobrazit citaci
> a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze > ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také > přidal projekci 5514, takže nevím. Jdu spát _) >
Zdraví, Petr Morávek aka Xificurk

2.1.2014 09:16:54 (#7)
gravatar

Václav Řehák

<rehakv01 at gmail.com>
63
zobrazit citaci
> > > > To dnes v Nominatimu nelze. Pak je tu > > další věc, která souvisí jen okrajově, ale je to věc, která se mi honí > hlavou. > > V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se > uvažovat o > > zavedení městských částí? (Praha 1, Praha 2 atd.) > > Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně > jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde > jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1, > 2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích. > > Ona ta problematika je dost složitá, v Praze existuje mnoho různých
dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy V centru je to ještě celkem přehledné, ale takové Satalice jsou buď samostatná MČ, nebo součást Prahy 19, ale na adresu se píše Praha 9. Osobně bych se do toho nepouštěl, pro neznalé územního členění Prahy to může přinést víc škody než užitku. Viz třeba Google, který renderuje názvy městkých částí, takže na mapě je Praha-Čakovice, Praha-Satalice, ale také Praha 19 (místo Kbely - což považuju za dost matoucí, byť úředně správné). V. ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20140102/0a6d6697/attachment.html>

2.1.2014 09:57:05 (#8)
gravatar

Dalibor Jelínek

<dalibor at dalibor.cz>
415 1552
Ahoj, ja si myslim, ze je to celkem dobry napad. Jen by melo byt splneno nekolik podminek. Jen n a vysvetlenou. addr:place se nepouzival, pac nic rozumneho nedelal. Az od kvetna 2013 podle toho umi Nominatim vyhledavat Viz http://www.mail-archive.com/talk-cz na openstreetmap.org/msg08818.html Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak trochu svaty gral, protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat. Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu. Takze bych byl docela pro to, aby se do addr:place dala ta prvni cast is_in. Ano, sice hrozi, ze nekde se tam dostane nesmysl, ale porad mi prijde lepsi, ze ve vetsine pripadu pujde diky tomu adresa vyhledat. Davam k uvahu zvazit, zda tu zmenu neprovadet ze zacatku treba podle uzivatele, ktery adresu vytvoril. Myslim si, ze vetsina z nich je bud delana nejakym sikovnym importem, nebo pomoci pluginu Czech Address. V kazdem pripade vetsina adres, kde jsem editoval, byla delana jen par uzivateli (minimalis,... ) a ti meli tag is_in spravne. Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym vyhrazenym uctem (s inteligentnim nazvem). Co se tyce pridavani mestksych casti do addr:place, tam kde jsou ulice, tak tam si myslim, ze je to celkem jasne. Proste se do addr:place dava vzdy cast obce. Takze v Praze by to byla Liben, Kobylisy, Vysocany, tedy tak jak je to v KN a RUIAN. Jen nevim, jestli je tahle infromace v is_in tagu a mam pocit, ze vetsinou ne, takze stejne nebudes v prvni fazi mit, kde brat. Ale podle RUIANu by to jiste slo. Mit v adrese i Praha 9 by bylo sice fain, ale kde tu infomaci vezmes? Podle PSC urcite ne. Je to v RUIANu? Zdravi, Dalibor
-----Original Message----- From: Petr Vejsada [mailto:osm na propsychology.cz] Sent: Thursday, January 2, 2014 12:11 AM To: OpenStreetMap Czech Republic Subject: Re: [Talk-cz] Adresy a is_in, RUIAN Ahoj, díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech být cokoli. Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních místech: count | k | v --------+-----------------+------------------------------ 1 | source | http://www.autolibra.cz/ 1 | source | http://www.pension-libra.cz/ 1 | source | ruian 1 | source:addr | mvcr:adresa;ruian 1 | source:name | wikipedia 2 | source | local knowledge 3 | source:position | cuzk:km 45 | source | cuzk:kn 46 | source | cuzk:km 309 | source | mvcr:adresa 684 | source:loc | cuzk:km 1091 | source:addr | mvcr:adresa 202194 | source:addr | ruian S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a napsat do is_in nějaký nesmysl. Kolik jich bude? Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place? (víceméně řečnické otázky). To vyvolává další otázky, jako třeba: Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude? číslo popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v katastrálním území i bez znalosti ulice. To dnes v Nominatimu nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou. V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o zavedení městských částí? (Praha 1, Praha 2 atd.) Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce: Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry contains non-closed rings Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position 3490 within geometry a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také přidal projekci 5514, takže nevím. Jdu spát _) -- Petr Dne St 1. ledna 2014 21:07:06, Petr Morávek [Xificurk] napsal(a): zobrazit citaci
> Ahoj, > > (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat > parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by > bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z > této databáze.
_______________________________________________ Talk-cz mailing list Talk-cz na openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-cz

2.1.2014 09:19:25 (#9)
gravatar

Petr Vejsada

<osm at propsychology.cz>
516
Dne Čt 2. ledna 2014 09:16:54, Václav Řehák napsal(a): zobrazit citaci
> > Ona ta problematika je dost složitá, v Praze existuje mnoho různých > > dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy > V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
díky za info, autor článku má můj obdiv. Tak do toho nejdu. -- -p-

2.1.2014 09:40:41 (#10)
gravatar

Petr Vejsada

<osm at propsychology.cz>
516
Ahoj, Dne Čt 2. ledna 2014 09:57:05, Dalibor Jelínek napsal(a): mojí prvotní motivací bylo a stále je mít možnost najít dům na malém sídle. Udělat to z is_in by tomuto cíli IMO významně přispělo s rizikem, že se v jistém množství případů dostanou do addr:place nepsrávné údaje, a to jen z toho důvodu, že už nesprávné v OSM teď jsou, jen na jiném místě. Varianta přes RUIAN vnáší riziko, že se stávající adresní místa chybně propojí s RUIAN a dostanou se tam nesmysly. Další chyby se mohou převzít z RUIAN. Také je třeba nalézt nějakou rovnováhu mezi mírou dokonalosti na jedné straně a množstvím času a energie do toho vložené na druhé straně. zobrazit citaci
> Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak > trochu svaty gral, > protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat. > Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu.
Pokud je RUIAN opravdu svatý, tak by se mohly všechny stávající adresní body smazat a nahrát je znovu kompletně z RUIAN. Následně pak dělat třeba jednou za rok aktualizaci.? Co třeba s tímto - http://mapapi.poloha.net/#map=20/50.22517/14.42172 - jsou tam adresy jednak jako adresní body a zároveň jsou na budovách. V okolí Odolené Vody je toho takto povícero. To smazání a komplet nový import by to vyřešil, jen jak je to s tou svatostí ;). Momentálně díky Xficurkově radě importuji RUIAN do db, pak to budu studovat a učit se s tím zacházet, takže uvidíme. jak to energeticky-časově odhadnu. zobrazit citaci
> Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym > vyhrazenym uctem (s inteligentnim nazvem).
Rozumím tomu tak, že pedro'_import není inteligentní název ;-))) -- -p-

2.1.2014 09:51:16 (#11)
gravatar

hanoj

<ehanoj at gmail.com>
718
zobrazit citaci
>> > Ona ta problematika je dost složitá, v Praze existuje mnoho různých >> dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy >> V centru je to ještě celkem přehledné, ale takové Satalice jsou buď > > díky za info, autor článku má můj obdiv. Tak do toho nejdu.
*** k pochopení situace síše pomůže toto: http://www.czso.cz/csu/rso.nsf/i/soustava_prvku resp http://www.czso.cz/csu/rso.nsf/5873954e2ae286eec12570f8003e7738/a1809b67f5f4560ec1256e6100495bff/Obsah/138.2F62?OpenElement&FieldElemFormat=gif hanoj

« zpět na výpis měsíce