[Talk-cz] Adresy a is_in, RUIAN
Vlákno 1.1. - 2.1.2014, počet zpráv: 11
Ještě jednou zdravím,
chci se optat - poskytnout námět ohledně sjednocení adres. Docela mi vadí, že
Nominatim neumí použít tag is_in, který se v databázi vyskytuje dosti často.
Pak se nedá nalézt konkrétní dům, obzvláště v menších sídlech bez ulic. Ve
větších sídlech si najdu ulici a tam se už podle orientačního čísla dá
konkrétní dům nalézt, i když také ne vždy snadno. Třeba tehdy, když je k
dispozici jen číslo popisné. V těch menších sídlech vůbec nemám tušení, kde
bych měl dům hledat. Napadlo mě, zda se neuvažovalo o kompletním importu z
RUIAN s následným (nebo současným) automatickým smazáním stávajících adresních
bodů. To by asi šlo algoritmizovat podle vzdálenosti, něco jako:
- vezmu nový adresní bod z RUIAN
- podívám se kolem do vzdálenosti třeba 20 metrů, zda tam už adresní bod
příslušného místa není. Pokud je, smazat a nahradit novým. Pokud není, jen
přidat nový.
Mohou nastat situace, kdy se stávající adresní bod nepodaří identifikovat.
Chtělo by to zkusit.
Snažil jsem se naimportovat RUIAN do postgisu, ale je asi zase nějaký nový
formát a nezdařila se mi konverze z GML. Pokud by chodil import do postgisu,
asi bych se v případě volného času pustil do pokusů.?
--
Petr
Ahoj,
Nominatim umi najit dum v mensich sidlech bez ulic,
pokud je a adrese addr:place.
Osobne se to snazim to vsech adres, tam kde mapuju, doplnovat.
Zdravi,
Dalibor
-----Original Message-----
From: Petr Vejsada [mailto:osm na propsychology.cz]
Sent: Wednesday, January 1, 2014 4:21 PM
To: talk-cz na openstreetmap.org
Subject: [Talk-cz] Adresy a is_in, RUIAN
Ještě jednou zdravím,
chci se optat - poskytnout námět ohledně sjednocení adres. Docela mi vadí,
že Nominatim neumí použít tag is_in, který se v databázi vyskytuje dosti
často.
Pak se nedá nalézt konkrétní dům, obzvláště v menších sídlech bez ulic. Ve
větších sídlech si najdu ulici a tam se už podle orientačního čísla dá
konkrétní dům nalézt, i když také ne vždy snadno. Třeba tehdy, když je k
dispozici jen číslo popisné. V těch menších sídlech vůbec nemám tušení, kde
bych měl dům hledat. Napadlo mě, zda se neuvažovalo o kompletním importu z
RUIAN s následným (nebo současným) automatickým smazáním stávajících
adresních bodů. To by asi šlo algoritmizovat podle vzdálenosti, něco jako:
- vezmu nový adresní bod z RUIAN
- podívám se kolem do vzdálenosti třeba 20 metrů, zda tam už adresní bod
příslušného místa není. Pokud je, smazat a nahradit novým. Pokud není, jen
přidat nový.
Mohou nastat situace, kdy se stávající adresní bod nepodaří identifikovat.
Chtělo by to zkusit.
Snažil jsem se naimportovat RUIAN do postgisu, ale je asi zase nějaký nový
formát a nezdařila se mi konverze z GML. Pokud by chodil import do postgisu,
asi bych se v případě volného času pustil do pokusů.?
--
Petr
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
Ahoj,
díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se,
že automaticky..
Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z
nich má tag is_in a tedy 2.425 adresních míst tento tag nemá.
Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852),
cestách (4.375) i relacích (2).
Mapnik vykresluje adresy jen u bodů. Podle pravidel na
http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na
cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku.
Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první),
které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako
addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a
rozhodnout, co s tím.
Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do
toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000
adres dohledatelnými by nebylo špatné.
--
Petr
Dne St 1. ledna 2014 16:57:29, Dalibor Jelínek napsal(a):
zobrazit citaci
> Ahoj,
> Nominatim umi najit dum v mensich sidlech bez ulic,
> pokud je a adrese addr:place.
> Osobne se to snazim to vsech adres, tam kde mapuju, doplnovat.
>
> Zdravi,
> Dalibor
>
Dne 1.1.2014 20:54, Petr Vejsada napsal(a):
zobrazit citaci
> Ahoj,
>
> díky moc za info, to je skvělá zpráva. addr:place by se dalo doplnit a zdá se,
> že automaticky..
>
> Existuje 213.959 adresních míst bez ulice a bez addr:place, přičemž 211.534 z
> nich má tag is_in a tedy 2.425 adresních míst tento tag nemá.
>
> Adresní tagy se vyskytují ve všech třech typech, tedy uzlech (209.852),
> cestách (4.375) i relacích (2).
>
> Mapnik vykresluje adresy jen u bodů. Podle pravidel na
> http://wiki.openstreetmap.org/wiki/Key:addr je povoleno používat tyto tagy na
> cestách, takže vlastně jde o (chybnou) konfiguraci Mapniku.
>
> Z is_in by se tedy dalo vytáhnout adresní místo (zdá se, že to je to první),
> které by se použilo jako addr:place. U těch 2.425 by šlo použít addr:city jako
> addr:place, případně to nechat být, případně těch 2-425 míst zkouknout očima a
> rozhodnout, co s tím.
>
> Prosím tedy komunitu o vyjádření, zda se to zdá jako dobrý nápad a mohu se do
> toho pustit. Je to docela rozsáhlý zásah do dat. Myslím, že udělat cca 200.000
> adres dohledatelnými by nebylo špatné.
>
> --
> Petr
Ahoj,
(polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat
parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by
bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z
této databáze.
Zdraví,
Petr Morávek aka Xificurk
Ahoj,
díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech
být cokoli.
Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních
místech:
count | k | v
--------+-----------------+------------------------------
1 | source | http://www.autolibra.cz/
1 | source | http://www.pension-libra.cz/
1 | source | ruian
1 | source:addr | mvcr:adresa;ruian
1 | source:name | wikipedia
2 | source | local knowledge
3 | source:position | cuzk:km
45 | source | cuzk:kn
46 | source | cuzk:km
309 | source | mvcr:adresa
684 | source:loc | cuzk:km
1091 | source:addr | mvcr:adresa
202194 | source:addr | ruian
S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a
napsat do is_in nějaký nesmysl. Kolik jich bude?
Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place?
(víceméně řečnické otázky).
To vyvolává další otázky, jako třeba:
Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude? číslo
popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v
katastrálním území i bez znalosti ulice. To dnes v Nominatimu nelze. Pak je tu
další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou.
V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o
zavedení městských částí? (Praha 1, Praha 2 atd.)
Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože
nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce:
Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry
contains non-closed rings
Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position
3490 within geometry
a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze
ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také
přidal projekci 5514, takže nevím. Jdu spát _)
--
Petr
Dne St 1. ledna 2014 21:07:06, Petr Morávek [Xificurk] napsal(a):
zobrazit citaci
> Ahoj,
>
> (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat
> parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by
> bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z
> této databáze.
Dne 2.1.2014 00:10, Petr Vejsada napsal(a):
zobrazit citaci
> Ahoj,
>
> díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých případech
> být cokoli.
>
> Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních
> místech:
>
> count | k | v
> --------+-----------------+------------------------------
> 1 | source | http://www.autolibra.cz/
> 1 | source | http://www.pension-libra.cz/
> 1 | source | ruian
> 1 | source:addr | mvcr:adresa;ruian
> 1 | source:name | wikipedia
> 2 | source | local knowledge
> 3 | source:position | cuzk:km
> 45 | source | cuzk:kn
> 46 | source | cuzk:km
> 309 | source | mvcr:adresa
> 684 | source:loc | cuzk:km
> 1091 | source:addr | mvcr:adresa
> 202194 | source:addr | ruian
>
> S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat a
> napsat do is_in nějaký nesmysl. Kolik jich bude?
Nemám tušení... ona to totiž není jen otázka toho, jestli to někdo od
"importu" zeditoval nebo ne. Já totiž vůbec nemám přehled, co, kdo, při
jakém importu do tohodle tagu házel, ty ano, je to někde rozumně
zdokumentováno? Myslím si, že pokud se něco opravuje, tak by se to mělo
opravit pořádně.
zobrazit citaci
> Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place?
> (víceméně řečnické otázky).
To je dobrá otázka, před nedávnem jsme se o tom v jednom vlákně bavili...
zobrazit citaci
> To vyvolává další otázky, jako třeba:
>
> Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude?
Taky už jsem psal ve vedlejším vlákně (včetně odůvodnění) - já jsem pro
to "všude" a obsahem by měl být název části obce.
zobrazit citaci
> číslo
> popisné je jedinečné v katastrálním území, tedy mělo by být možné nalézt dům v
> katastrálním území i bez znalosti ulice.
Tady se pleteš, č.p. není jedinečné v katastrálním území, ale v "části
obce".
zobrazit citaci
> To dnes v Nominatimu nelze. Pak je tu
> další věc, která souvisí jen okrajově, ale je to věc, která se mi honí hlavou.
> V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o
> zavedení městských částí? (Praha 1, Praha 2 atd.)
Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně
jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde
jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1,
2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích.
zobrazit citaci
> Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože
> nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce:
>
> Exception in thread "main" org.postgresql.util.PSQLException: ERROR: geometry
> contains non-closed rings
> Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at position
> 3490 within geometry
Co přesně pouštíš za příkaz? Já jsem RUIAN importoval před pár dny bez
problémů.
zobrazit citaci
> a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze
> ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také
> přidal projekci 5514, takže nevím. Jdu spát _)
>
Zdraví,
Petr Morávek aka Xificurk
zobrazit citaci
>
>
> > To dnes v Nominatimu nelze. Pak je tu
> > další věc, která souvisí jen okrajově, ale je to věc, která se mi honí
> hlavou.
> > V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se
> uvažovat o
> > zavedení městských částí? (Praha 1, Praha 2 atd.)
>
> Otázkou je v jaké formě a k čemu by to mělo být vlastně dobré. Mě osobně
> jejich absence moc netrápí. Mám zkušenosti z Prahy, kde sice vím kde
> jsou Vinohrady, Smíchov, atd., ale fakt netuším, jestli to je Praha 1,
> 2, 3, 4, 5... A podobně jsem na tom doma v Pardubicích.
>
> Ona ta problematika je dost složitá, v Praze existuje mnoho různých
dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy
V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
samostatná MČ, nebo součást Prahy 19, ale na adresu se píše Praha 9.
Osobně bych se do toho nepouštěl, pro neznalé územního členění Prahy to
může přinést víc škody než užitku. Viz třeba Google, který renderuje názvy
městkých částí, takže na mapě je Praha-Čakovice, Praha-Satalice, ale také
Praha 19 (místo Kbely - což považuju za dost matoucí, byť úředně správné).
V.
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20140102/0a6d6697/attachment.html>
Ahoj,
ja si myslim, ze je to celkem dobry napad.
Jen by melo byt splneno nekolik podminek.
Jen n a vysvetlenou. addr:place se nepouzival, pac nic rozumneho nedelal.
Az od kvetna 2013 podle toho umi Nominatim vyhledavat
Viz http://www.mail-archive.com/talk-cz na openstreetmap.org/msg08818.html
Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak
trochu svaty gral,
protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat.
Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu.
Takze bych byl docela pro to, aby se do addr:place dala ta prvni cast is_in.
Ano, sice hrozi, ze nekde se tam dostane nesmysl, ale porad mi prijde
lepsi, ze ve vetsine pripadu pujde diky tomu adresa vyhledat.
Davam k uvahu zvazit, zda tu zmenu neprovadet ze zacatku treba podle
uzivatele, ktery adresu vytvoril. Myslim si, ze vetsina z nich je bud delana
nejakym sikovnym importem, nebo pomoci pluginu Czech Address.
V kazdem pripade vetsina adres, kde jsem editoval, byla delana jen
par uzivateli (minimalis,... ) a ti meli tag is_in spravne.
Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym
vyhrazenym uctem (s inteligentnim nazvem).
Co se tyce pridavani mestksych casti do addr:place, tam kde jsou ulice,
tak tam si myslim, ze je to celkem jasne. Proste se do addr:place dava
vzdy cast obce. Takze v Praze by to byla Liben, Kobylisy, Vysocany,
tedy tak jak je to v KN a RUIAN.
Jen nevim, jestli je tahle infromace v is_in tagu a mam pocit, ze vetsinou
ne,
takze stejne nebudes v prvni fazi mit, kde brat.
Ale podle RUIANu by to jiste slo.
Mit v adrese i Praha 9 by bylo sice fain, ale kde tu infomaci vezmes?
Podle PSC urcite ne. Je to v RUIANu?
Zdravi,
Dalibor
-----Original Message-----
From: Petr Vejsada [mailto:osm na propsychology.cz]
Sent: Thursday, January 2, 2014 12:11 AM
To: OpenStreetMap Czech Republic
Subject: Re: [Talk-cz] Adresy a is_in, RUIAN
Ahoj,
díky za názor. Ono to nebude tak hrozné. Ano, může tam v ojedinělých
případech být cokoli.
Pohleďme na tabulku četností výskytu tagu %source% v předmětných adresních
místech:
count | k | v
--------+-----------------+------------------------------
1 | source | http://www.autolibra.cz/
1 | source | http://www.pension-libra.cz/
1 | source | ruian
1 | source:addr | mvcr:adresa;ruian
1 | source:name | wikipedia
2 | source | local knowledge
3 | source:position | cuzk:km
45 | source | cuzk:kn
46 | source | cuzk:km
309 | source | mvcr:adresa
684 | source:loc | cuzk:km
1091 | source:addr | mvcr:adresa
202194 | source:addr | ruian
S drtivou převahou vede právě RUIAN. Ano, i tyto položky mohl někdo editovat
a napsat do is_in nějaký nesmysl. Kolik jich bude?
Proč se vlastně při importu těchto míst z RUIAN nepřidával tag addr:place?
(víceméně řečnické otázky).
To vyvolává další otázky, jako třeba:
Importovat z RUIAN addr:place jen tam, kde není ulice, nebo úplně všude?
číslo popisné je jedinečné v katastrálním území, tedy mělo by být možné
nalézt dům v katastrálním území i bez znalosti ulice. To dnes v Nominatimu
nelze. Pak je tu další věc, která souvisí jen okrajově, ale je to věc, která
se mi honí hlavou.
V OSM vůbec nejsou městské části (nebo jsem slepý). Nemělo by se uvažovat o
zavedení městských částí? (Praha 1, Praha 2 atd.)
Zpět k původnímu tématu - srovnat to s RUIAN momentálně nezvládnu, protože
nejsem schopen importovat RUIAN do Postgisu. Skončím na hlášce:
Exception in thread "main" org.postgresql.util.PSQLException: ERROR:
geometry contains non-closed rings
Hint: "... -1058212.19,-746762.81 -1058118.93))" <-- parse error at
position
3490 within geometry
a přitom mám switch --ignore-invalid-gml, takže by to mělo běžet dál. Verze
ruian2pgsql je aktuální kompilovaná z gitu, do spatial_ref_sys jsem také
přidal projekci 5514, takže nevím. Jdu spát _)
--
Petr
Dne St 1. ledna 2014 21:07:06, Petr Morávek [Xificurk] napsal(a):
zobrazit citaci
> Ahoj,
>
> (polo)automaticky ano, ale přijde mi jako hodně špatný nápad to dělat
> parsování is_in tagu, protože tam opravdu může být cokoliv. Správně by
> bylo matchnout jednotlivé body na údaje z RUIAN a doplnit addr:place z
> této databáze.
_______________________________________________
Talk-cz mailing list
Talk-cz na openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-cz
Dne Čt 2. ledna 2014 09:16:54, Václav Řehák napsal(a):
zobrazit citaci
> > Ona ta problematika je dost složitá, v Praze existuje mnoho různých
>
> dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy
> V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
díky za info, autor článku má můj obdiv. Tak do toho nejdu.
--
-p-
Ahoj,
Dne Čt 2. ledna 2014 09:57:05, Dalibor Jelínek napsal(a):
mojí prvotní motivací bylo a stále je mít možnost najít dům na malém sídle.
Udělat to z is_in by tomuto cíli IMO významně přispělo s rizikem, že se v
jistém množství případů dostanou do addr:place nepsrávné údaje, a to jen z
toho důvodu, že už nesprávné v OSM teď jsou, jen na jiném místě. Varianta přes
RUIAN vnáší riziko, že se stávající adresní místa chybně propojí s RUIAN a
dostanou se tam nesmysly. Další chyby se mohou převzít z RUIAN. Také je třeba
nalézt nějakou rovnováhu mezi mírou dokonalosti na jedné straně a množstvím
času a energie do toho vložené na druhé straně.
zobrazit citaci
> Sice bych take byl radsi, kdyby se to udelalo podle RUIAN, jenze to je tak
> trochu svaty gral,
> protoze se o tom hodne mluvi, ale je to myslim docela tezke realizovat.
> Pokud to nekdo dokaze, pak hura, ale myslim, ze s tim bude hodne problemu.
Pokud je RUIAN opravdu svatý, tak by se mohly všechny stávající adresní body
smazat a nahrát je znovu kompletně z RUIAN. Následně pak dělat třeba jednou za
rok aktualizaci.?
Co třeba s tímto - http://mapapi.poloha.net/#map=20/50.22517/14.42172 - jsou
tam adresy jednak jako adresní body a zároveň jsou na budovách. V okolí
Odolené Vody je toho takto povícero. To smazání a komplet nový import by to
vyřešil, jen jak je to s tou svatostí ;).
Momentálně díky Xficurkově radě importuji RUIAN do db, pak to budu studovat a
učit se s tím zacházet, takže uvidíme. jak to energeticky-časově odhadnu.
zobrazit citaci
> Zcela jiste bych ale navrhoval, aby se ta zmena delala pod nejakym novym
> vyhrazenym uctem (s inteligentnim nazvem).
Rozumím tomu tak, že pedro'_import není inteligentní název ;-)))
--
-p-
zobrazit citaci
>> > Ona ta problematika je dost složitá, v Praze existuje mnoho různých
>> dělení. Viz http://cs.wikipedia.org/wiki/%C4%8C%C3%A1sti_Prahy
>> V centru je to ještě celkem přehledné, ale takové Satalice jsou buď
>
> díky za info, autor článku má můj obdiv. Tak do toho nejdu.
*** k pochopení situace síše pomůže toto:
http://www.czso.cz/csu/rso.nsf/i/soustava_prvku
resp
http://www.czso.cz/csu/rso.nsf/5873954e2ae286eec12570f8003e7738/a1809b67f5f4560ec1256e6100495bff/Obsah/138.2F62?OpenElement&FieldElemFormat=gif
hanoj« zpět na výpis měsíce