[Talk-cz] Stavim, stavis,stavime - aneb budovy a adresni body z CUZK
Vlákno 28.6. - 26.9.2009, počet zpráv: 20
Zdravim,
behem poslednich par dnu jsem si trochu hral s
automatickym/poloautomatckym importem informaci z katastralni mapy.
Co se mi podarilo:
--------------------------
Stazeni dlazdic
Nalezeni definicnich bodu budov (v mape oznaceny cervenou teckou a
popisem - c.p., c.e, bez c.p./c.e.)
Automaticke rozpoznani c.p./c.e
Prozatimni export do OSM (pouze node v miste definichiho bodu a tag
'note' s rozpoznanym textem - hlavne pro kontrolu)
Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji
tak temer stoprocentni.
Program je mozne stahnou a vyzkouset z adresy
http://lkabrt.aspone.cz/osm/cuzk-import.zip
Program pro svuj beh potrebuje .NET 3.5, pro rozpoznavani textu je
pouzita knihovna tesseract. Je to testovaci verze, zdrojaky vypadaji
hrozne a rychlost je pro seriozni praci nepouzitelna, tak me prosim
nekamenujte :-)
Ve slusnem stadiu rozpracovani mam rozpoznani obrysu budov.
Co je potraba dodelat:
--------------------------------
Zvysit rychlost - na tom se pracuje
Aby bylo mozne nejak automaticky/poloautomaticky importovat adresni
body tak je jim potreba priradit mesto/obec/mestskou cast ve ktere se
nachazi a podle toho priradit nazev ulice a dalsi informace napr.
UIR-ADR.
Pokud jsem spravne pochopil situaci z prispevku v talk-cz, tak tohle
je trochu problem. Z prehledove mapy CUZK se daji zjistit nazvy
katastralnich uzemi, ale nevim jestli jejich hranice koresponduji s
hranicemi obci. Hanoj tady nedavno psal, ze vektorizoval prehledove
mapy z CUZK, ale bez nazvu katastralnich uzemi. Pokud by hranice
katastralnich uzemi korespondovali s hranicemi obci/mestskych casti,
ve kterych jsou c.p. jedinecna, tak by to slo vyuzit, i kdyby se nazvy
katastralnich uzemi meli zadavat rucne - stejne nepredpokladam, ze by
se importovala traba cela republika.
Pro jednotlve adresni body jsem schopny rozpoznat i obrys budovy, ale
to musim jeste doladit. Mam mnozinu definicnich bodu budov a mapu
vektorizovanou na mnozinu vektoru (vektory na sebe navazuji) Pro kazdy
z bodu se snazim najit polygon jehoz hranice jsou tvoreny temito
vektory. Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale
pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj
algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej
pokracuju dal a snazim se uzavrit cyklus, heuristika je takova, ze
vzdy kdyz se da pokracovat vice smery, tak vybiram uzel, ktery je
blize def, body budovy. Kdyz uzavru polygon, tak zkontroluju jestli je
def. bod budovy opravdu uvnitr, jinak hledam dal / z jineho bodu)
Jde o to, zda budovy do mapy pridavat, pripadne jak detailne - aby se
velikost mapy nekolikanaspobne nezvysila. Na jednom miste jsem budovy
kreslil rucne, docela podrobne a mapa hned vypada o tridu lip
(http://www.openstreetmap.org/?lat=50.49736&lon=16.10043&zoom=16&layers=B000FTF).
Koukal jsem, ze treba v Praze jsou budovy take kresleny docela
podrobne, takze ja bych byl pro.
Rad si prectu vsechny napady, rady a pripominky.
--
Lukas Kabrt
zobrazit citaci
>
> Rad si prectu vsechny napady, rady a pripominky.
Jak se to ovládá ? Kde je dokumentace ?
zobrazit citaci
>
> --
> Lukas Kabrt
>
zobrazit citaci
> Jak se to ovládá ? Kde je dokumentace ?
Je to jenom testovaci verze, takze dokumentace neni.
Stazeni mapy z WMS CUZK:
tile-downloader.exe [north] [west] [south] [east] [path]
north, west, south, east definuje hranice oblasti, ktera se ma
stahnout, path cesta kam se maji dlazdoce ulozit. Ukazka pouziti je v
souboru "downloader-sample.bat" Pozor - nezadavat prilis velkou
oblast, velikost jedne dlazdice je 0.005° a jeji rozliseni
4000x4000px. Pro kazdou dlazdici vyvvori 3 soubory - mapa s
definicnimi body budov, katastralni mapa a soubor info.
Rozpoznani definicnich bodu budov:
tile-processor.exe [tile-path]
tile-path cesta a nazev dlazdice mapy (pokud ma dlazdice nazev 'test'
- soubory test-kn.png, test-budovy.png a test.info a je ulozena v
adresari data, tak se zada 'data/test'). Priklad je v souboru
processor-sample.bat
Vystupem programu je soubor address.osm, ktery lze otevrit v JOSM.
Ulozeny tam jsou pouze definicni body budov, ne jejich obrysy jejich
rozpoznani je jeste pomalejsi, tak jsem to tam zatim nedaval.
--
Lukas Kabrt
Zdravim,
potiz adresnich bodu muze byt ta, ze adresni bod je mimo budovu (jelikoz
obkresluju ruco, tak sem takovych uz videl desitky)
a pak automat nakresli jako budovu napr zahradu. Dal muze byt budova
poskladana z vice polygonu
(nebo je to vice budov tesne u sebe), ale adresni bod je jen v jednom.
=> videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim
schvalenim, ale na fullauto import asi ne.
Lukas Kabrt napsal(a):
zobrazit citaci
> Zdravim,
>
> ...
> Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale
> pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj
> algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej
> pokracuju dal a snazim se uzavrit cyklus, heuristika je takova, ze
> vzdy kdyz se da pokracovat vice smery, tak vybiram uzel, ktery je
> blize def, body budovy. Kdyz uzavru polygon, tak zkontroluju jestli je
> def. bod budovy opravdu uvnitr, jinak hledam dal / z jineho bodu)
>
>
> ...
>
> --
> Lukas Kabrt
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
Lukas Kabrt píše v Ne 28. 06. 2009 v 20:56 +0200:
zobrazit citaci
> Zdravim,
>
> behem poslednich par dnu jsem si trochu hral s
> automatickym/poloautomatckym importem informaci z katastralni mapy.
Když jsem včera obkresloval domy a viděl jsem ty digitálně generované
tečky, myslel jsem na to, že by něco podobného šlo udělat.
zobrazit citaci
> Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji
> tak temer stoprocentni.
Pokud se překrývají, stačí vyžádat detailnější mapu.
zobrazit citaci
> Pro jednotlve adresni body jsem schopny rozpoznat i obrys budovy,
To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je
označena zastavěná plocha, která nemá přiřazen adresní bod.
zobrazit citaci
> ale
> to musim jeste doladit. Mam mnozinu definicnich bodu budov a mapu
> vektorizovanou na mnozinu vektoru (vektory na sebe navazuji) Pro kazdy
> z bodu se snazim najit polygon jehoz hranice jsou tvoreny temito
> vektory. Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale
> pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj
> algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej
> pokracuju dal a snazim se uzavrit cyklus,
Na to lze snadno nalézt protipříklad: dlouhá budova, před ní dvě malé
boudy. Ale pokud provede kontrola a bude se hledat dál, nemusí to vadit.
Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze
vytrasovat přiléhající čáru.
________________________________________________________________________
Stanislav Brabec, ICQ 116020046, xmpp:utx na jabber.cz
Ahoj,
On Sun, Jun 28, 2009 at 08:56:01PM +0200, Lukas Kabrt wrote:
zobrazit citaci
> Zdravim,
>
> behem poslednich par dnu jsem si trochu hral s
> automatickym/poloautomatckym importem informaci z katastralni mapy.
rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni katastralni
mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
--
S pozdravem/Best regards
Bc. Ondrej Novy
Email: onovy na nomi.cz
Jabber: onovy na njs.netlab.cz
ICQ: 115-674-713
Tel/Cell: +420 777 963 207
On Mon, 29 Jun 2009 00:02:26 +0200, Ondrej Novy <onovy na nomi.cz> wrote:
1) Jen v některých místech, což se dá snadno odhalit pomocí ortofoto (nebo
se to pozná podle vzhledu té katastrální mapy).
2) Samozřejmě to není tak, že by budova byla místo 10m široká 60m. Prostě
bude spíš jen šouplá, což jde jednoduše opravit (nebo to ani tak moc
nevadí, pokud je šouplé všechno.
Tím chci říct, že to většinou není velký problém.
zobrazit citaci
>
> rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni
> katastralni
> mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi
--
Petr Dlouhý
Dne 29.6.2009 0:02, Ondrej Novy napsal(a):
zobrazit citaci
> rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni
> katastralni
> mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
>
>
To máš ale na mysli digitalizované kreslené (analogové) mapy, nikoliv
digitální katastr ne? :-)
Viz. http://www.vugtk.cz/gis/info/digitalizace.html
http://www.cuzk.cz/Dokument.aspx?PRARESKOD=998&MENUID=0&AKCE=DOC:10-DIGITALIZACE_KATASTRMAP
MK
I v tom digitalnim katastru jsou pekne kravoviny, napr cesty ktere vedou
desitky let jinudy, budovy, ktere uz nestoji ...
Martin Kokeš napsal(a):
zobrazit citaci
> Dne 29.6.2009 0:02, Ondrej Novy napsal(a):
>
>> rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni
>> katastralni
>> mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
>>
>>
>>
> To máš ale na mysli digitalizované kreslené (analogové) mapy, nikoliv
> digitální katastr ne? :-)
>
> Viz. http://www.vugtk.cz/gis/info/digitalizace.html
> http://www.cuzk.cz/Dokument.aspx?PRARESKOD=998&MENUID=0&AKCE=DOC:10-DIGITALIZACE_KATASTRMAP
>
> MK
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
Jenže v katastru jsou zaneseny pozemky + dělení podle majitele. To, že
cesta vede jinudy není chyba katastrálky, ale spíš že to zatím nikomu
nevadilo.
J&D
Dne Mon, 29 Jun 2009 01:50:46 +0200 jzvc <jzvc na tpfree.fdns.net> napsal/-a:
zobrazit citaci
> I v tom digitalnim katastru jsou pekne kravoviny, napr cesty ktere vedou
> desitky let jinudy, budovy, ktere uz nestoji ...
>
>
>
> Martin Kokeš napsal(a):
>> Dne 29.6.2009 0:02, Ondrej Novy napsal(a):
>>
>>> rad bych tez pripomel (pokud se to nezmenilo) ze presnost digialni
>>> katastralni
>>> mapy je v nekterych mistech i 50m, coz na obrys budov neni nejlepsi :)
>>>
>>>
>>>
>> To máš ale na mysli digitalizované kreslené (analogové) mapy, nikoliv
>> digitální katastr ne? :-)
>>
>> Viz. http://www.vugtk.cz/gis/info/digitalizace.html
>> http://www.cuzk.cz/Dokument.aspx?PRARESKOD=998&MENUID=0&AKCE=DOC:10-DIGITALIZACE_KATASTRMAP
>>
>> MK
>>
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-cz
>>
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
--
Tato zpráva byla vytvořena převratným poštovním klientem Opery:
http://www.opera.com/mail/
Stanislav Brabec:
zobrazit citaci
> To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je
> označena zastavěná plocha, která nemá přiřazen adresní bod.
Existuje mnoho budov, ktere nemaji prirazen adresni bod ale na
katastralni mape je zobrazen definicni bod budovy a u nej uvedeno "bez
c.p./c.e.". Velka vyhoda rozpoznavani pouze def. bodu budov je v tom,
ze jdou stahnout z WMS jako samostatna vrstva. Asi by slo hledat i
budovy podle te tecky primo v katastralni mape, ale netroufnu si
odhadnout, jaka bude uspesnost. Pokud budu mit cas tak vyzkousim.
zobrazit citaci
>Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze
>vytrasovat přiléhající čáru.
To je zajimavy napad. Diky, taky vyzkousim.
jzvc:
zobrazit citaci
> videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim
> schvalenim, ale na fullauto import asi ne.
nejakou miru rucni kontroly predpokladam uz jenom proto, ze OCR neni
uplne stoprocentni. S automatickym importem obrysu budov bych byl
opatrny, pokud ale jde o adresni body, tak tam by to treba slo i
automaticky. V oblastech kde na mape zadne nejsou, je IMHO lepsi je
mit je o kousek blbe, nez vubec.
Jesli provadet import pouze oblasti, ktere jsou v digitalnim katastru,
nebo i oblasti, pro ktere jsou k dispozici jenom skenovane katastralni
mapy, je otazkou.
Ahoj,
Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
zobrazit citaci
> >Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze
> >vytrasovat přiléhající čáru.
>
> To je zajimavy napad. Diky, taky vyzkousim.
na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat
na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat
do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými
rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí.
Radek
Dobrý den,
Lukas Kabrt píše v Ne 28. 06. 2009 v 20:56 +0200:
zobrazit citaci
> Zdravim,
>
> behem poslednich par dnu jsem si trochu hral s
> automatickym/poloautomatckym importem informaci z katastralni mapy.
skvěle!
zobrazit citaci
> Prozatimni export do OSM (pouze node v miste definichiho bodu a tag
> 'note' s rozpoznanym textem - hlavne pro kontrolu)
>
> Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji
> tak temer stoprocentni.
Automatického importu bych se bál. Vím o budovách, které v KM mají
popisek "bez označení", ale ve skutečnosti na nich visí tabule s číslem
popisným. V tomto případě vím určitě, že KM obsahuje chybu.
Dále je nemalé množství budov, u kterých číslo popisné v mapě neodpovídá
číslu popisnému v databázi MVČR. Zatím nevím, zda je chyba v mapě či
databázi. Zkouším však srovnat databázi MVČR s informacemi z České pošty
a dám vědět hned jak se dozvím výsledek.
Co tedy importovat tak, že data z OCR přilepíme k databázi adres MVČR a
import budeme dělat postupně za pomocí CzechAddress? Je to způsob, jak
využít OCR, zajistit ruční kontrolu dat a tuto kontrolu navíc
distribuovat mezi více lidí. Pomohlo by to řešit i ten problém, že
pozice adresního bodu v KM není vždy u vchodu do budovy...
S pozdravem,
Radek Černoch
jzvc píše v Ne 28. 06. 2009 v 21:40 +0200:
zobrazit citaci
> Zdravim,
>
> potiz adresnich bodu muze byt ta, ze adresni bod je mimo budovu (jelikoz
> obkresluju ruco, tak sem takovych uz videl desitky)
> a pak automat nakresli jako budovu napr zahradu. Dal muze byt budova
> poskladana z vice polygonu
> (nebo je to vice budov tesne u sebe), ale adresni bod je jen v jednom.
>
> => videl bych to OK, pokud by slo o navrh ve vybrane oblasi s rucnim
> schvalenim, ale na fullauto import asi ne.
Úplně souhlasím. Dokáži si představit takovou funkci, kdy po kliknutí na
uzavřenou oblast v katastrální mapě se automaticky vytvoří obrys budovy.
Fungovalo by to podobně rychle jako se dnes vytváří adresní body v
CzechAddress.
Nemám teď příliš času; pokud by to však bylo aktuální, s vytvořením
nějakého takového pluginu rád pomůžu.
zobrazit citaci
> Lukas Kabrt napsal(a):
> > Zdravim,
> >
> > ...
> > Mam jeden primtivni zpusob, jak obalovy polygon ziskat, ale
> > pokud mi poradite nejaky lepsi algoritmus, tak budu rad. (Muj
> > algoritmus: vyberu vektor zacinajici nejbliz definicnimu bodu a z nej
> > pokracuju dal a snazim se uzavrit cyklus, heuristika je takova, ze
> > vzdy kdyz se da pokracovat vice smery, tak vybiram uzel, ktery je
> > blize def, body budovy. Kdyz uzavru polygon, tak zkontroluju jestli je
> > def. bod budovy opravdu uvnitr, jinak hledam dal / z jineho bodu)
S pozdravem,
Radek Černoch
Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
zobrazit citaci
> Stanislav Brabec:
>
> > To by ještě chtělo rozpoznávat samostatnou bílou tečku, kterou je
> > označena zastavěná plocha, která nemá přiřazen adresní bod.
>
> Existuje mnoho budov, ktere nemaji prirazen adresni bod ale na
> katastralni mape je zobrazen definicni bod budovy a u nej uvedeno "bez
> c.p./c.e.". Velka vyhoda rozpoznavani pouze def. bodu budov je v tom,
> ze jdou stahnout z WMS jako samostatna vrstva. Asi by slo hledat i
> budovy podle te tecky primo v katastralni mape, ale netroufnu si
> odhadnout, jaka bude uspesnost. Pokud budu mit cas tak vyzkousim.
Měl jsem na mysli polygony, které nemají ani tento definiční bod. Jde
o místa, kde se jedno č. p. skládá v KN mapě z více přiléhajících
polygonů, nebo když se jedno č. p. skládá ze dvou oddělených budov.
Aby bylo jasné, které polygony znamenají zastavěnou plochu, bývá
uprostřed polygonu namalovaná tečka.
Je mi jasné, že rozpoznávání tečky v kreslené mapě bude
problematičtější, ale bez ní bude v mnoha místech zakreslena jen část
budov.
I kdyby to nefungovalo úplně dokonale, bylo by to užitečné. Ostatně ani
sama mapa v KN občas neodpovídá skutečnosti.
________________________________________________________________________
Stanislav Brabec
http://www.penguin.cz/~utx
Radomir Cernoch píše v Po 29. 06. 2009 v 10:50 +0200:
zobrazit citaci
> Ahoj,
>
> Lukas Kabrt píše v Po 29. 06. 2009 v 09:57 +0200:
> > >Jedna z možností je použít bitmapový algoritmus typu "fill", a pak pouze
> > >vytrasovat přiléhající čáru.
> >
> > To je zajimavy napad. Diky, taky vyzkousim.
>
> na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat
> na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat
> do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými
> rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí.
On třeba existuje potrace[1] nebo autotrace[2]. potrace je stále
vyvíjen, dává slušné výsledky a autor je komunikativní. Myslím, že by
byl ochoten poradit s případnou úpravou algoritmu pro tento účel.
[1] http://potrace.sourceforge.net/
[2] http://autotrace.sourceforge.net/
________________________________________________________________________
Stanislav Brabec
http://www.penguin.cz/~utx
zobrazit citaci
>> na vektorizaci je prý relativně rychlý algoritmus "bleskově vektorizovat
>> na mnoho krátkých úseček" a následně zkoušet 2 sousední úsečky spojovat
>> do delších. Je však otázkou, jak si takový algoritmus poradí s ostrými
>> rohy budov -- znám jej jen z aplikace, ve které zkosené rohy nevadí.
Podobny algoritmus pouzivam pro vektorizaci a myslim ze funguje vcelku
uspokojive. Vysldny vektor se vetsinou vejde do puvodni cary, ktera je
tlusta nekolik px.
zobrazit citaci
> On třeba existuje potrace[1] nebo autotrace[2]. potrace je stále
> vyvíjen, dává slušné výsledky a autor je komunikativní. Myslím, že by
> byl ochoten poradit s případnou úpravou algoritmu pro tento účel.
Z potrace by se mozna dalo pouzit nektere algoritmy, ale vystup
samotneho potrace mi prilis pouzitelny neprijde.
Potrace byl pouzit na vektorizaci UHUL lesu... Pouziva se velmi hezky a
celou CR (100 000 * 70 000 pixelu nebo tak nejak) vypocital za par
minut. Pouzival jsem ho jako knihovnu.
T
Lukas Kabrt napsal(a):
zobrazit citaci
> Z potrace by se mozna dalo pouzit nektere algoritmy, ale vystup
> samotneho potrace mi prilis pouzitelny neprijde.
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
2009/6/29 Tomas Kolda <kolda na web2net.cz>:
zobrazit citaci
> Potrace byl pouzit na vektorizaci UHUL lesu... Pouziva se velmi hezky a
> celou CR (100 000 * 70 000 pixelu nebo tak nejak) vypocital za par
> minut. Pouzival jsem ho jako knihovnu.
Aha, tak to vypada, ze bych si mel rozsirit obzory a dat mu jeste sanci :-)
Ahoj!
zobrazit citaci
> > Prozatimni export do OSM (pouze node v miste definichiho bodu a tag
> > 'note' s rozpoznanym textem - hlavne pro kontrolu)
> >
> > Presnost rozpoznavani je hodne slusna - pokud se texty neprekryvaji
> > tak temer stoprocentni.
>
> Automatick??ho importu bych se b??l. V??m o budov??ch, kter?? v KM maj??
> popisek "bez ozna??en??", ale ve skute??nosti na nich vis?? tabule s ????slem
> popisn??m. V tomto p????pad?? v??m ur??it??, ??e KM obsahuje chybu.
Coz myslim neni duvod se automatickeho importu bat...
...lidi to stejne delaj podle KM; kdyz bude v KM chyba, tak ji stejne
zkopirujou, jen jim to da vic prace.
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html« zpět na výpis měsíce