« zpět na výpis měsíce |

[Talk-cz] Soubor cr.map pro import adres

Vlákno 24.1. - 25.1.2010, počet zpráv: 4


24.1.2010 02:35:24 (#1)
gravatar

Petr Dlouhý

<petr.dlouhy at email.cz>
607
Ahoj, vygeneroval jsem soubor cr.map [2] obsahující mapování pro program merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí některými zásadními nedostatky: 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy nutné upravit názvy podle pravopisu. 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se jméno katastrálního území liší. 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat. Doufám, že i přes problémy to bude užitečné. Jestli má někdo nápady, jak problém vyřešit, tak ať napíše. [1] http://aplikace.mvcr.cz/adresa/ulice.zip [2] http://www.flyshare.cz/stahni/45770/addr_map.tar.bz2 -- Petr Dlouhý

24.1.2010 10:14:30 (#2)
gravatar

Lukas Kabrt

<lukas at kabrt.cz>
96
zobrazit citaci
> vygeneroval jsem soubor cr.map [2] obsahující mapování pro program > merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí > některými zásadními nedostatky:
Diky, urcite to hodne pomuze. zobrazit citaci
> 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno > velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy > nutné upravit názvy podle pravopisu.
S velikosti pismen v souboru *.map si neni potreba lamat hlavu. Nazvy stejne beru z datatabaze MVCR a velikost pismen upravuju podobnym algoritmem, jaky je pouzit v pluginu czechaddress. Proc? Protoze z databaze se berou nazvy ulic a i ty jsou vsechny velkyma pismenema. Tak jsem vzal z databaze vse. Vysledek sice v nekterych pripadech neni podle pravidel ceskeho pravopisu, ale postupne na tom pracuju - kdyz narazim na nejakou chybu, tak se ji snazim do algoritmu zakomponovat. Mozna by stalo za uvahu, zda nazvy mest / mestskych casti nebrat ze souboru *.map, kde je mozne velikost pismen upravit rucne. zobrazit citaci
> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit > databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy > doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se > jméno katastrálního území liší.
Klic by mohl byt tady [1], nevim ale jak je to s licenci. Je tam prirazeni k.u. - obec, sice uz ne k.u. mestska cast, ale ve vetsine pripadu se ty nazvy podobaji, takze by to mohlo jit odhadnout. zobrazit citaci
> 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území > navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím > zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat.
Pisu si do TODO listu. Udelam to tak, ze program "zarve", ale nespadne. Osobne to stejne delam tak, ze merge pouztim pouze na par k.u. najednou, lip se tim pak pracuje v JOSM, je to prehlednejsi. [1] http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10&MENUID=10015&AKCE=DOC:10-CISE_KUAP -- Lukas

24.1.2010 12:45:45 (#3)
gravatar

Petr Dlouhý

<petr.dlouhy at email.cz>
607
Ahoj, tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu okresu a obce a podobnosti jména katastrálního území. Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy nebudeme importovat, takže to snad nevadí. Prosím zkontrolujte, jestli přiřazemí proběhlo dobře. [1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2 On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý <petr.dlouhy na email.cz> wrote: zobrazit citaci
> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit > databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy > doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se > jméno katastrálního území liší.
-- Petr Dlouhý

25.1.2010 08:35:30 (#4)
gravatar

Petr Dlouhý

<petr.dlouhy at email.cz>
607
Ahoj, tak posílám další verzi [1]. Předchozí měla špatně části jednotlivých obcí, tahle je snad lepší. Úplně dokonalá ale stále není - jednak něco ani nejde automaticky spojit (všiml jsem si například částí Liberce), a jednak tam asi pořád budou chyby. [1] http://www.flyshare.cz/stahni/45803/addr_map1.tar.bz2 On Sun, 24 Jan 2010 12:45:45 +0100, Petr Dlouhý <petr.dlouhy na email.cz> wrote: zobrazit citaci
> Ahoj, > > tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu > okresu > a obce a podobnosti jména katastrálního území. > Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic > ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak > řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy > nebudeme importovat, takže to snad nevadí. > > Prosím zkontrolujte, jestli přiřazemí proběhlo dobře. > > [1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2 > > On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý <petr.dlouhy na email.cz> > wrote: > >> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit >> databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy >> doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se >> jméno katastrálního území liší. > >
-- Petr Dlouhý

« zpět na výpis měsíce