[Talk-cz] Soubor cr.map pro import adres
Vlákno 24.1. - 25.1.2010, počet zpráv: 4
Ahoj,
vygeneroval jsem soubor cr.map [2] obsahující mapování pro program
merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí
některými zásadními nedostatky:
1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno
velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy
nutné upravit názvy podle pravopisu.
2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy
doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se
jméno katastrálního území liší.
3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území
navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím
zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat.
Doufám, že i přes problémy to bude užitečné. Jestli má někdo nápady, jak
problém vyřešit, tak ať napíše.
[1] http://aplikace.mvcr.cz/adresa/ulice.zip
[2] http://www.flyshare.cz/stahni/45770/addr_map.tar.bz2
--
Petr Dlouhý
zobrazit citaci
> vygeneroval jsem soubor cr.map [2] obsahující mapování pro program
> merge-cuzk-db. Soubor je jednoduše vygenerován z ulic MVČR [1], takže trpí
> některými zásadními nedostatky:
Diky, urcite to hodne pomuze.
zobrazit citaci
> 1) V MVČR se bohužel vykašlali na velikost písmen a napsali všechno
> velkýma. V souboru je vždy první písmeno velké a ostatní malá. Je tedy
> nutné upravit názvy podle pravopisu.
S velikosti pismen v souboru *.map si neni potreba lamat hlavu. Nazvy
stejne beru z datatabaze MVCR a velikost pismen upravuju podobnym
algoritmem, jaky je pouzit v pluginu czechaddress. Proc? Protoze z
databaze se berou nazvy ulic a i ty jsou vsechny velkyma pismenema.
Tak jsem vzal z databaze vse. Vysledek sice v nekterych pripadech neni
podle pravidel ceskeho pravopisu, ale postupne na tom pracuju - kdyz
narazim na nejakou chybu, tak se ji snazim do algoritmu zakomponovat.
Mozna by stalo za uvahu, zda nazvy mest / mestskych casti nebrat ze
souboru *.map, kde je mozne velikost pismen upravit rucne.
zobrazit citaci
> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
> databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy
> doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se
> jméno katastrálního území liší.
Klic by mohl byt tady [1], nevim ale jak je to s licenci. Je tam
prirazeni k.u. - obec, sice uz ne k.u. mestska cast, ale ve vetsine
pripadu se ty nazvy podobaji, takze by to mohlo jit odhadnout.
zobrazit citaci
> 3) Program merge-cuzk-db nezvládá pokud jsou v .map souboru nějaká území
> navíc oproti .osm souboru katastrálních území. Je tedy nutné před použitím
> zakomentovat vše kromě těch území, pro která se budou adresy přiřazovat.
Pisu si do TODO listu. Udelam to tak, ze program "zarve", ale nespadne.
Osobne to stejne delam tak, ze merge pouztim pouze na par k.u.
najednou, lip se tim pak pracuje v JOSM, je to prehlednejsi.
[1] http://www.cuzk.cz/Dokument.aspx?PRARESKOD=10&MENUID=10015&AKCE=DOC:10-CISE_KUAP
--
Lukas
Ahoj,
tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu okresu
a obce a podobnosti jména katastrálního území.
Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic
ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak
řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy
nebudeme importovat, takže to snad nevadí.
Prosím zkontrolujte, jestli přiřazemí proběhlo dobře.
[1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2
On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý <petr.dlouhy na email.cz>
wrote:
zobrazit citaci
> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
> databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy
> doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se
> jméno katastrálního území liší.
--
Petr Dlouhý
Ahoj,
tak posílám další verzi [1]. Předchozí měla špatně části jednotlivých obcí,
tahle je snad lepší. Úplně dokonalá ale stále není - jednak něco ani nejde
automaticky spojit (všiml jsem si například částí Liberce), a jednak tam
asi pořád budou chyby.
[1] http://www.flyshare.cz/stahni/45803/addr_map1.tar.bz2
On Sun, 24 Jan 2010 12:45:45 +0100, Petr Dlouhý <petr.dlouhy na email.cz>
wrote:
zobrazit citaci
> Ahoj,
>
> tak už se mi to snad podařilo spojit [1]. Dělám to na základě názvu
> okresu
> a obce a podobnosti jména katastrálního území.
> Používám k tomu seznam katastrálních území ze stránek CUZK a seznam ulic
> ze stránek MVČR, takže jestli si někdo myslí, že je to problém, tak
> řekněte. Osobně si myslím, že data z CUZK pouze použijeme a do mapy
> nebudeme importovat, takže to snad nevadí.
>
> Prosím zkontrolujte, jestli přiřazemí proběhlo dobře.
>
> [1] http://www.flyshare.cz/stahni/45772/addr_map.tar.bz2
>
> On Sun, 24 Jan 2010 02:35:24 +0100, Petr Dlouhý <petr.dlouhy na email.cz>
> wrote:
>
>> 2) Nepodařilo se mi najít žádný klíč, podle kterého by bylo možné spojit
>> databáze MVČR a CUZK. Do parametru "name" elementu "territory" jsem tedy
>> doplnil jméno oblasti. Je tedy nutné doplnit tam "u něčeho", pokud se
>> jméno katastrálního území liší.
>
>
--
Petr Dlouhý« zpět na výpis měsíce