[Talk-cz] import mest a vesnic z wikipedie?
Vlákno 12.10.2007 - 17.2.2008, počet zpráv: 27
Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
mest a vesnic. Co jsem koukal treba na
http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou
(muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly
pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam.
Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim
jak moc jsou tyhle dve licence kompatibilni a jestli by tohle provest
(pravne) slo - technicky by to bylo relativne jednoduche. GFDL chce
odkaz na zdroj (dal by se do tagu) a autory (ty by se taky asi daly
nejak vytahat, podle licence staci pet hlavnich, takze to by se nejak
strojove odhadlo a pocet peti udrzi delku tagu v rozumnych mezich :)
Martin Petricek
Ahoj!
zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
> mest a vesnic. Co jsem koukal treba na
> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
> mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
> asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
Kolik mest/vesnic tam je? Mozna lepsi zdroj je:
http://earth-info.nga.mil/gns/html/
http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
...ale nemaj "zrovna 2x presny" souradnice :-(.
Ale pouzitelny data by se meli najit na
http://www.geonames.org/export/ ...
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Ahoj!
zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
> mest a vesnic. Co jsem koukal treba na
> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
Mozna mam lepsi plan.... teda jestli nejsou souradnice fakt u _vsech_
mest ... vzit z
http://cs.wikipedia.org/wiki/Seznam_%C4%8Desk%C3%BDch_m%C4%9Bst
...seznam mest, a z http://earth-info.nga.mil/gns/html/ vzit polohy.
Cemu se jeste rika "city"..? Tabor je 30-te nejvetsi, co useknout to
tam?
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Ahoj!
zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
> mest a vesnic. Co jsem koukal treba na
> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
> mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
> asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
Menim nazor, ten seznam vypada _opravdu_ dobre.
zobrazit citaci
> ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou
> (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly
> pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam.
> Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim
> jak moc jsou tyhle dve licence kompatibilni a jestli by tohle
> provest
Myslim ze kdyz vezmem jmena vesnic + polohy, bude to v pohode. Jinak
to vypada ze wikipedia to z neceho importovala... mozna by bylo jeste
lepsi pouzit puvodni zdroj.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
zobrazit citaci
> Kolik mest/vesnic tam je? Mozna lepsi zdroj je:
Co jsem koukal tak obce a mesta tam jsou vsechny.
zobrazit citaci
> http://earth-info.nga.mil/gns/html/
> http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
>
> ...ale nemaj "zrovna 2x presny" souradnice :-(.
Co to znamena "zrovna 2x presny"?
Odchylka 50 m u nezvu vesnic (i ty nejprtavejsi zapadakovy budou mit
vic nez 50 m velikost) by byla ok ... 1 km uz asi ne :)
zobrazit citaci
> Ale pouzitelny data by se meli najit na
> http://www.geonames.org/export/ ...
Jo, to by mohlo jit pouzit, cc-by je vhodna licence, vypada to ze tam
je toho dost (19000 radek pro CR)
I kdyz zase by se z toho musel asi vyfiltrovat odpad (treba pomoci
toho z nga.mil :), zahlid jsem tam i ptakoviny typu "Autolakovna
Simanek" a jako na potvoru oznaceny jako sidlo. (navic tam neni
rozliseny mesto/obec/vesnice ... pak neni jasny jestli dat town, city,
village nebo hamlet)
V nga.mil jsem tohle taky nenasel .. ale pokud mam souradnice, tak uz
staci jen ziskat seznam mest a vesnic (nejlepe prave roztrideny na
mesta a vesnice :) a pak by to uz slo :)
Jinak jsou tam i treba potoky a jiny jmena, ty by mozna sly pouzit
pozdeji (mohl bych je treba importovat jenom s name a dat tam note
typu "FIXME doplnit typ nebo priradit k existujici veci" ... ma tohle
smysl, nebo je to zbytecny?)
Asi bych zkusil dat ty data z geonames, pomoci dat z nga.mil odstranit
ptakoviny a co zbyde a nebude dosud naimportovany tak naimportovat.
Jediny problem je zjistit typ sidla. Pokud bych ho nezjistil, tak bych
tam moh jeste nacpat vsechno jako place=village a nechat lidi at to na
mesta povysi ...
BTW kde je v CR cca rozhrani mezi town a city?
Martin Petricek
Ahoj!
zobrazit citaci
> > Kolik mest/vesnic tam je? Mozna lepsi zdroj je:
>
> Co jsem koukal tak obce a mesta tam jsou vsechny.
>
> > http://earth-info.nga.mil/gns/html/
> > http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
> >
> > ...ale nemaj "zrovna 2x presny" souradnice :-(.
>
> Co to znamena "zrovna 2x presny"?
> Odchylka 50 m u nezvu vesnic (i ty nejprtavejsi zapadakovy budou mit
> vic nez 50 m velikost) by byla ok ... 1 km uz asi ne :)
No, on je to spis ten jeden km :-(.
zobrazit citaci
> > Ale pouzitelny data by se meli najit na
> > http://www.geonames.org/export/ ...
>
> Jo, to by mohlo jit pouzit, cc-by je vhodna licence, vypada to ze tam
> je toho dost (19000 radek pro CR)
> I kdyz zase by se z toho musel asi vyfiltrovat odpad (treba pomoci
> toho z nga.mil :), zahlid jsem tam i ptakoviny typu "Autolakovna
> Simanek" a jako na potvoru oznaceny jako sidlo. (navic tam neni
> rozliseny mesto/obec/vesnice ... pak neni jasny jestli dat town, city,
> village nebo hamlet)
> V nga.mil jsem tohle taky nenasel .. ale pokud mam souradnice, tak uz
> staci jen ziskat seznam mest a vesnic (nejlepe prave roztrideny na
> mesta a vesnice :) a pak by to uz slo :)
Seznam mest je tady:
http://cs.wikipedia.org/wiki/Seznam_%C4%8Desk%C3%BDch_m%C4%9Bst_podle_velikosti
zobrazit citaci
> Jediny problem je zjistit typ sidla. Pokud bych ho nezjistil, tak bych
> tam moh jeste nacpat vsechno jako place=village a nechat lidi at to na
> mesta povysi ...
>
> BTW kde je v CR cca rozhrani mezi town a city?
100000 obyvatel?
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
On 10/13/07, Pavel Machek <pavel na ucw.cz> wrote:
zobrazit citaci
> Ahoj!
>
> > Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
> > mest a vesnic. Co jsem koukal treba na
> > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
> > mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
> > asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
>
> Menim nazor, ten seznam vypada _opravdu_ dobre.
>
> > ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou
> > (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly
> > pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam.
> > Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim
> > jak moc jsou tyhle dve licence kompatibilni a jestli by tohle
> > provest
>
> Myslim ze kdyz vezmem jmena vesnic + polohy, bude to v pohode. Jinak
> to vypada ze wikipedia to z neceho importovala... mozna by bylo jeste
> lepsi pouzit puvodni zdroj.
Jo, ale najit ho tam asi nebude trivialni. Zkousel jsem neco
vytrasovat a dosel jsem k tomuhle:
http://cs.wikipedia.org/w/index.php?title=Wikipedista_diskuse:Pastorius&oldid=652186
Souřadnice se získávají těžce. Mám v databázi seznam všech částí obce
a jejich sořadnice v nějakém podivuhodném systému. Ten převádím na
souřadnice a souřadnici obce počítám jako průměr všech souřadnic všech
částí obce. U velkých měst to není problém. U malých obcí ano. Pokud
má obec dvě části, z nichž jenom jedna je zastavěná a druhá část je
velké pole nebo les, trefím se do lesa. Na mapě to nevypadá úplně
hezky, neboť moje šipka pak ukazuje opticky mimo zastavěnou část. I
když je to třeba jen 200 m vedle, není to úplně ono. Bohužel jsem
nenašel žádný rozumný seznam se souřadnicemi. --Pastorius 07:31, 31.
7. 2006 (UTC)
Tak nevim, mozna ty souradnice z wiki asi taky nebudou moc presny
(abych se priznal, tak jejich presnost jsem netestoval). Co ty
geonames, tam jen to lepsi s presnosti?
Asi bych to videl na seznam mest z wiki a souradnice z geonames.
Co se tyce city vs town, tak jak mi nekdo kdysi osvetlil, "city have a
cathedral, while town does not", cili neni dulezity pocet obyvatel,
ale pritomnost katedraly. Jelikoz to by se zjistovalo blbe, tak tu
hranici asi hodim nekde mezi 50-100 tisicema ...
Martin Petricek
zobrazit citaci
>> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
>> mest a vesnic. Co jsem koukal treba na
>> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
>> mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
>> asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
*** Ono je to presny a docela uplny protoze wikipedie prevzala data CSU
ciselnik UIR-ZSJ o obcich (respektive jeho webove realizace
http://www.isu.cz/uir/scripts/index.asp), souradnice prevedla z JTSK.
*** Vyjadreni CSU k OSM se mi ale opet zadne nepodarilo ziskat...
zobrazit citaci
> http://earth-info.nga.mil/gns/html/
> http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
>
> Ale pouzitelny data by se meli najit na
> http://www.geonames.org/export/ ...
>
*** tyhle dva datovy zdroje se mnoho nelisi, obsahuji spoustu POI,
fantasmagorie, souradnice jsou hodne generalizovany... ale lepsi jak nic.
hanoj
zobrazit citaci
> Souřadnice se získávají těžce. Mám v databázi seznam všech částí obce
> a jejich sořadnice v nějakém podivuhodném systému. Ten převádím na
> souřadnice a souřadnici obce počítám jako průměr všech souřadnic
> všech částí obce. U velkých měst to není problém. U malých obcí ano.
> Pokud má obec dvě části, z nichž jenom jedna je zastavěná a druhá
> část je velké pole nebo les, trefím se do lesa. Na mapě to nevypadá
> úplně hezky, neboť moje šipka pak ukazuje opticky mimo zastavěnou
> část. I když je to třeba jen 200 m vedle, není to úplně ono. Bohužel
> jsem nenašel žádný rozumný seznam se souřadnicemi. --Pastorius 07:31,
> 31. 7. 2006 (UTC)
>
> Tak nevim, mozna ty souradnice z wiki asi taky nebudou moc presny
> (abych se priznal, tak jejich presnost jsem netestoval). Co ty
> geonames, tam jen to lepsi s presnosti?
*** geonames je urcite horsi.
*** UIR-ZSJ (=wikipedie) pouziva zrejme pro bod centroid spravniho uzemi
obce, coz vam dost casto vyjde mimo zastavene uzemi. Taktez je treba
brat v potaz ze obec je SPRAVNI jednotka. Pokud jedu pres "Ceskou mez",
je to MISTNI CAST, ale patri do OBCE "Sazava"...
zobrazit citaci
> Co se tyce city vs town, tak jak mi nekdo kdysi osvetlil, "city have
> a cathedral, while town does not", cili neni dulezity pocet obyvatel,
> ale pritomnost katedraly. Jelikoz to by se zjistovalo blbe, tak tu
> hranici asi hodim nekde mezi 50-100 tisicema ...
*** Na wikiOSM je (nekde), ze mesto je podle poctu osob (coz mame o
kazde obci wikipedii), nebo podle mistnich zvyklosti.
ha
hanoj
AhoJ!
zobrazit citaci
> > http://earth-info.nga.mil/gns/html/
> > http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
> >
> > Ale pouzitelny data by se meli najit na
> > http://www.geonames.org/export/ ...
> >
> *** tyhle dva datovy zdroje se mnoho nelisi, obsahuji spoustu POI,
> fantasmagorie, souradnice jsou hodne generalizovany... ale lepsi jak nic.
Kupodivu to nejsou fantasmagorie, ale ruzny historicky podivnosti... a
da se to vyfiltrovat podle nekterejch ze sloupcu aby historicky veci
zmizely. Zatim mam tohle:
#!/bin/bash
# http://earth-info.nga.mil/gns/html/
# description: http://earth-info.nga.mil/gns/html/gis_countryfiles.htm
cat ez.txt | tr ' ' '|' > ez_pipe.txt
zobrazit citaci
> mesta_pos.txt
cat mesta.txt | cstocs il2 ascii | while true; do
IFS="|" read NAME || exit
grep -i "|$NAME|" ez_pipe.txt >> mesta_pos.txt
done
echo "<?xml version='1.0' encoding='UTF-8'?>"
echo "<osm version='0.5' generator='shpupload'>"
NODEID=-1
cat mesta_pos.txt | while true; do
IFS='|' read RC UFI UNI LAT LONG DMS_LAT DMS_LONG MGRS JOG FC DSG PC CC1 ADM1 ADM2 POP ELEV CC2 NT LC SHORT_FORM GENERIC SORT_NAME FULL_NAME FULL_NAME_ND MODIFY_DATE || exit
if [ ".$DSG" != ".PPL" ]; then
continue
fi
if [ ".$NT" != ".N" ]; then
continue
fi
# if [ ".$PC" = "." ]; then
# continue
# fi
# echo $LAT $LONG $FULL_NAME $PC $CC1 $DSG
echo "<node id=\"$NODEID\" lon=\"$LONG\" lat=\"$LAT\">"
NODEID=$[$NODEID-1]
echo "<tag k=\"created_by\" v=\"readgov\"/>"
echo "<tag k=\"name\" v=\"$FULL_NAME\"/>"
# echo "<tag k=\"note\" v=\"$FC_$DSG_$NT\"/>"
echo "<tag k=\"place\" v=\"town\"/>"
echo "<tag k=\"source\" v=\"http://earth-info.nga.mil/gns/html/\"/>"
echo "</node>"
# | cstocs utf8 ascii
done
echo "</osm>"
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Ahoj!
zobrazit citaci
> Asi bych to videl na seznam mest z wiki a souradnice z geonames.
A potom rucne prebrat -- vyhazet duplikaty a nesmysly... jo jo, pomalu
zacnu od nejvetsich mest...
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Ahoj!
No, nejak jsem probral mesta nad 10000 obyvatel podle wikipedie a toho
gov.mil zdroje, ale nefungovalo to zrovna dvakrat dobre. V gov.mil je
spousta duplicit, a zjistovani "jestlipak uz to tam je" taky neni
zrovna trivialni -- delal jsem to by oko. (Snad mi toho moc neuteklo).
V par pripadech jsem vyrobil duplicitu -- kdyz v osm byla verse s
blbou diakritikou -- myslim ze je jednodussi smazat spatnou versi nez
se to snazit opravovat.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
On Thu 2007-10-25 17:14:25, BH wrote:
zobrazit citaci
> Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano.
Dik! ...vypada to moc pekne...
zobrazit citaci
> I kdyz nekolik existujicich vesnic, odhadem tak stovka se
> nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od
> sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou
> spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny
> casem asi rucne, nebo z lepsiho zdroje :)
Bylo by mozny dat nekam seznam neimportovanych veci pro rucni
kontrolu?
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Ahoj,
mě přišlo, že v datasetu [1] jsou snad všechna města a vesnice(?)
Jachym
[1] http://grass.fsv.cvut.cz/wiki/index.php/Geodata
BH píše v Pá 12. 10. 2007 v 23:58 +0200:
zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy
> mest a vesnic. Co jsem koukal treba na
> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
> mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou
> asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
> ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou
> (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly
> pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam.
> Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim
> jak moc jsou tyhle dve licence kompatibilni a jestli by tohle provest
> (pravne) slo - technicky by to bylo relativne jednoduche. GFDL chce
> odkaz na zdroj (dal by se do tagu) a autory (ty by se taky asi daly
> nejak vytahat, podle licence staci pet hlavnich, takze to by se nejak
> strojove odhadlo a pocet peti udrzi delku tagu v rozumnych mezich :)
>
> Martin Petricek
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
--
Jachym Cepicky
e-mail: jachym.cepicky na gmail.com
URL: http://les-ejk.cz
GPG: http://www.les-ejk.cz/pgp/jachym_cepicky-gpg.pub
------------- další část ---------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: Toto je digitálně podepsaná část zprávy
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20071015/29742ad8/attachment.sig>
Jachym Cepicky napsal(a):
zobrazit citaci
> mě přišlo, že v datasetu [1] jsou snad všechna města a vesnice(?) [1]
> http://grass.fsv.cvut.cz/wiki/index.php/Geodata
*** Jenze to je ten zamotanej retez, data tohoto datasetu bud pochazi z
1. "CZECH free map"
*** kde citace "byla pouzita free verze programu gpsmapper, cehoz
dusledkem je, ze data neni dovoleno prodavat (this map cannot be sold) i kdyby to
pred timto prevodem bylo dovoleno"
2. "CSU"
*** kde neni zadny explictini souhlas s pouzitim, nebo elementarni licence k datum...
Martin Landa mi kdysi psal, ze on (a Radim) zadne licence nikdy neresil. Pouze sebral data do jednoho datasetu a reseni licence nechal na koncoveho uzivatele.
ha
hanoj
Tak jsem zkusil neco dat dohromady, vzal jsem souradnice z wikipedie,
z gov.mil a geonames, prvni problem je, ze vsude neni vsechno (ve wiki
jsou sice vsechny obce a mesta, ale uz tam nejsou mistni casti, v
gov.mil a geonames zase nektere obce nejsou - jsou tam treba jen
jejich casti, mozna ze se ta obec nejak v minulosti slucovala a v
gov.mil a geonames jsou starsi data...)
Nakonec asi souradnice vezmu tak, ze se podivam na souradnice ve vsech
zdrojich, z nich vezmu ty dva kde je rozdil nejmensi a udelam prumer -
ten bych pak importoval (az na vyjimnky se souradnice lisi, nektere
mene, nektere vice)
Tam kde je nejmensi rozdil vetsi nez kilometr bych to odriz a ty uz
pak neimportoval (kilometrovym kriteriem neprojde asi tak 1 procento
obci z cs.wiki, dalsich cca 9 procent nema ekvivalent v geonames nebo
gov.mil, takze neni s cim srovnavat). Nebo ma nekdo lepsi napad?
Spolu s tim bych rovnou doplnil diakritiku u tech nazvu, kde neni a
kde ji lze jednoznacne doplnit (coz je skoro vsude kde neni :)
Az vyleze stredecni dump, tak to tam asi nahodim ...
Martin
Ahoj!
zobrazit citaci
> Tak jsem zkusil neco dat dohromady, vzal jsem souradnice z wikipedie,
> z gov.mil a geonames, prvni problem je, ze vsude neni vsechno (ve wiki
> jsou sice vsechny obce a mesta, ale uz tam nejsou mistni casti, v
> gov.mil a geonames zase nektere obce nejsou - jsou tam treba jen
> jejich casti, mozna ze se ta obec nejak v minulosti slucovala a v
> gov.mil a geonames jsou starsi data...)
>
> Nakonec asi souradnice vezmu tak, ze se podivam na souradnice ve vsech
> zdrojich, z nich vezmu ty dva kde je rozdil nejmensi a udelam prumer -
> ten bych pak importoval (az na vyjimnky se souradnice lisi, nektere
> mene, nektere vice)
>
> Tam kde je nejmensi rozdil vetsi nez kilometr bych to odriz a ty uz
> pak neimportoval (kilometrovym kriteriem neprojde asi tak 1 procento
> obci z cs.wiki, dalsich cca 9 procent nema ekvivalent v geonames nebo
> gov.mil, takze neni s cim srovnavat). Nebo ma nekdo lepsi napad?
>
> Spolu s tim bych rovnou doplnil diakritiku u tech nazvu, kde neni a
> kde ji lze jednoznacne doplnit (coz je skoro vsude kde neni :)
>
> Az vyleze stredecni dump, tak to tam asi nahodim ...
Nebyla by nekde demo verse? Jinak myslim ze neni potreba cekat na
stredecni dump ;-).
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
zobrazit citaci
> Nebyla by nekde demo verse? Jinak myslim ze neni potreba cekat na
> stredecni dump ;-).
Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem
to udelal posle nej.
Demo je na http://git.wz.cz/import-data.xml.bz2
Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v
pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat
:)
Nastavil jsem parametry ze importovat se maji jen obce, kde dve
nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze
zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena
nachazi do peti kilometru od danych souradnic, tak se neimportuje (to
je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a
clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se
predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne.
Ruznych lhot se stejnym nazvem bude asi taky dost :)
Nakonec v souboru skoncilo 5171 jmen.
Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul.
Martin
Tak jsem se jeste mrknul na svuj vytvor a zjistil jsem, ze jsem tam
zapomnel pridat tag source. Takze bych tam pak pridal tag:
<tag k="source" v="geonames.org,wikipedia.org,nga.mil" />
ke kazdymu nodu. Snad uz tam vic chyb nebude, :)
Martin
Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo)
jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal
podle created_by, ale myslim ze to asi nebude nutne :)
Martin
Vyborne :) Sikovnej kluk. Uz se tesim, jak to bude vypadat. A tesim se,
ze zacnu delat silnice 3. tridy a nazvy ulic...
K
BH wrote:
zobrazit citaci
> Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo)
> jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal
> podle created_by, ale myslim ze to asi nebude nutne :)
>
> Martin
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
--
Jakub Sýkora
email: kubajz na kbx.cz <')
ICQ: 68976632 ( =-
mobil: +420 777 594 201 ''
Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano.
I kdyz nekolik existujicich vesnic, odhadem tak stovka se
nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od
sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou
spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny
casem asi rucne, nebo z lepsiho zdroje :)
Martin
On 10/25/07, Jakub Sykora <kubajz na kbx.cz> wrote:
zobrazit citaci
> Vyborne :) Sikovnej kluk. Uz se tesim, jak to bude vypadat. A tesim se,
> ze zacnu delat silnice 3. tridy a nazvy ulic...
>
> K
>
> BH wrote:
> > Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo)
> > jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal
> > podle created_by, ale myslim ze to asi nebude nutne :)
> >
> > Martin
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
>
> --
> Jakub Sýkora
> email: kubajz na kbx.cz <')
> ICQ: 68976632 ( =-
> mobil: +420 777 594 201 ''
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
>
On Sat 2007-10-13 23:15:27, Pavel Machek wrote:
zobrazit citaci
> On Thu 2007-10-25 17:14:25, BH wrote:
> > Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano.
>
> Dik! ...vypada to moc pekne...
>
> > I kdyz nekolik existujicich vesnic, odhadem tak stovka se
> > nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od
> > sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou
> > spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny
> > casem asi rucne, nebo z lepsiho zdroje :)
>
> Bylo by mozny dat nekam seznam neimportovanych veci pro rucni
> kontrolu?
Jeste.... mozna by bylo dobry napsat par radek na wikiproject czechia
... http://wiki.openstreetmap.org/index.php/WikiProject_Czechia .
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
zobrazit citaci
> Bylo by mozny dat nekam seznam neimportovanych veci pro rucni
> kontrolu?
http://git.wz.cz/import-data-800+w.xml.bz2
Neimportovany veci - ty sidla, kde nepresnost souradnic je vice nez
800 metru a sidla, ke jediny souradnice jsou ty z wikipedie. Je to 831
sidel, takze kdo chce, muze to projit, zkontrolovbat a pak eventuelne
treba cast naimportovat ...
Martin
Ahoj,
chtel bych do place=* v czechiaOSM vlozit kod NUTS5:
ktery jednoznacne urcuje:
* ze jde o obec
* cislo obce
* cislo kraje, okresu, regionu
- tedy unikatni identifikator v EU napr: CZ0615 596914
chtel jsem puvodne zmenit chybny statut town novym mestysum na
village, ale be zjednoznacneho klice je to obtizne.
zobrazit citaci
> Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem
> to udelal posle nej.
>
> Demo je na http://git.wz.cz/import-data.xml.bz2
>
> Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v
> pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat
> :)
>
> Nastavil jsem parametry ze importovat se maji jen obce, kde dve
> nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze
> zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena
> nachazi do peti kilometru od danych souradnic, tak se neimportuje (to
> je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a
> clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se
> predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne.
> Ruznych lhot se stejnym nazvem bude asi taky dost :)
>
> Nakonec v souboru skoncilo 5171 jmen.
>
> Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul.
Ahoj,
chtel bych do place=* v czechiaOSM vlozit kod NUTS5:
ktery jednoznacne urcuje:
* ze jde o obec
* cislo obce
* cislo kraje, okresu, regionu
- tedy unikatni identifikator v EU napr: CZ0615 596914
chtel jsem puvodne zmenit chybny statut "town" u mestysu na
"village", ale bez zjednoznacneho klice je to obtizne.
Proto bych chtel doplnit klic NUTS5. Chtel bych ho vzit z Wikipedie, nez CUZK.
Je nejaky postup jak davkove vysosat data z wiki, mate (asi Martin) na
to uz nejaky hotovy skript?
diky
hanoj
zobrazit citaci
> Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem
> to udelal posle nej.
>
> Demo je na http://git.wz.cz/import-data.xml.bz2
>
> Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v
> pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat
> :)
>
> Nastavil jsem parametry ze importovat se maji jen obce, kde dve
> nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze
> zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena
> nachazi do peti kilometru od danych souradnic, tak se neimportuje (to
> je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a
> clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se
> predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne.
> Ruznych lhot se stejnym nazvem bude asi taky dost :)
>
> Nakonec v souboru skoncilo 5171 jmen.
>
> Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul.
zobrazit citaci
> Proto bych chtel doplnit klic NUTS5. Chtel bych ho vzit z Wikipedie, nez CUZK.
> Je nejaky postup jak davkove vysosat data z wiki, mate (asi Martin) na
> to uz nejaky hotovy skript?
Posilam v priloze. Je to (snad) kompletni sada skriptu v perlu co jsem
na to pouzival. Co se sosani z wiki tyce, doporucuji pozornosti
predevsim cz-wiki-map-osm.pl
V create_osm_pr.txt je i trocha lehce chaotickych vysvetlivek aneb
strucny navod k pouziti.
Martin
------------- dal?í ?ást ---------------
A non-text attachment was scrubbed...
Name: skripty.zip
Type: application/zip
Size: 6750 bytes
Desc: [?ádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20080217/7ef2615c/attachment.zip>« zpět na výpis měsíce