« zpět na výpis měsíce |

[Talk-cz] import mest a vesnic z wikipedie?

Vlákno 12.10.2007 - 17.2.2008, počet zpráv: 27


12.10.2007 11:58:33 (#1)
gravatar

BH

<singularita at gmail.com>
306
Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy mest a vesnic. Co jsem koukal treba na http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam. Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim jak moc jsou tyhle dve licence kompatibilni a jestli by tohle provest (pravne) slo - technicky by to bylo relativne jednoduche. GFDL chce odkaz na zdroj (dal by se do tagu) a autory (ty by se taky asi daly nejak vytahat, podle licence staci pet hlavnich, takze to by se nejak strojove odhadlo a pocet peti udrzi delku tagu v rozumnych mezich :) Martin Petricek

13.10.2007 12:14:03 (#2)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy > mest a vesnic. Co jsem koukal treba na > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to > mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou > asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
Kolik mest/vesnic tam je? Mozna lepsi zdroj je: http://earth-info.nga.mil/gns/html/ http://earth-info.nga.mil/gns/html/gis_countryfiles.htm ...ale nemaj "zrovna 2x presny" souradnice :-(. Ale pouzitelny data by se meli najit na http://www.geonames.org/export/ ... Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 12:31:02 (#3)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy > mest a vesnic. Co jsem koukal treba na > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to
Mozna mam lepsi plan.... teda jestli nejsou souradnice fakt u _vsech_ mest ... vzit z http://cs.wikipedia.org/wiki/Seznam_%C4%8Desk%C3%BDch_m%C4%9Bst ...seznam mest, a z http://earth-info.nga.mil/gns/html/ vzit polohy. Cemu se jeste rika "city"..? Tabor je 30-te nejvetsi, co useknout to tam? Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 12:46:33 (#4)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy > mest a vesnic. Co jsem koukal treba na > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to > mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou > asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
Menim nazor, ten seznam vypada _opravdu_ dobre. zobrazit citaci
> ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou > (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly > pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam. > Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim > jak moc jsou tyhle dve licence kompatibilni a jestli by tohle > provest
Myslim ze kdyz vezmem jmena vesnic + polohy, bude to v pohode. Jinak to vypada ze wikipedia to z neceho importovala... mozna by bylo jeste lepsi pouzit puvodni zdroj. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 12:58:26 (#5)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> Kolik mest/vesnic tam je? Mozna lepsi zdroj je:
Co jsem koukal tak obce a mesta tam jsou vsechny. zobrazit citaci Co to znamena "zrovna 2x presny"? Odchylka 50 m u nezvu vesnic (i ty nejprtavejsi zapadakovy budou mit vic nez 50 m velikost) by byla ok ... 1 km uz asi ne :) zobrazit citaci
> Ale pouzitelny data by se meli najit na > http://www.geonames.org/export/ ...
Jo, to by mohlo jit pouzit, cc-by je vhodna licence, vypada to ze tam je toho dost (19000 radek pro CR) I kdyz zase by se z toho musel asi vyfiltrovat odpad (treba pomoci toho z nga.mil :), zahlid jsem tam i ptakoviny typu "Autolakovna Simanek" a jako na potvoru oznaceny jako sidlo. (navic tam neni rozliseny mesto/obec/vesnice ... pak neni jasny jestli dat town, city, village nebo hamlet) V nga.mil jsem tohle taky nenasel .. ale pokud mam souradnice, tak uz staci jen ziskat seznam mest a vesnic (nejlepe prave roztrideny na mesta a vesnice :) a pak by to uz slo :) Jinak jsou tam i treba potoky a jiny jmena, ty by mozna sly pouzit pozdeji (mohl bych je treba importovat jenom s name a dat tam note typu "FIXME doplnit typ nebo priradit k existujici veci" ... ma tohle smysl, nebo je to zbytecny?) Asi bych zkusil dat ty data z geonames, pomoci dat z nga.mil odstranit ptakoviny a co zbyde a nebude dosud naimportovany tak naimportovat. Jediny problem je zjistit typ sidla. Pokud bych ho nezjistil, tak bych tam moh jeste nacpat vsechno jako place=village a nechat lidi at to na mesta povysi ... BTW kde je v CR cca rozhrani mezi town a city? Martin Petricek

13.10.2007 01:02:03 (#6)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> > Kolik mest/vesnic tam je? Mozna lepsi zdroj je: > > Co jsem koukal tak obce a mesta tam jsou vsechny. > > > http://earth-info.nga.mil/gns/html/ > > http://earth-info.nga.mil/gns/html/gis_countryfiles.htm > > > > ...ale nemaj "zrovna 2x presny" souradnice :-(. > > Co to znamena "zrovna 2x presny"? > Odchylka 50 m u nezvu vesnic (i ty nejprtavejsi zapadakovy budou mit > vic nez 50 m velikost) by byla ok ... 1 km uz asi ne :)
No, on je to spis ten jeden km :-(. zobrazit citaci
> > Ale pouzitelny data by se meli najit na > > http://www.geonames.org/export/ ... > > Jo, to by mohlo jit pouzit, cc-by je vhodna licence, vypada to ze tam > je toho dost (19000 radek pro CR) > I kdyz zase by se z toho musel asi vyfiltrovat odpad (treba pomoci > toho z nga.mil :), zahlid jsem tam i ptakoviny typu "Autolakovna > Simanek" a jako na potvoru oznaceny jako sidlo. (navic tam neni > rozliseny mesto/obec/vesnice ... pak neni jasny jestli dat town, city, > village nebo hamlet) > V nga.mil jsem tohle taky nenasel .. ale pokud mam souradnice, tak uz > staci jen ziskat seznam mest a vesnic (nejlepe prave roztrideny na > mesta a vesnice :) a pak by to uz slo :)
Seznam mest je tady: http://cs.wikipedia.org/wiki/Seznam_%C4%8Desk%C3%BDch_m%C4%9Bst_podle_velikosti zobrazit citaci
> Jediny problem je zjistit typ sidla. Pokud bych ho nezjistil, tak bych > tam moh jeste nacpat vsechno jako place=village a nechat lidi at to na > mesta povysi ... > > BTW kde je v CR cca rozhrani mezi town a city?
100000 obyvatel? Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 01:48:24 (#7)
gravatar

BH

<singularita at gmail.com>
306
On 10/13/07, Pavel Machek <pavel na ucw.cz> wrote: zobrazit citaci
> Ahoj! > > > Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy > > mest a vesnic. Co jsem koukal treba na > > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to > > mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou > > asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech > > Menim nazor, ten seznam vypada _opravdu_ dobre. > > > ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou > > (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly > > pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam. > > Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim > > jak moc jsou tyhle dve licence kompatibilni a jestli by tohle > > provest > > Myslim ze kdyz vezmem jmena vesnic + polohy, bude to v pohode. Jinak > to vypada ze wikipedia to z neceho importovala... mozna by bylo jeste > lepsi pouzit puvodni zdroj.
Jo, ale najit ho tam asi nebude trivialni. Zkousel jsem neco vytrasovat a dosel jsem k tomuhle: http://cs.wikipedia.org/w/index.php?title=Wikipedista_diskuse:Pastorius&oldid=652186 Souřadnice se získávají těžce. Mám v databázi seznam všech částí obce a jejich sořadnice v nějakém podivuhodném systému. Ten převádím na souřadnice a souřadnici obce počítám jako průměr všech souřadnic všech částí obce. U velkých měst to není problém. U malých obcí ano. Pokud má obec dvě části, z nichž jenom jedna je zastavěná a druhá část je velké pole nebo les, trefím se do lesa. Na mapě to nevypadá úplně hezky, neboť moje šipka pak ukazuje opticky mimo zastavěnou část. I když je to třeba jen 200 m vedle, není to úplně ono. Bohužel jsem nenašel žádný rozumný seznam se souřadnicemi. --Pastorius 07:31, 31. 7. 2006 (UTC) Tak nevim, mozna ty souradnice z wiki asi taky nebudou moc presny (abych se priznal, tak jejich presnost jsem netestoval). Co ty geonames, tam jen to lepsi s presnosti? Asi bych to videl na seznam mest z wiki a souradnice z geonames. Co se tyce city vs town, tak jak mi nekdo kdysi osvetlil, "city have a cathedral, while town does not", cili neni dulezity pocet obyvatel, ale pritomnost katedraly. Jelikoz to by se zjistovalo blbe, tak tu hranici asi hodim nekde mezi 50-100 tisicema ... Martin Petricek

13.10.2007 08:03:54 (#8)
gravatar

hanoj

<enemy at mail.muni.cz>
115
zobrazit citaci
>> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy >> mest a vesnic. Co jsem koukal treba na >> http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to >> mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou >> asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech
*** Ono je to presny a docela uplny protoze wikipedie prevzala data CSU ciselnik UIR-ZSJ o obcich (respektive jeho webove realizace http://www.isu.cz/uir/scripts/index.asp), souradnice prevedla z JTSK. *** Vyjadreni CSU k OSM se mi ale opet zadne nepodarilo ziskat... zobrazit citaci *** tyhle dva datovy zdroje se mnoho nelisi, obsahuji spoustu POI, fantasmagorie, souradnice jsou hodne generalizovany... ale lepsi jak nic. hanoj

13.10.2007 08:13:40 (#9)
gravatar

hanoj

<enemy at mail.muni.cz>
115
zobrazit citaci
> Souřadnice se získávají těžce. Mám v databázi seznam všech částí obce > a jejich sořadnice v nějakém podivuhodném systému. Ten převádím na > souřadnice a souřadnici obce počítám jako průměr všech souřadnic > všech částí obce. U velkých měst to není problém. U malých obcí ano. > Pokud má obec dvě části, z nichž jenom jedna je zastavěná a druhá > část je velké pole nebo les, trefím se do lesa. Na mapě to nevypadá > úplně hezky, neboť moje šipka pak ukazuje opticky mimo zastavěnou > část. I když je to třeba jen 200 m vedle, není to úplně ono. Bohužel > jsem nenašel žádný rozumný seznam se souřadnicemi. --Pastorius 07:31, > 31. 7. 2006 (UTC) > > Tak nevim, mozna ty souradnice z wiki asi taky nebudou moc presny > (abych se priznal, tak jejich presnost jsem netestoval). Co ty > geonames, tam jen to lepsi s presnosti?
*** geonames je urcite horsi. *** UIR-ZSJ (=wikipedie) pouziva zrejme pro bod centroid spravniho uzemi obce, coz vam dost casto vyjde mimo zastavene uzemi. Taktez je treba brat v potaz ze obec je SPRAVNI jednotka. Pokud jedu pres "Ceskou mez", je to MISTNI CAST, ale patri do OBCE "Sazava"... zobrazit citaci
> Co se tyce city vs town, tak jak mi nekdo kdysi osvetlil, "city have > a cathedral, while town does not", cili neni dulezity pocet obyvatel, > ale pritomnost katedraly. Jelikoz to by se zjistovalo blbe, tak tu > hranici asi hodim nekde mezi 50-100 tisicema ...
*** Na wikiOSM je (nekde), ze mesto je podle poctu osob (coz mame o kazde obci wikipedii), nebo podle mistnich zvyklosti. ha hanoj

13.10.2007 11:12:52 (#10)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
AhoJ! zobrazit citaci
> > http://earth-info.nga.mil/gns/html/ > > http://earth-info.nga.mil/gns/html/gis_countryfiles.htm > > > > Ale pouzitelny data by se meli najit na > > http://www.geonames.org/export/ ... > > > *** tyhle dva datovy zdroje se mnoho nelisi, obsahuji spoustu POI, > fantasmagorie, souradnice jsou hodne generalizovany... ale lepsi jak nic.
Kupodivu to nejsou fantasmagorie, ale ruzny historicky podivnosti... a da se to vyfiltrovat podle nekterejch ze sloupcu aby historicky veci zmizely. Zatim mam tohle: #!/bin/bash # http://earth-info.nga.mil/gns/html/ # description: http://earth-info.nga.mil/gns/html/gis_countryfiles.htm cat ez.txt | tr ' ' '|' > ez_pipe.txt zobrazit citaci
> mesta_pos.txt
cat mesta.txt | cstocs il2 ascii | while true; do IFS="|" read NAME || exit grep -i "|$NAME|" ez_pipe.txt >> mesta_pos.txt done echo "<?xml version='1.0' encoding='UTF-8'?>" echo "<osm version='0.5' generator='shpupload'>" NODEID=-1 cat mesta_pos.txt | while true; do IFS='|' read RC UFI UNI LAT LONG DMS_LAT DMS_LONG MGRS JOG FC DSG PC CC1 ADM1 ADM2 POP ELEV CC2 NT LC SHORT_FORM GENERIC SORT_NAME FULL_NAME FULL_NAME_ND MODIFY_DATE || exit if [ ".$DSG" != ".PPL" ]; then continue fi if [ ".$NT" != ".N" ]; then continue fi # if [ ".$PC" = "." ]; then # continue # fi # echo $LAT $LONG $FULL_NAME $PC $CC1 $DSG echo "<node id=\"$NODEID\" lon=\"$LONG\" lat=\"$LAT\">" NODEID=$[$NODEID-1] echo "<tag k=\"created_by\" v=\"readgov\"/>" echo "<tag k=\"name\" v=\"$FULL_NAME\"/>" # echo "<tag k=\"note\" v=\"$FC_$DSG_$NT\"/>" echo "<tag k=\"place\" v=\"town\"/>" echo "<tag k=\"source\" v=\"http://earth-info.nga.mil/gns/html/\"/>" echo "</node>" # | cstocs utf8 ascii done echo "</osm>" -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 11:31:25 (#11)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Asi bych to videl na seznam mest z wiki a souradnice z geonames.
A potom rucne prebrat -- vyhazet duplikaty a nesmysly... jo jo, pomalu zacnu od nejvetsich mest... Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

13.10.2007 12:26:43 (#12)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! No, nejak jsem probral mesta nad 10000 obyvatel podle wikipedie a toho gov.mil zdroje, ale nefungovalo to zrovna dvakrat dobre. V gov.mil je spousta duplicit, a zjistovani "jestlipak uz to tam je" taky neni zrovna trivialni -- delal jsem to by oko. (Snad mi toho moc neuteklo). V par pripadech jsem vyrobil duplicitu -- kdyz v osm byla verse s blbou diakritikou -- myslim ze je jednodussi smazat spatnou versi nez se to snazit opravovat. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

14.10.2007 01:15:27 (#13)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Thu 2007-10-25 17:14:25, BH wrote: zobrazit citaci
> Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano.
Dik! ...vypada to moc pekne... zobrazit citaci
> I kdyz nekolik existujicich vesnic, odhadem tak stovka se > nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od > sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou > spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny > casem asi rucne, nebo z lepsiho zdroje :)
Bylo by mozny dat nekam seznam neimportovanych veci pro rucni kontrolu? -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

15.10.2007 07:23:42 (#14)
gravatar

Jachym Cepicky

<jachym.cepicky at gmail.com>
414 93
Ahoj, mě přišlo, že v datasetu [1] jsou snad všechna města a vesnice(?) Jachym [1] http://grass.fsv.cvut.cz/wiki/index.php/Geodata BH píše v Pá 12. 10. 2007 v 23:58 +0200: zobrazit citaci
> Tak mne napadlo, jestli by neslo z wikipedie importovat do mapy nazvy > mest a vesnic. Co jsem koukal treba na > http://cs.wikipedia.org/wiki/Pacov - souradnice tam jsou, ze je to > mesto tam taky je, ve wikipedii se zda ze ty vesnice a mesta tam jsou > asi vsechny, souradnice a typ co jsem koukal tak je taky asi u vsech > ... napsal by se skript co by to vytahal, vyradil ty co uz v mape jsou > (muselo by se dat pozor na nazvy bez diakritiky, ale ty by se zas daly > pro zmenu do nejakeho warning listu k oprave :) a nacpal to tam. > Akoratze wikipedie je pod licenci GFDL a OSM je pod cc-by-sa ... nevim > jak moc jsou tyhle dve licence kompatibilni a jestli by tohle provest > (pravne) slo - technicky by to bylo relativne jednoduche. GFDL chce > odkaz na zdroj (dal by se do tagu) a autory (ty by se taky asi daly > nejak vytahat, podle licence staci pet hlavnich, takze to by se nejak > strojove odhadlo a pocet peti udrzi delku tagu v rozumnych mezich :) > > Martin Petricek > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
-- Jachym Cepicky e-mail: jachym.cepicky na gmail.com URL: http://les-ejk.cz GPG: http://www.les-ejk.cz/pgp/jachym_cepicky-gpg.pub ------------- další část --------------- A non-text attachment was scrubbed... Name: signature.asc Type: application/pgp-signature Size: 189 bytes Desc: Toto je digitálně podepsaná část zprávy URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20071015/29742ad8/attachment.sig>

15.10.2007 08:29:46 (#15)
gravatar

enemy na mail.muni.cz

<enemy at mail.muni.cz>
115
Jachym Cepicky napsal(a): zobrazit citaci
> mě přišlo, že v datasetu [1] jsou snad všechna města a vesnice(?) [1] > http://grass.fsv.cvut.cz/wiki/index.php/Geodata
*** Jenze to je ten zamotanej retez, data tohoto datasetu bud pochazi z 1. "CZECH free map" *** kde citace "byla pouzita free verze programu gpsmapper, cehoz dusledkem je, ze data neni dovoleno prodavat (this map cannot be sold) i kdyby to pred timto prevodem bylo dovoleno" 2. "CSU" *** kde neni zadny explictini souhlas s pouzitim, nebo elementarni licence k datum... Martin Landa mi kdysi psal, ze on (a Radim) zadne licence nikdy neresil. Pouze sebral data do jednoho datasetu a reseni licence nechal na koncoveho uzivatele. ha hanoj

22.10.2007 11:44:41 (#16)
gravatar

BH

<singularita at gmail.com>
306
Tak jsem zkusil neco dat dohromady, vzal jsem souradnice z wikipedie, z gov.mil a geonames, prvni problem je, ze vsude neni vsechno (ve wiki jsou sice vsechny obce a mesta, ale uz tam nejsou mistni casti, v gov.mil a geonames zase nektere obce nejsou - jsou tam treba jen jejich casti, mozna ze se ta obec nejak v minulosti slucovala a v gov.mil a geonames jsou starsi data...) Nakonec asi souradnice vezmu tak, ze se podivam na souradnice ve vsech zdrojich, z nich vezmu ty dva kde je rozdil nejmensi a udelam prumer - ten bych pak importoval (az na vyjimnky se souradnice lisi, nektere mene, nektere vice) Tam kde je nejmensi rozdil vetsi nez kilometr bych to odriz a ty uz pak neimportoval (kilometrovym kriteriem neprojde asi tak 1 procento obci z cs.wiki, dalsich cca 9 procent nema ekvivalent v geonames nebo gov.mil, takze neni s cim srovnavat). Nebo ma nekdo lepsi napad? Spolu s tim bych rovnou doplnil diakritiku u tech nazvu, kde neni a kde ji lze jednoznacne doplnit (coz je skoro vsude kde neni :) Az vyleze stredecni dump, tak to tam asi nahodim ... Martin

22.10.2007 11:05:28 (#17)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> Tak jsem zkusil neco dat dohromady, vzal jsem souradnice z wikipedie, > z gov.mil a geonames, prvni problem je, ze vsude neni vsechno (ve wiki > jsou sice vsechny obce a mesta, ale uz tam nejsou mistni casti, v > gov.mil a geonames zase nektere obce nejsou - jsou tam treba jen > jejich casti, mozna ze se ta obec nejak v minulosti slucovala a v > gov.mil a geonames jsou starsi data...) > > Nakonec asi souradnice vezmu tak, ze se podivam na souradnice ve vsech > zdrojich, z nich vezmu ty dva kde je rozdil nejmensi a udelam prumer - > ten bych pak importoval (az na vyjimnky se souradnice lisi, nektere > mene, nektere vice) > > Tam kde je nejmensi rozdil vetsi nez kilometr bych to odriz a ty uz > pak neimportoval (kilometrovym kriteriem neprojde asi tak 1 procento > obci z cs.wiki, dalsich cca 9 procent nema ekvivalent v geonames nebo > gov.mil, takze neni s cim srovnavat). Nebo ma nekdo lepsi napad? > > Spolu s tim bych rovnou doplnil diakritiku u tech nazvu, kde neni a > kde ji lze jednoznacne doplnit (coz je skoro vsude kde neni :) > > Az vyleze stredecni dump, tak to tam asi nahodim ...
Nebyla by nekde demo verse? Jinak myslim ze neni potreba cekat na stredecni dump ;-). Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

25.10.2007 04:22:58 (#18)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> Nebyla by nekde demo verse? Jinak myslim ze neni potreba cekat na > stredecni dump ;-).
Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem to udelal posle nej. Demo je na http://git.wz.cz/import-data.xml.bz2 Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat :) Nastavil jsem parametry ze importovat se maji jen obce, kde dve nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena nachazi do peti kilometru od danych souradnic, tak se neimportuje (to je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne. Ruznych lhot se stejnym nazvem bude asi taky dost :) Nakonec v souboru skoncilo 5171 jmen. Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul. Martin

25.10.2007 05:45:21 (#19)
gravatar

BH

<singularita at gmail.com>
306
Tak jsem se jeste mrknul na svuj vytvor a zjistil jsem, ze jsem tam zapomnel pridat tag source. Takze bych tam pak pridal tag: <tag k="source" v="geonames.org,wikipedia.org,nga.mil" /> ke kazdymu nodu. Snad uz tam vic chyb nebude, :) Martin

25.10.2007 04:29:12 (#20)
gravatar

BH

<singularita at gmail.com>
306
Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo) jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal podle created_by, ale myslim ze to asi nebude nutne :) Martin

25.10.2007 04:41:33 (#21)
gravatar

Jakub Sykora

<kubajz at kbx.cz>
618
Vyborne :) Sikovnej kluk. Uz se tesim, jak to bude vypadat. A tesim se, ze zacnu delat silnice 3. tridy a nazvy ulic... K BH wrote: zobrazit citaci
> Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo) > jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal > podle created_by, ale myslim ze to asi nebude nutne :) > > Martin > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
-- Jakub Sýkora email: kubajz na kbx.cz <') ICQ: 68976632 ( =- mobil: +420 777 594 201 ''

25.10.2007 05:14:25 (#22)
gravatar

BH

<singularita at gmail.com>
306
Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano. I kdyz nekolik existujicich vesnic, odhadem tak stovka se nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny casem asi rucne, nebo z lepsiho zdroje :) Martin On 10/25/07, Jakub Sykora <kubajz na kbx.cz> wrote: zobrazit citaci
> Vyborne :) Sikovnej kluk. Uz se tesim, jak to bude vypadat. A tesim se, > ze zacnu delat silnice 3. tridy a nazvy ulic... > > K > > BH wrote: > > Po zbezne kontrole (zda se ze to sedi a existujici sidla to vynechalo) > > jsem to tam zacal sypat. V nejhorsim bych to pak hromadne vymazal > > podle created_by, ale myslim ze to asi nebude nutne :) > > > > Martin > > > > _______________________________________________ > > Talk-cz mailing list > > Talk-cz na openstreetmap.org > > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz > > -- > Jakub Sýkora > email: kubajz na kbx.cz <') > ICQ: 68976632 ( =- > mobil: +420 777 594 201 '' > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz >

26.10.2007 11:08:15 (#23)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Sat 2007-10-13 23:15:27, Pavel Machek wrote: zobrazit citaci
> On Thu 2007-10-25 17:14:25, BH wrote: > > Tak upload je hotov. Vsech 5171 nazvu k importu bylo do OSM naimportovano. > > Dik! ...vypada to moc pekne... > > > I kdyz nekolik existujicich vesnic, odhadem tak stovka se > > nenaimportovalo, hlavne proto, ze souradnice z pouzitych zdroju se od > > sebe navzajem prilis lisi a nechtel jsem zkouset hadat ktery teda jsou > > spravne. Pripadalo mi lepsi je tam necpat, holt je tam doda nekdo jiny > > casem asi rucne, nebo z lepsiho zdroje :) > > Bylo by mozny dat nekam seznam neimportovanych veci pro rucni > kontrolu?
Jeste.... mozna by bylo dobry napsat par radek na wikiproject czechia ... http://wiki.openstreetmap.org/index.php/WikiProject_Czechia . Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

5.11.2007 11:14:24 (#24)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> Bylo by mozny dat nekam seznam neimportovanych veci pro rucni > kontrolu?
http://git.wz.cz/import-data-800+w.xml.bz2 Neimportovany veci - ty sidla, kde nepresnost souradnic je vice nez 800 metru a sidla, ke jediny souradnice jsou ty z wikipedie. Je to 831 sidel, takze kdo chce, muze to projit, zkontrolovbat a pak eventuelne treba cast naimportovat ... Martin

13.2.2008 11:46:59 (#25)
gravatar

hanoj

<ehanoj at gmail.com>
718
Ahoj, chtel bych do place=* v czechiaOSM vlozit kod NUTS5: ktery jednoznacne urcuje: * ze jde o obec * cislo obce * cislo kraje, okresu, regionu - tedy unikatni identifikator v EU napr: CZ0615 596914 chtel jsem puvodne zmenit chybny statut town novym mestysum na village, ale be zjednoznacneho klice je to obtizne. zobrazit citaci
> Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem > to udelal posle nej. > > Demo je na http://git.wz.cz/import-data.xml.bz2 > > Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v > pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat > :) > > Nastavil jsem parametry ze importovat se maji jen obce, kde dve > nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze > zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena > nachazi do peti kilometru od danych souradnic, tak se neimportuje (to > je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a > clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se > predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne. > Ruznych lhot se stejnym nazvem bude asi taky dost :) > > Nakonec v souboru skoncilo 5171 jmen. > > Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul.

13.2.2008 11:51:30 (#26)
gravatar

hanoj

<ehanoj at gmail.com>
718
Ahoj, chtel bych do place=* v czechiaOSM vlozit kod NUTS5: ktery jednoznacne urcuje: * ze jde o obec * cislo obce * cislo kraje, okresu, regionu - tedy unikatni identifikator v EU napr: CZ0615 596914 chtel jsem puvodne zmenit chybny statut "town" u mestysu na "village", ale bez zjednoznacneho klice je to obtizne. Proto bych chtel doplnit klic NUTS5. Chtel bych ho vzit z Wikipedie, nez CUZK. Je nejaky postup jak davkove vysosat data z wiki, mate (asi Martin) na to uz nejaky hotovy skript? diky hanoj zobrazit citaci
> Je potreba, pac jsem to nemel dopsany., A kdyz uz dump vysel, tak jsem > to udelal posle nej. > > Demo je na http://git.wz.cz/import-data.xml.bz2 > > Import je "oznacen" pomoci created_by="create_osm_pr.pl/1" takze v > pripade problemu by to slo cele nejak hromadne automaticky zlikvidovat > :) > > Nastavil jsem parametry ze importovat se maji jen obce, kde dve > nejpresnejsi souradnice jsou od sebe maximalne 800 metru (lze > zvysit/snizit a kdyztak pregenerovat) a pokud se sidlo daneho jmena > nachazi do peti kilometru od danych souradnic, tak se neimportuje (to > je potreba, neb treba sidel s nazvem "Pocatky" je asi 6 po republice a > clovek jnak nevi ktery tam je a ktery ne - pokud je do 5 km, tak se > predpolada, ze to je to co tam ma byt, byt mozna ponekud nepresne. > Ruznych lhot se stejnym nazvem bude asi taky dost :) > > Nakonec v souboru skoncilo 5171 jmen. > > Pokud v tom nikdo nenajde chybu, tak bych to tam odpoledne vrznul.

17.2.2008 08:18:15 (#27)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> Proto bych chtel doplnit klic NUTS5. Chtel bych ho vzit z Wikipedie, nez CUZK. > Je nejaky postup jak davkove vysosat data z wiki, mate (asi Martin) na > to uz nejaky hotovy skript?
Posilam v priloze. Je to (snad) kompletni sada skriptu v perlu co jsem na to pouzival. Co se sosani z wiki tyce, doporucuji pozornosti predevsim cz-wiki-map-osm.pl V create_osm_pr.txt je i trocha lehce chaotickych vysvetlivek aneb strucny navod k pouziti. Martin ------------- dal?í ?ást --------------- A non-text attachment was scrubbed... Name: skripty.zip Type: application/zip Size: 6750 bytes Desc: [?ádný popis není k dispozici] URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20080217/7ef2615c/attachment.zip>

« zpět na výpis měsíce