« zpět na výpis měsíce |

[Talk-cz] Cestina bez diakritiky

Vlákno 20.1. - 27.1.2008, počet zpráv: 12


20.1.2008 12:18:10 (#1)
gravatar

Martin Vidner

<martin.osm at vidner.net>
34
Hola, jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. Připadá mi škoda tam takhle zadávat neúplné údaje. Problém 1: Potlatch na Linuxu komolí český vstup. Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes schránku. Pokud máte jiné problémy, podělte se a třeba najdem řešení. Martin

21.1.2008 01:24:17 (#2)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. > Připadá mi škoda tam takhle zadávat neúplné údaje.
Myslim ze je to z lehce historickych dob a muzu za to ja. zobrazit citaci
> Problém 1: Potlatch na Linuxu komolí český vstup. > Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes > schránku.
Problem 2: Chybi ceska "ucw" klavesnice pro Xa ;-). Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

21.1.2008 02:41:08 (#3)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. > > Připadá mi škoda tam takhle zadávat neúplné údaje. > > Myslim ze je to z lehce historickych dob a muzu za to ja.
Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to jednoznacne by se dala diakritika automaticky doplnit ... MP

21.1.2008 03:05:48 (#4)
gravatar

Jakub Sýkora

<kubajz at kbx.cz>
618
Mnohdy ani jako clovek netusim, jak ma jmeno vypadat, takze automatiku bych zavrhl :) zobrazit citaci
>> > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. >> > Připadá mi škoda tam takhle zadávat neúplné údaje. >> >> Myslim ze je to z lehce historickych dob a muzu za to ja. > > Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v > UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to > jednoznacne by se dala diakritika automaticky doplnit ... > > MP > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz >

21.1.2008 03:19:51 (#5)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Mon 2008-01-21 14:41:08, BH wrote: zobrazit citaci
> > > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. > > > Připadá mi škoda tam takhle zadávat neúplné údaje. > > > > Myslim ze je to z lehce historickych dob a muzu za to ja. > > Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v > UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to > jednoznacne by se dala diakritika automaticky doplnit ...
Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym rozumnym formatu? Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni body v josm, bylo by doplnovani jmen ulic hned veselejsi... Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

21.1.2008 03:21:27 (#6)
gravatar

Kubajz

<kubajz at kbx.cz>
618
Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke... K Pavel Machek napsal(a): zobrazit citaci
> On Mon 2008-01-21 14:41:08, BH wrote: > >>>> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. >>>> Připadá mi škoda tam takhle zadávat neúplné údaje. >>>> >>> Myslim ze je to z lehce historickych dob a muzu za to ja. >>> >> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v >> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to >> jednoznacne by se dala diakritika automaticky doplnit ... >> > > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym > rozumnym formatu? > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni > body v josm, bylo by doplnovani jmen ulic hned veselejsi... > Pavel >

21.1.2008 03:35:22 (#7)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Mon 2008-01-21 15:21:27, Kubajz wrote: zobrazit citaci
> Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke...
Ono by stacilo to pridat jako vrstvu do josm, ale problem by mohl byt z tim vytahovanim databaze.. Pavel zobrazit citaci
> K > > Pavel Machek napsal(a): > > On Mon 2008-01-21 14:41:08, BH wrote: > > > >>>> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky. > >>>> Připadá mi škoda tam takhle zadávat neúplné údaje. > >>>> > >>> Myslim ze je to z lehce historickych dob a muzu za to ja. > >>> > >> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v > >> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to > >> jednoznacne by se dala diakritika automaticky doplnit ... > >> > > > > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym > > rozumnym formatu? > > > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni > > body v josm, bylo by doplnovani jmen ulic hned veselejsi... > > Pavel > > > > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
-- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

23.1.2008 01:38:44 (#8)
gravatar

BH

<singularita at gmail.com>
306
zobrazit citaci
> Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym > rozumnym formatu? > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni > body v josm, bylo by doplnovani jmen ulic hned veselejsi... > Pavel
http://www.mvcr.cz/adresa/xml.html Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici cisla popisna Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi ona :) MP

27.1.2008 12:28:55 (#9)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Wed 2008-01-23 01:38:44, BH wrote: zobrazit citaci
> > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym > > rozumnym formatu? > > > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni > > body v josm, bylo by doplnovani jmen ulic hned veselejsi... > > http://www.mvcr.cz/adresa/xml.html > > Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim > nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, > jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici > cisla popisna
No, kompletni databazi snad rozdavaj na CDckach... zobrazit citaci
> Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu > jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi > ona :)
No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho dostanu zpet na server? Jinak jsem si trosku hral: Adresy mvcr obsahuji 25858 adresy.ofic unikatnich jmen ulic. Data v osm obsahuji 2518 adresy.osm unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr -- tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc). Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze jeste mame co delat. Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html ------------- další část --------------- #!/bin/bash cat adresy.xml | grep "ulice nazev" | cstocs utf8 ascii | sed 's/.*nazev..//' | sed 's/. kod=.*//' | sort | uniq > adresy.ofic bzcat ~/incoming/czechia.osm.bz2 | grep -3 highway.*residential | grep name | sed 's/.*name. v..//' | sed 's/....$//' | cstocs utf8 ascii | tr '[:lower:]' '[:upper:]' | sort | uniq > adresy.osm diff -u adresy.osm adresy.ofic

27.1.2008 12:33:26 (#10)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
On Sun 2008-01-27 12:28:55, Pavel Machek wrote: zobrazit citaci
> On Wed 2008-01-23 01:38:44, BH wrote: > > > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym > > > rozumnym formatu? > > > > > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni > > > body v josm, bylo by doplnovani jmen ulic hned veselejsi... > > > > http://www.mvcr.cz/adresa/xml.html > > > > Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim > > nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto, > > jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici > > cisla popisna > > No, kompletni databazi snad rozdavaj na CDckach... > > > Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu > > jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi > > ona :) > > No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho > dostanu zpet na server? > > Jinak jsem si trosku hral: > > Adresy mvcr obsahuji > > 25858 adresy.ofic > > unikatnich jmen ulic. Data v osm obsahuji > > 2518 adresy.osm > > unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr -- > tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc). > > Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze > jeste mame co delat.
(aha, tak tohle bylo na lehce starejch datech, ale ted to neni o moc lepsi. Nemecky ulice zmizely, zrejme diky presnejsimu czechia.osm). -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

27.1.2008 05:22:44 (#11)
gravatar

Petr Nejedly

<Petr.Nejedly at Sun.COM>
111
Pavel Machek napsal(a): zobrazit citaci
> No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho > dostanu zpet na server?
No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten pred kazdym uploadem provede download daneho elementu a porovna to na konflikt. Pokud konflikt bude, oznaci, zbytek proste uploadne. Tim se dostavas na race window radove sekundy, skutecne transakce nejsou, ale stale by slo (s rizikem dalsi race) udelat download, upload, download history, pri detekci vlozene zmeny rollback. Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul hodiny.... -- Petr "Nenik" Nejedly, NetBeans/Sun Microsystems, http://www.netbeans.org 355/113 -- Not the famous irrational number PI, but an incredible simulation!

27.1.2008 11:00:44 (#12)
gravatar

Pavel Machek

<pavel at ucw.cz>
1067 1226
Ahoj! zobrazit citaci
> > No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho > > dostanu zpet na server? > > No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten > pred kazdym uploadem provede download daneho elementu a porovna to na konflikt. > Pokud konflikt bude, oznaci, zbytek proste uploadne.
:-). Me neslo ani tak o detekci kolizi, jako o to jak to nahrat zpet... predpokladam ze bych mohl v .osm souboru opravit jmena a pak tam nastavit nejaky ten attribut "changed" aby to JOSM byl ochoten uploadovat.. ale to uz se bude v sedu delat tezko. (Ona to kazdopadne nebude moc legrace; data v seznamu adres jsou vsechna velkymi pismeny, a "zkombinuj velikost pismen z osm a diakritiku ze seznamu adres" neni neco co bych touzil psat v shellu...) zobrazit citaci
> Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka > rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem > podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul > hodiny....
Ted to jede docela rozume... Pavel -- (english) http://www.livejournal.com/~pavelmachek (cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html

« zpět na výpis měsíce