[Talk-cz] Cestina bez diakritiky
Vlákno 20.1. - 27.1.2008, počet zpráv: 12
Hola,
jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
Připadá mi škoda tam takhle zadávat neúplné údaje.
Problém 1: Potlatch na Linuxu komolí český vstup.
Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes schránku.
Pokud máte jiné problémy, podělte se a třeba najdem řešení.
Martin
Ahoj!
zobrazit citaci
> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
> Připadá mi škoda tam takhle zadávat neúplné údaje.
Myslim ze je to z lehce historickych dob a muzu za to ja.
zobrazit citaci
> Problém 1: Potlatch na Linuxu komolí český vstup.
> Řešení 1: Napsat to v jiném programu a do Potlatche vložit přes
> schránku.
Problem 2: Chybi ceska "ucw" klavesnice pro Xa ;-).
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
zobrazit citaci
> > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
> > Připadá mi škoda tam takhle zadávat neúplné údaje.
>
> Myslim ze je to z lehce historickych dob a muzu za to ja.
Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v
UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to
jednoznacne by se dala diakritika automaticky doplnit ...
MP
Mnohdy ani jako clovek netusim, jak ma jmeno vypadat, takze automatiku
bych zavrhl :)
zobrazit citaci
>> > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
>> > Připadá mi škoda tam takhle zadávat neúplné údaje.
>>
>> Myslim ze je to z lehce historickych dob a muzu za to ja.
>
> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v
> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to
> jednoznacne by se dala diakritika automaticky doplnit ...
>
> MP
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
>
On Mon 2008-01-21 14:41:08, BH wrote:
zobrazit citaci
> > > jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
> > > Připadá mi škoda tam takhle zadávat neúplné údaje.
> >
> > Myslim ze je to z lehce historickych dob a muzu za to ja.
>
> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v
> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to
> jednoznacne by se dala diakritika automaticky doplnit ...
Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
rozumnym formatu?
Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
body v josm, bylo by doplnovani jmen ulic hned veselejsi...
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke...
K
Pavel Machek napsal(a):
zobrazit citaci
> On Mon 2008-01-21 14:41:08, BH wrote:
>
>>>> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
>>>> Připadá mi škoda tam takhle zadávat neúplné údaje.
>>>>
>>> Myslim ze je to z lehce historickych dob a muzu za to ja.
>>>
>> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v
>> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to
>> jednoznacne by se dala diakritika automaticky doplnit ...
>>
>
> Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
> rozumnym formatu?
>
> Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
> body v josm, bylo by doplnovani jmen ulic hned veselejsi...
> Pavel
>
On Mon 2008-01-21 15:21:27, Kubajz wrote:
zobrazit citaci
> Tak vyrenderovat overlay mapnikem by nemelo byt zas tak tezke...
Ono by stacilo to pridat jako vrstvu do josm, ale problem by mohl byt
z tim vytahovanim databaze..
Pavel
zobrazit citaci
> K
>
> Pavel Machek napsal(a):
> > On Mon 2008-01-21 14:41:08, BH wrote:
> >
> >>>> jak tak koukám na mapu, vidím hodně ulic se jmény bez diakritiky.
> >>>> Připadá mi škoda tam takhle zadávat neúplné údaje.
> >>>>
> >>> Myslim ze je to z lehce historickych dob a muzu za to ja.
> >>>
> >> Tak mne napada - neslo by to nejak poloautomaticky dohackovat? v
> >> UIR-ADR jsou tusim jmena s diakritikou, takze tam kde je to
> >> jednoznacne by se dala diakritika automaticky doplnit ...
> >>
> >
> > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
> > rozumnym formatu?
> >
> > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
> > body v josm, bylo by doplnovani jmen ulic hned veselejsi...
> > Pavel
> >
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/cgi-bin/mailman/listinfo/talk-cz
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
zobrazit citaci
> Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
> rozumnym formatu?
>
> Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
> body v josm, bylo by doplnovani jmen ulic hned veselejsi...
> Pavel
http://www.mvcr.cz/adresa/xml.html
Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim
nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto,
jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici
cisla popisna
Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu
jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi
ona :)
MP
On Wed 2008-01-23 01:38:44, BH wrote:
zobrazit citaci
> > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
> > rozumnym formatu?
> >
> > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
> > body v josm, bylo by doplnovani jmen ulic hned veselejsi...
>
> http://www.mvcr.cz/adresa/xml.html
>
> Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim
> nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto,
> jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici
> cisla popisna
No, kompletni databazi snad rozdavaj na CDckach...
zobrazit citaci
> Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu
> jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi
> ona :)
No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho
dostanu zpet na server?
Jinak jsem si trosku hral:
Adresy mvcr obsahuji
25858 adresy.ofic
unikatnich jmen ulic. Data v osm obsahuji
2518 adresy.osm
unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr --
tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc).
Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze
jeste mame co delat.
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
------------- další část ---------------
#!/bin/bash
cat adresy.xml | grep "ulice nazev" | cstocs utf8 ascii | sed 's/.*nazev..//' | sed 's/. kod=.*//' | sort | uniq > adresy.ofic
bzcat ~/incoming/czechia.osm.bz2 | grep -3 highway.*residential | grep name | sed 's/.*name. v..//' | sed 's/....$//' | cstocs utf8 ascii | tr '[:lower:]' '[:upper:]' | sort | uniq > adresy.osm
diff -u adresy.osm adresy.ofic
On Sun 2008-01-27 12:28:55, Pavel Machek wrote:
zobrazit citaci
> On Wed 2008-01-23 01:38:44, BH wrote:
> > > Pravdepodobne slo. Dokaze nekdo vytahnout UIR-ADR databazi v nejakym
> > > rozumnym formatu?
> > >
> > > Ona by se hodila i k dalsim fintam, kdyby se sikovne zobrazili adresni
> > > body v josm, bylo by doplnovani jmen ulic hned veselejsi...
> >
> > http://www.mvcr.cz/adresa/xml.html
> >
> > Tam je ke stazeni databaze ulic v XML formatu. Bohuzel k tem ulicim
> > nejsou zadne souradnice, je tam jen napsano kam to patri (jake mesto,
> > jaky kraj ... ), ale zase jsoui ke kazde ulici pripsany existujici
> > cisla popisna
>
> No, kompletni databazi snad rozdavaj na CDckach...
>
> > Podle tech nazvu by sla doplnovat diakritika (pokud k neohackovanemu
> > jmenu existuje jen jedina ohackovana varianta v souboru, bude to asi
> > ona :)
>
> No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho
> dostanu zpet na server?
>
> Jinak jsem si trosku hral:
>
> Adresy mvcr obsahuji
>
> 25858 adresy.ofic
>
> unikatnich jmen ulic. Data v osm obsahuji
>
> 2518 adresy.osm
>
> unikatnich jmen ulic, z nichz je 979 neznamych pro mvcr --
> tj. pravdepodobne spatne (ale bohuzel je v tom i kus nemecka etc).
>
> Z toho plyne ze osm pokryva spravne nejakych 6% jmen ulic... zda se ze
> jeste mame co delat.
(aha, tak tohle bylo na lehce starejch datech, ale ted to neni o moc
lepsi. Nemecky ulice zmizely, zrejme diky presnejsimu czechia.osm).
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html
Pavel Machek napsal(a):
zobrazit citaci
> No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho
> dostanu zpet na server?
No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten
pred kazdym uploadem provede download daneho elementu a porovna to na konflikt.
Pokud konflikt bude, oznaci, zbytek proste uploadne.
Tim se dostavas na race window radove sekundy, skutecne transakce nejsou, ale
stale by slo (s rizikem dalsi race) udelat download, upload, download history,
pri detekci vlozene zmeny rollback.
Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka
rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem
podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul
hodiny....
--
Petr "Nenik" Nejedly, NetBeans/Sun Microsystems, http://www.netbeans.org
355/113 -- Not the famous irrational number PI, but an incredible simulation!
Ahoj!
zobrazit citaci
> > No, to by nebylo tak tezky, ale kdyz nejak oedituju .osm, jak ho
> > dostanu zpet na server?
>
> No to je desne jednoduchy, udelas to JOSM plugin pro "checked upload" a ten
> pred kazdym uploadem provede download daneho elementu a porovna to na konflikt.
> Pokud konflikt bude, oznaci, zbytek proste uploadne.
:-). Me neslo ani tak o detekci kolizi, jako o to jak to nahrat
zpet... predpokladam ze bych mohl v .osm souboru opravit jmena a pak
tam nastavit nejaky ten attribut "changed" aby to JOSM byl ochoten
uploadovat.. ale to uz se bude v sedu delat tezko.
(Ona to kazdopadne nebude moc legrace; data v seznamu adres jsou
vsechna velkymi pismeny, a "zkombinuj velikost pismen z osm a
diakritiku ze seznamu adres" neni neco co bych touzil psat v
shellu...)
zobrazit citaci
> Trochu problemem pro takovy masivni upload asi bude posledni dobou tragicka
> rychlost API. Nevite o nejakem prave probihajicim masivnim importu nebo necem
> podobnem, co by to tak brzdilo? Vcera jsem kousicek Kladna uploadoval snad pul
> hodiny....
Ted to jede docela rozume...
Pavel
--
(english) http://www.livejournal.com/~pavelmachek
(cesky, pictures) http://atrey.karlin.mff.cuni.cz/~pavel/picture/horses/blog.html« zpět na výpis měsíce