« zpět na výpis měsíce |

[Talk-cz] Adresy z RUIAN, 3. rekapitulace + ukázka

Vlákno 18.2. - 19.2.2014, počet zpráv: 4


18.2.2014 09:48:59 (#1)
gravatar

Petr Vejsada

<osm at propsychology.cz>
507
Ahoj, P?id?vat, nahrazovat: addr:conscriptionnumber addr:provisionalnumber addr:streetnumber addr:housenumber addr:street addr:place addr:suburb addr:city addr:postcode addr:country=CZ Pouze u nov?ch uzl? p?idat: ref:ruian:addr=nnnnnn Mazat: ref:ruian source:addr is_in addr:alternatenumber addr:provisional uir_adr:ADRESA_KOD uir_adr:adresa_kod addr:number Mazat tyto kombinace k,v: source:loc=cuzk:km source:position=cuzk:km source:loc=ruian source:position=cuzk_km source:position=cuzk:ruian source:loc=source=cuzk:km Source:addr a source:loc bude patrn? z tag? changesetu. Ad is_in - mysl?m, ?e to, co tu p?ed chv?l? prob?hlo, t.j. ?e ?R "vlastn?" 71 procent v?ech tag? is_in na sv?t?, d?v? argument?m pro jejich zachov?n? v?hu limitn? se bl???c? nule. A tak se pt?m - opravdu je tu n?kdo, kdo tento tag pou??v? a jeho smaz?n?m se mu n?co rozbije? Nech? promluv? te? nebo a? ml?? nav?dy ;-). P?ipravil jsem op?t uk?zku, tentokr?t v?t??, a to pra?sk? ?tvrti St???kov a Prosek. http://pedro.poloha.net/osm/data.zip . Obsahuje dva soubory, data.osm a data.csv. Co je v data.osm je snad jasn?, v data.csv je tabulka varov?n? - seznam m?st, kter?m je t?eba v?novat pozornost. Pro u?ivatele JOSM je tam link na JOSM remote control, jeho otev?en?m v prohl??e?i nebo curl apod. JOSM sko?? na problematick? m?sto.Typy chyb: AM p??li? bl?zko u sebe - to znamen? a? 0.00 metr?, tedy le??c? na sob? - nutno bezpodm?ne?n? ?e?it. Pak obsahuje bl?zk? m?sta do vzd?lenosti 5 metr?. Nen? nutn? je proch?zet v?echna. Z?le?? na m?stn? situaci, co je ji? podez?el? a co je nejsp?? OK. V OSM je n?jak? bod s adresou podez?ele bl?zko - to je situace, kdy n?jak? adresn? bod v OSM nen? sp?rov?n s ni??m z RUIAN, ale le?? podez?ele bl?zko adresn?mu m?stu z RUIAN. Zd? se, ?e to b?vaj? chyby v ??sle popisn?m, kdy se jedn? o tot?? m?sto, ale v OSM je jin? ??slo popisn? (?i eviden?n?) ne? v RUIAN. Je t?eba prozkoumat. Ulice Xxx je p??li? daleko - pokud m? adresn? m?sto ulici, kouknu se, jak je podle RUIAN ta ulice daleko od adresn?ho bodu. Varov?n? se vyd?v?, je-li d?le ne? 100 metr?. ?asto jde o fale?n? poplach, ale n?kdy ne. Objevil jsem adresn? bod, vzd?len? od ulice 1.5km, p?i?em? mezi n?m a danou ulic? le?ely des?tky jin?ch ulic, tak?e se jednalo o evidentn? nesmysl v RUIAN. P??u tady o tom proto, proto?e a?koli je chyb RELATIVN? m?lo, v absolutn?ch ??slech to d? desetitis?ce a nen? re?ln?, abych to zvl?dl v rozumn?m ?ase prohl?dnout v?echno. Proto pravd?podobn? popros?m dobrovoln?ky, kte?? by cht?li dost?vat .osm s jimi vybranou oblast?, prohl?dnout je, opravit a poslat mi je zp?tky. Tak?e je to takov? p??prava na lov brig?dn?k? ;-). Pozn?mka: V uk?zkov?m souboru st?le je tag is_in s hodnotou 'Is in ...', ale opravdu po??t?m s t?m, ?e p?jde pry?. K diskusi - douf?m, ?e nic. -- Petr, pv at propsychology.cz zobrazit citaci
>p<

18.2.2014 10:01:30 (#2)
gravatar

Petr Vejsada

<osm at propsychology.cz>
507
Dne ?t 18. ?nora 2014 21:48:59, Petr Vejsada napsal(a): Oops, samoz?ejm? p?id?v? se u v?ech uzl?, jak nov?ch, tak modifikovan?ch. zobrazit citaci
> Pouze u nov?ch uzl? p?idat: > > ref:ruian:addr=nnnnnn

19.2.2014 06:07:40 (#3)
gravatar

"Petr Morávek [Xificurk]"

<petr at pada.cz>
138
Ahoj, Dne 18.2.2014 21:48, Petr Vejsada napsal(a): zobrazit citaci
> P?id?vat, nahrazovat: > addr:country=CZ
Tohle bych v??n? je?t? zv??il - zat?m taky nezazn?l p??pad, kdy je ten tag pot?eba. Jak jsem psal - osobn? bych preferoval nemazat, nep?id?vat. Pokud se uk??e, ?e to n?kde bezpodm?ne?n? pot?eba je, tak nebude probl?m prov?st hromadn? dopln?n?. Je pot?eba si uv?domit, ?e adresn? body tvo?? moment?ln? cca 70% v?ech tagovan?ch bod? v ?R, po dopln?n? by to m?lo b?t 75%. Tak?e ka?d? "zbyte?n?" tag bude m?t ne ?pln? zanedbateln? dopad na celkov? objem dat a n?ro?nost jejich zpracov?n?. To samo o sob? samoz?ejm? nen? d?vodem pro n?jak? maz?n?, ale je to imho d?vodem k pe?liv?mu zv??en?, jestli jsou jednotliv? tagy k n??emu u?ite?n?. zobrazit citaci
> Mazat:
+created_by zobrazit citaci
> Mazat tyto kombinace k,v:
Je?t? zhruba 50 000 bod? m?: http://taginfo.openstreetmap.cz/tags/note=Nekonzistence%20cuzk%3Akm%20a%20mvcr%3Aadresa Vzhledem k tomu, ?e by se b?hem importu m?la prov?d?t kontrola, tak by se to mohlo taky rovnou mazat. zobrazit citaci
> P?ipravil jsem op?t uk?zku, tentokr?t v?t??, a to pra?sk? ?tvrti St???kov a > Prosek. http://pedro.poloha.net/osm/data.zip . Obsahuje dva soubory, data.osm > a data.csv. Co je v data.osm je snad jasn?, v data.csv je tabulka varov?n? - > seznam m?st, kter?m je t?eba v?novat pozornost. Pro u?ivatele JOSM je tam link > na JOSM remote control, jeho otev?en?m v prohl??e?i nebo curl apod. JOSM sko?? > na problematick? m?sto.Typy chyb:
Mohl bys trochu osv?tlit, co znamen? obsah jednotliv?ch sloupc? v tabulce varov?n?? zobrazit citaci
> P??u tady o tom proto, proto?e a?koli je chyb RELATIVN? m?lo, v absolutn?ch > ??slech to d? desetitis?ce a nen? re?ln?, abych to zvl?dl v rozumn?m ?ase > prohl?dnout v?echno. Proto pravd?podobn? popros?m dobrovoln?ky, kte?? by > cht?li dost?vat .osm s jimi vybranou oblast?, prohl?dnout je, opravit a poslat > mi je zp?tky. Tak?e je to takov? p??prava na lov brig?dn?k? ;-).
Zapi? si m? ;-) Zdrav?, Petr Mor?vek aka Xificurk

19.2.2014 07:15:19 (#4)
gravatar

Petr Vejsada

<osm at propsychology.cz>
507
Ahoj, Dne St 19. ?nora 2014 18:07:40, Petr Mor?vek [Xificurk] napsal(a): zobrazit citaci
> Ahoj, > > Dne 18.2.2014 21:48, Petr Vejsada napsal(a): > > P?id?vat, nahrazovat: > > addr:country=CZ > > Tohle bych v??n? je?t? zv??il - zat?m taky nezazn?l p??pad, kdy je ten > tag pot?eba. Jak jsem psal - osobn? bych preferoval nemazat, nep?id?vat. > Pokud se uk??e, ?e to n?kde bezpodm?ne?n? pot?eba je, tak nebude probl?m > prov?st hromadn? dopln?n?.
M? lok?ln? taginfo ??k?, ?e m?m v evidenci 2.294.624 entit s adresn?m tagem, z toho 2.082.028 m? addr:country=CZ a asi 2.400 m? tag sousedn? zem? (Geofabrik nem? ten polygon tak p?esn? jako C?ZK; m? trochu p?esah).v RUIAN je te? 2.907.794 AM, tak?e n?r?st bude cca 25%, hmm, to nen? zase m?lo. zobrazit citaci
> Je pot?eba si uv?domit, ?e adresn? body tvo?? moment?ln? cca 70% v?ech > tagovan?ch bod? v ?R, po dopln?n? by to m?lo b?t 75%. Tak?e ka?d? > "zbyte?n?" tag bude m?t ne ?pln? zanedbateln? dopad na celkov? objem dat > a n?ro?nost jejich zpracov?n?. > To samo o sob? samoz?ejm? nen? d?vodem pro n?jak? maz?n?, ale je to imho > d?vodem k pe?liv?mu zv??en?, jestli jsou jednotliv? tagy k n??emu u?ite?n?.
Tak zva?ujte, mn? se te? moment?ln? zva?ovat nechce a u? m? to trochu unavuje. zobrazit citaci
> > Mazat: > +created_by
nj, na to jsem nenarazil, p?id?v?m do maz?n?. zobrazit citaci
> > Mazat tyto kombinace k,v: > Je?t? zhruba 50 000 bod? m?: > http://taginfo.openstreetmap.cz/tags/note=Nekonzistence%20cuzk%3Akm%20a%20mv > cr%3Aadresa Vzhledem k tomu, ?e by se b?hem importu m?la prov?d?t kontrola, > tak by se to mohlo taky rovnou mazat.
Tyto nekonzistence st?le existuj?. Narazil jsem na n?kolik takov?ch, kdy v OSM bylo ?pln? jin? ??slo domu ne? v RUIAN, klidn? i tak, ?e v jedn? DB bylo ??slo popisn? a v druh? ??slo eviden?n?. Objevil jsem tak, ?e bot hled? k RUIAN AM n?jakou adresu v OSM, ??dnou nenajde, tak j? vytvo?? a n?sledn? vyd? varov?n?, proto?e ob? le?? bu? na stejn?, nebo velmi bl?zk? pozici. Co s t?m nev?m. ?e?il bych tak, ?e v editoru sma?u ten nov? bod z RUIAN a nech?m star? v OSM. Pokud se v budoucnu v RUIAN bod zm?n?, p?jde znovu do zpracov?n?. Jak ?e?it situaci, kdy se bod v RUIAN nezm?n?, proto?e je spr?vn?, tak to nev?m. Nev?m jak zjistit, zda je spr?vn? KM nebo RUIAN. zobrazit citaci
> > > P?ipravil jsem op?t uk?zku, tentokr?t v?t??, a to pra?sk? ?tvrti St???kov > > a > > Prosek. http://pedro.poloha.net/osm/data.zip . Obsahuje dva soubory, > > data.osm a data.csv. Co je v data.osm je snad jasn?, v data.csv je > > tabulka varov?n? - seznam m?st, kter?m je t?eba v?novat pozornost. Pro > > u?ivatele JOSM je tam link na JOSM remote control, jeho otev?en?m v > > prohl??e?i nebo curl apod. JOSM sko?? > > na problematick? m?sto.Typy chyb: > Mohl bys trochu osv?tlit, co znamen? obsah jednotliv?ch sloupc? v > tabulce varov?n??
Jde o dvojice nebo trojice adresn?ch entit, u kter?ch bylo vygenerov?no to varov?n?. ?esky jsou zna?ena data z RUIAN, anglicky z OSM. Koncovka _a nebo _b ozna?uje jeden z dvojice bod? z RUIAN, kter?ch se varov?n? t?k?. Tak?e t?eba varov?n? AM jsou bl?zko u sebe plus ozna?en? t?ch bod?, kter? jsou bl?zko u sebe. cislo_popisne_a je ?.p. prvn?ho a cislo_popisne_b je ?.p. druh?ho bodu z RUIAN. M??e, ale nemus? u toho b?t i adresn? entita z OSM, p??padn? to m??e b?t p?r, slo?en? jen z jednoho bodu RUIAN a jedn? entity v OSM. zobrazit citaci
> > > P??u tady o tom proto, proto?e a?koli je chyb RELATIVN? m?lo, v > > absolutn?ch > > ??slech to d? desetitis?ce a nen? re?ln?, abych to zvl?dl v rozumn?m ?ase > > prohl?dnout v?echno. Proto pravd?podobn? popros?m dobrovoln?ky, kte?? by > > cht?li dost?vat .osm s jimi vybranou oblast?, prohl?dnout je, opravit a > > poslat mi je zp?tky. Tak?e je to takov? p??prava na lov brig?dn?k? ;-). > > Zapi? si m? ;-)
OK :-), d?ky., jestli m? Merkaartor tak? n?co jako JOSM remote control, tak p?id?m sloupe?ek :) -- Petr

« zpět na výpis měsíce