[Talk-cz] Pomoc s testováním algoritmu pro import adres z RUIAN
Vlákno 26.1. - 28.1.2014, počet zpráv: 9
Ahoj,
mám pocit, že algoritmus pro párování adres mezi RUIAN a OSM je hotový a
jelikož je to místy heuristika, chci poprosit případné zájemce o spolupráci.
Spolupráce spočívá v celkem nepopulární činnosti, t.j. "ruční" ověření, zda
jsou adresní místa spárována správně.
Na ukázku jsem připravil tabulku z místa mého bydliště,
http://pedro.poloha.net/vinohrady.csv (500k), kde jsou adresní body z RUIAN a
z OSM, pokud se podařilo adresní místo nalézt. Adresní místo v OSM = bod,
čára, polygon či relace; všude se adresní tagy vyskytují.
Stačí napsat, která oblast vás zajímá a připravím takovouto tabulku s vaší
oblastí.
Jde o to zjistit, zda jsou adresní místa spárovaná správně a pokud adresní
místo OSM v tabulce není, zjistit proč - zda opravdu v OSM není či zda je
někde nějaká chyba.
Adresní místa hledám do vzdálenosti 100m - může se to zdát hodně, ale není. U
velkých budov je to klidně 85 metrů; v RUIAN je bod uprostřed budovy, v OSM
nad vchodem.
Pozornost by bylo dobré zaměřit hlavně na páry s velkou vzdáleností, na
nepřiřazená adresní místa z OSM a na rohové a podobné budovy, které mají jedno
číslo popisné a 2 čísla orientační pro různé ulice. Někdy se to sejde tak, že
i čísla orientační jsou stejná.
--
Petr, pv na propsychology.cz
zobrazit citaci
>p<
Ahoj,
můžu kouknout na Frýdek-Místek, Staré město u FM a strašně by mne
zajímaly Lysůvky/Zelinkovice. Tam byl docela chaos, snažil jsem se to
dát dohromady, ale nemusí to být úplně správně.
Ještě dotaz. Ta distance je v jakých jednotkách? Metry?
Marián
Dne 26.1.2014 17:23, Petr Vejsada napsal:
zobrazit citaci
> Ahoj,
>
> mám pocit, že algoritmus pro párování adres mezi RUIAN a OSM je hotový
> a
> jelikož je to místy heuristika, chci poprosit případné zájemce o
> spolupráci.
> Spolupráce spočívá v celkem nepopulární činnosti, t.j. "ruční" ověření,
> zda
> jsou adresní místa spárována správně.
>
> Na ukázku jsem připravil tabulku z místa mého bydliště,
> http://pedro.poloha.net/vinohrady.csv (500k), kde jsou adresní body z
> RUIAN a
> z OSM, pokud se podařilo adresní místo nalézt. Adresní místo v OSM =
> bod,
> čára, polygon či relace; všude se adresní tagy vyskytují.
>
> Stačí napsat, která oblast vás zajímá a připravím takovouto tabulku s
> vaší
> oblastí.
>
> Jde o to zjistit, zda jsou adresní místa spárovaná správně a pokud
> adresní
> místo OSM v tabulce není, zjistit proč - zda opravdu v OSM není či zda
> je
> někde nějaká chyba.
>
> Adresní místa hledám do vzdálenosti 100m - může se to zdát hodně, ale
> není. U
> velkých budov je to klidně 85 metrů; v RUIAN je bod uprostřed budovy, v
> OSM
> nad vchodem.
>
> Pozornost by bylo dobré zaměřit hlavně na páry s velkou vzdáleností, na
> nepřiřazená adresní místa z OSM a na rohové a podobné budovy, které
> mají jedno
> číslo popisné a 2 čísla orientační pro různé ulice. Někdy se to sejde
> tak, že
> i čísla orientační jsou stejná.
>
>
> --
> Petr, pv na propsychology.cz
>> p<
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
Ahoj
http://pedro.poloha.net/marian.zip
a koukám, že to nedopadá nejlépe. Třeba ulice Tovární ve Starém Městě se moc
nespárovala. Důvodem je, že v RUIAN je název ulice a v OSM ne; jediná shoda je
v číslu a v tom případě vyžaduji vzdálenost do 3 metrů, což není splněno.
Například Tovární 162 (ev.č.) je v OSM bez ulice a na druhé straně domu, než
je v RUIAN. Na místě, kde je v OSM číslo 162, je v RUIAN číslo 112, takže se
to vlastně nespárovalo správně. AUtomatizované řešení mě teď nenapadá.
Dne Ne 26. ledna 2014 23:06:03, Marián Kyral napsal(a):
zobrazit citaci
> Ahoj,
> můžu kouknout na Frýdek-Místek, Staré město u FM a strašně by mne
> zajímaly Lysůvky/Zelinkovice. Tam byl docela chaos, snažil jsem se to
> dát dohromady, ale nemusí to být úplně správně.
>
> Ještě dotaz. Ta distance je v jakých jednotkách? Metry?
>
> Marián
>
> Dne 26.1.2014 17:23, Petr Vejsada napsal:
> > Ahoj,
> >
> > mám pocit, že algoritmus pro párování adres mezi RUIAN a OSM je hotový
> > a
> > jelikož je to místy heuristika, chci poprosit případné zájemce o
> > spolupráci.
> > Spolupráce spočívá v celkem nepopulární činnosti, t.j. "ruční" ověření,
> > zda
> > jsou adresní místa spárována správně.
> >
> > Na ukázku jsem připravil tabulku z místa mého bydliště,
> > http://pedro.poloha.net/vinohrady.csv (500k), kde jsou adresní body z
> > RUIAN a
> > z OSM, pokud se podařilo adresní místo nalézt. Adresní místo v OSM =
> > bod,
> > čára, polygon či relace; všude se adresní tagy vyskytují.
> >
> > Stačí napsat, která oblast vás zajímá a připravím takovouto tabulku s
> > vaší
> > oblastí.
> >
> > Jde o to zjistit, zda jsou adresní místa spárovaná správně a pokud
> > adresní
> > místo OSM v tabulce není, zjistit proč - zda opravdu v OSM není či zda
> > je
> > někde nějaká chyba.
> >
> > Adresní místa hledám do vzdálenosti 100m - může se to zdát hodně, ale
> > není. U
> > velkých budov je to klidně 85 metrů; v RUIAN je bod uprostřed budovy, v
> > OSM
> > nad vchodem.
> >
> > Pozornost by bylo dobré zaměřit hlavně na páry s velkou vzdáleností, na
> > nepřiřazená adresní místa z OSM a na rohové a podobné budovy, které
> > mají jedno
> > číslo popisné a 2 čísla orientační pro různé ulice. Někdy se to sejde
> > tak, že
> > i čísla orientační jsou stejná.
> >
> >
> > --
> > Petr, pv na propsychology.cz
> >
> >> p<
> >
> > _______________________________________________
> > Talk-cz mailing list
> > Talk-cz na openstreetmap.org
> > https://lists.openstreetmap.org/listinfo/talk-cz
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
To Staré město jsem chtěl u FM. Ne Zlína ;-)
Ale zase se zjistilo, kde jsou mezery. To, že někde chybí ulice je
naprosto běžné. Nebylo by třeba jako první krok dobré udělat porovnání
ulic RUIAN - OSM? Zjistit, kde ulice chybí úplně, případně jich je v OSM
mnohem méně než v RUIAN.
Marián
Dne 27.1.2014 01:34, Petr Vejsada napsal:
zobrazit citaci
> Ahoj
>
> http://pedro.poloha.net/marian.zip
>
> a koukám, že to nedopadá nejlépe. Třeba ulice Tovární ve Starém Městě
> se moc
> nespárovala. Důvodem je, že v RUIAN je název ulice a v OSM ne; jediná
> shoda je
> v číslu a v tom případě vyžaduji vzdálenost do 3 metrů, což není
> splněno.
> Například Tovární 162 (ev.č.) je v OSM bez ulice a na druhé straně
> domu, než
> je v RUIAN. Na místě, kde je v OSM číslo 162, je v RUIAN číslo 112,
> takže se
> to vlastně nespárovalo správně. AUtomatizované řešení mě teď nenapadá.
>
> Dne Ne 26. ledna 2014 23:06:03, Marián Kyral napsal(a):
>
>> Ahoj,
>> můžu kouknout na Frýdek-Místek, Staré město u FM a strašně by mne
>> zajímaly Lysůvky/Zelinkovice. Tam byl docela chaos, snažil jsem se to
>> dát dohromady, ale nemusí to být úplně správně.
>>
>> Ještě dotaz. Ta distance je v jakých jednotkách? Metry?
>>
>> Marián
>>
>> Dne 26.1.2014 17:23, Petr Vejsada napsal:
>> > Ahoj,
>> >
>> > mám pocit, že algoritmus pro párování adres mezi RUIAN a OSM je hotový
>> > a
>> > jelikož je to místy heuristika, chci poprosit případné zájemce o
>> > spolupráci.
>> > Spolupráce spočívá v celkem nepopulární činnosti, t.j. "ruční" ověření,
>> > zda
>> > jsou adresní místa spárována správně.
>> >
>> > Na ukázku jsem připravil tabulku z místa mého bydliště,
>> > http://pedro.poloha.net/vinohrady.csv (500k), kde jsou adresní body z
>> > RUIAN a
>> > z OSM, pokud se podařilo adresní místo nalézt. Adresní místo v OSM =
>> > bod,
>> > čára, polygon či relace; všude se adresní tagy vyskytují.
>> >
>> > Stačí napsat, která oblast vás zajímá a připravím takovouto tabulku s
>> > vaší
>> > oblastí.
>> >
>> > Jde o to zjistit, zda jsou adresní místa spárovaná správně a pokud
>> > adresní
>> > místo OSM v tabulce není, zjistit proč - zda opravdu v OSM není či zda
>> > je
>> > někde nějaká chyba.
>> >
>> > Adresní místa hledám do vzdálenosti 100m - může se to zdát hodně, ale
>> > není. U
>> > velkých budov je to klidně 85 metrů; v RUIAN je bod uprostřed budovy, v
>> > OSM
>> > nad vchodem.
>> >
>> > Pozornost by bylo dobré zaměřit hlavně na páry s velkou vzdáleností, na
>> > nepřiřazená adresní místa z OSM a na rohové a podobné budovy, které
>> > mají jedno
>> > číslo popisné a 2 čísla orientační pro různé ulice. Někdy se to sejde
>> > tak, že
>> > i čísla orientační jsou stejná.
>> >
>> >
>> > --
>> > Petr, pv na propsychology.cz
>> >
>> >> p<
>> >
>> > _______________________________________________
>> > Talk-cz mailing list
>> > Talk-cz na openstreetmap.org
>> > https://lists.openstreetmap.org/listinfo/talk-cz
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> https://lists.openstreetmap.org/listinfo/talk-cz
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
pardon,
tak http://pedro.poloha.net/osm/sm-fm.zip
Dne Po 27. ledna 2014 07:48:59, Marián Kyral napsal(a):
zobrazit citaci
> To Staré město jsem chtěl u FM. Ne Zlína
> Ale zase se zjistilo, kde jsou mezery. To, že někde chybí ulice je
> naprosto běžné. Nebylo by třeba jako první krok dobré udělat porovnání
> ulic RUIAN - OSM? Zjistit, kde ulice chybí úplně, případně jich je v OSM
> mnohem méně než v RUIAN.
Jenom pro počítačové laiky - jakým způsobem probíhá porovnání, kam se má
uvedený soubor nahrát, čím otevřít - JJOSM nebo něčím jiným
Pražák
Dne 26. ledna 2014 17:23 Petr Vejsada <osm na propsychology.cz> napsal(a):
zobrazit citaci
> Ahoj,
>
> mám pocit, že algoritmus pro párování adres mezi RUIAN a OSM je hotový a
> jelikož je to místy heuristika, chci poprosit případné zájemce o
> spolupráci.
> Spolupráce spočívá v celkem nepopulární činnosti, t.j. "ruční" ověření, zda
> jsou adresní místa spárována správně.
>
> Na ukázku jsem připravil tabulku z místa mého bydliště,
> http://pedro.poloha.net/vinohrady.csv (500k), kde jsou adresní body z
> RUIAN a
> z OSM, pokud se podařilo adresní místo nalézt. Adresní místo v OSM = bod,
> čára, polygon či relace; všude se adresní tagy vyskytují.
>
> Stačí napsat, která oblast vás zajímá a připravím takovouto tabulku s vaší
> oblastí.
>
> Jde o to zjistit, zda jsou adresní místa spárovaná správně a pokud adresní
> místo OSM v tabulce není, zjistit proč - zda opravdu v OSM není či zda je
> někde nějaká chyba.
>
> Adresní místa hledám do vzdálenosti 100m - může se to zdát hodně, ale
> není. U
> velkých budov je to klidně 85 metrů; v RUIAN je bod uprostřed budovy, v OSM
> nad vchodem.
>
> Pozornost by bylo dobré zaměřit hlavně na páry s velkou vzdáleností, na
> nepřiřazená adresní místa z OSM a na rohové a podobné budovy, které mají
> jedno
> číslo popisné a 2 čísla orientační pro různé ulice. Někdy se to sejde tak,
> že
> i čísla orientační jsou stejná.
>
>
> --
> Petr, pv na propsychology.cz
> >p<
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20140127/991094d5/attachment.html>
Dne 27.1.2014 17:30, Zdeněk Pražák napsal:
zobrazit citaci
> Jenom pro počítačové laiky - jakým způsobem probíhá porovnání,
> kam se má uvedený soubor nahrát, čím otevřít - JJOSM nebo
> něčím jiným
>
> Pražák
CSV otevřeš v Excelu nebo calc z libre/open office. Je to normální
tabulka, kterou pak můžeš třídit a filtrovat na různá podezřelé hodnoty.
Ověření v JOSM pak už musíš dělat ručně.
Marián
Mohl bych tedy poprosit pro zkoušku o Lázně Bohdaneč a Nechanice v okrese
Hradec Králové
Pražák
Dne 27. ledna 2014 20:13 Marián Kyral <mkyral na email.cz> napsal(a):
zobrazit citaci
> Dne 27.1.2014 17:30, Zdeněk Pražák napsal:
>
>
> Jenom pro počítačové laiky - jakým způsobem probíhá porovnání,
>> kam se má uvedený soubor nahrát, čím otevřít - JJOSM nebo
>> něčím jiným
>>
>> Pražák
>>
>
> CSV otevřeš v Excelu nebo calc z libre/open office. Je to normální
> tabulka, kterou pak můžeš třídit a filtrovat na různá podezřelé hodnoty.
> Ověření v JOSM pak už musíš dělat ručně.
>
> Marián
>
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> https://lists.openstreetmap.org/listinfo/talk-cz
>
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20140128/846ebc7a/attachment.html>
Zdravím,
Dne Út 28. ledna 2014 10:10:39, Zdeněk Pražák napsal(a):
zobrazit citaci
> Mohl bych tedy poprosit pro zkoušku o Lázně Bohdaneč a Nechanice v okrese
> Hradec Králové
> Pražák
je na http://pedro.poloha.net/osm/zdenek.zip
a na stejné adrese http://pedro.poloha.net/osm/ budou i případné další.
..
.p.« zpět na výpis měsíce