[Talk-cz] Jak porovnavat OSM XML (zeleznicni stanice a zast)

Ahoj, rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich cisel, korekce nazvu, duplicity atd... Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru automatizace ma, ale ztraci se cast dat OSM)... Nevim, poradite? hanoj [1] http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51 [2] http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku

Ahoj, kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v textovém editoru jen pomocí funkcí nahrazování). Potom už stačí použít sort (nebo seřazení v tabulkovém procesoru) a diff (vimdiff). On Tue, 04 Jan 2011 10:52:39 +0100, hanoj <ehanoj na gmail.com> wrote: zobrazit citaci

> Ahoj, > rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich > stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich > cisel, korekce nazvu, duplicity atd... > > Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne > porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo > interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru > automatizace ma, ale ztraci se cast dat OSM)... > > > Nevim, poradite? > > hanoj > > > > [1] > http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51 > [2] > http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-cz

-- Petr Dlouhý

No, z wikipedie se to buď dá vytáhnout z nějakého dumpu dat (dá se stáhnout, ale je opruz s ním pracovat) nebo to grabovat přímo z wikipedie (např. pomocí nějakého bota, viz Wikipedia:Bots na en wiki), ale i to je opruz. J. 2011/1/4 Petr Dlouhý <petr.dlouhy na email.cz>: zobrazit citaci

> Ahoj, > > kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý > seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil > vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v > textovém editoru jen pomocí funkcí nahrazování). Potom už stačí použít sort > (nebo seřazení v tabulkovém procesoru) a diff (vimdiff). > > On Tue, 04 Jan 2011 10:52:39 +0100, hanoj <ehanoj na gmail.com> wrote: > >> Ahoj, >> rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich >> stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich >> cisel, korekce nazvu, duplicity atd... >> >> Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne >> porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo >> interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru >> automatizace ma, ale ztraci se cast dat OSM)... >> >> >> Nevim, poradite? >> >> hanoj >> >> >> >> [1] >> http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51 >> [2] >> http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku >> >> _______________________________________________ >> Talk-cz mailing list >> Talk-cz na openstreetmap.org >> http://lists.openstreetmap.org/listinfo/talk-cz > > > -- > Petr Dlouhý > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-cz >

-- S pozdravem, Jirka Sedláček --- jirisedlacek na gmail.com

zobrazit citaci

> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý > seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil > vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v > textovém editoru jen pomocí funkcí nahrazování).

*** to bych si dokazal predstavit, mas na neco takoveho mustr? zobrazit citaci

> Potom už stačí použít sort > (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).

*** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML? diky hanoj

2011/1/4 hanoj <ehanoj na gmail.com>: zobrazit citaci

>> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý >> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil >> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v >> textovém editoru jen pomocí funkcí nahrazování). > *** to bych si dokazal predstavit, mas na neco takoveho mustr? > > >> Potom už stačí použít sort >> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff). > *** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku > vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML? >

Z pole? zobrazit citaci

> > > diky > hanoj > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-cz >

-- S pozdravem, Jirka Sedláček --- jirisedlacek na gmail.com

On Tue, 04 Jan 2011 11:29:54 +0100, hanoj <ehanoj na gmail.com> wrote: zobrazit citaci

>> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal >> čistý >> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil >> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo >> v >> textovém editoru jen pomocí funkcí nahrazování). > *** to bych si dokazal predstavit, mas na neco takoveho mustr?

Jo, něco mám. Posílám XSLT, které používám ke kontrole duplicit mezi cyklotrasami - vygeneruje seznam "ref" cyklistických tras. Neměl by to být problém upravit: <xsl:stylesheet version="2.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:output method="text" indent="no"/> <xsl:template match="/osm"> <xsl:apply-templates select="relation"> <xsl:sort select="@id" data-type="number"/> </xsl:apply-templates> </xsl:template> <xsl:template match="relation[tag/@v = 'bicycle']"> <xsl:value-of select="tag[@k = 'ref']/@v"/> <xsl:text>
</xsl:text>  </xsl:template> <xsl:template match="*"> </xsl:template> </xsl:stylesheet> zobrazit citaci

> > >> Potom už stačí použít sort >> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff). > *** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku > vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML? >

Asi by neměl být problém vygenerovat seznam zastávek, které mají stejné číslo, ale jmenují se jinak (nebo naopak stejná jména a jiná čísla). Případně zastávek, které v jednom ze seznamů chybí. Nebo také seznam zastávek u kterých v OSM chybí číslo, ale dají se najít ve Wiki podle jména. Neznám lepší způsob, než potom z daného seznamu vygenerovat OSM XML s danými změnami, nejlépe asi pomocí XSLT. zobrazit citaci

> > > diky > hanoj > > _______________________________________________ > Talk-cz mailing list > Talk-cz na openstreetmap.org > http://lists.openstreetmap.org/listinfo/talk-cz

-- Petr Dlouhý

Ahoj, železniční stanice a zastávky generuji čas od času na tuhle stránku: http://wiki.openstreetmap.org/wiki/%C5%BDelezni%C4%8Dn%C3%AD_stanice_a_zast%C3%A1vky_v_%C4%8CR Porovnávání dělám jen podle názvů stanic, čísla by se dala doplnit. Používám na to přiložený pythoní skript. Je to jenom taková rychlovka, ale třeba se bude někomu hodit. Jinak pozor na Wikipedii, jsou tam i neexistující stanice a zastávky, takže je vždycky lepší používat více zdrojů. TT ------------- další část --------------- HTML příloha byla odstraněna... URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20110104/47a662fd/attachment.html> ------------- další část --------------- A non-text attachment was scrubbed... Name: osmstations.py Type: application/octet-stream Size: 5644 bytes Desc: [žádný popis není k dispozici] URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20110104/47a662fd/attachment.obj>

Diky vsem za rady, zkusim si s tim o vejkendu pohrat. hanoj 2011/1/4 Tomáš Tichý <t.tichy na post.cz>: zobrazit citaci

> Ahoj, > železniční stanice a zastávky generuji čas od času na tuhle stránku: > http://wiki.openstreetmap.org/wiki/%C5%BDelezni%C4%8Dn%C3%AD_stanice_a_zast%C3%A1vky_v_%C4%8CR > > Porovnávání dělám jen podle názvů stanic, čísla by se dala doplnit. > Používám na to přiložený pythoní skript. Je to jenom taková rychlovka, ale > třeba se bude někomu hodit. > Jinak pozor na Wikipedii, jsou tam i neexistující stanice a zastávky, takže > je vždycky lepší používat více zdrojů.

[Talk-cz] Jak porovnavat OSM XML (zeleznicni stanice a zast)

hanoj

Petr Dlouhý

Frettie

hanoj

Frettie

Petr Dlouhý

Tomáš Tichý

hanoj