[Talk-cz] Jak porovnavat OSM XML (zeleznicni stanice a zast)
Vlákno 4.1. - 5.1.2011, počet zpráv: 8
Ahoj,
rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich
stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich
cisel, korekce nazvu, duplicity atd...
Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne
porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo
interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru
automatizace ma, ale ztraci se cast dat OSM)...
Nevim, poradite?
hanoj
[1] http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51
[2] http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku
Ahoj,
kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal
čistý seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil
vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v
textovém editoru jen pomocí funkcí nahrazování). Potom už stačí použít
sort (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).
On Tue, 04 Jan 2011 10:52:39 +0100, hanoj <ehanoj na gmail.com> wrote:
zobrazit citaci
> Ahoj,
> rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich
> stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich
> cisel, korekce nazvu, duplicity atd...
>
> Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne
> porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo
> interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru
> automatizace ma, ale ztraci se cast dat OSM)...
>
>
> Nevim, poradite?
>
> hanoj
>
>
>
> [1]
> http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51
> [2]
> http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
--
Petr Dlouhý
No, z wikipedie se to buď dá vytáhnout z nějakého dumpu dat (dá se
stáhnout, ale je opruz s ním pracovat) nebo to grabovat přímo z
wikipedie (např. pomocí nějakého bota, viz Wikipedia:Bots na en wiki),
ale i to je opruz.
J.
2011/1/4 Petr Dlouhý <petr.dlouhy na email.cz>:
zobrazit citaci
> Ahoj,
>
> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý
> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil
> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v
> textovém editoru jen pomocí funkcí nahrazování). Potom už stačí použít sort
> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).
>
> On Tue, 04 Jan 2011 10:52:39 +0100, hanoj <ehanoj na gmail.com> wrote:
>
>> Ahoj,
>> rad bych udelal vzajemnou korekturu techto dvou zdroju o zeleznicnich
>> stanicich: osm[1] a wikipedie[2], tj. predevsim prenos evidencnich
>> cisel, korekce nazvu, duplicity atd...
>>
>> Mate nejaky postup/nastroj jak potom tyto dva zdroje efektivne
>> porovnavat/upravovat? Pracovat s XSLT moc neumim a je to malo
>> interaktivni (takova excel tabulka uz tu interaktivitu i jistou miru
>> automatizace ma, ale ztraci se cast dat OSM)...
>>
>>
>> Nevim, poradite?
>>
>> hanoj
>>
>>
>>
>> [1]
>> http://www.informationfreeway.org/api/0.6/*%5Brailway=halt|station%5D%5Bbbox=12,48,19,51
>> [2]
>> http://cs.wikipedia.org/wiki/Seznam_%C5%BEelezni%C4%8Dn%C3%ADch_stanic_v_%C4%8Cesku
>>
>> _______________________________________________
>> Talk-cz mailing list
>> Talk-cz na openstreetmap.org
>> http://lists.openstreetmap.org/listinfo/talk-cz
>
>
> --
> Petr Dlouhý
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
--
S pozdravem,
Jirka Sedláček
---
jirisedlacek na gmail.com
zobrazit citaci
> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý
> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil
> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v
> textovém editoru jen pomocí funkcí nahrazování).
*** to bych si dokazal predstavit, mas na neco takoveho mustr?
zobrazit citaci
> Potom už stačí použít sort
> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).
*** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku
vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML?
diky
hanoj
2011/1/4 hanoj <ehanoj na gmail.com>:
zobrazit citaci
>> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal čistý
>> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil
>> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo v
>> textovém editoru jen pomocí funkcí nahrazování).
> *** to bych si dokazal predstavit, mas na neco takoveho mustr?
>
>
>> Potom už stačí použít sort
>> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).
> *** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku
> vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML?
>
Z pole?
zobrazit citaci
>
>
> diky
> hanoj
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
>
--
S pozdravem,
Jirka Sedláček
---
jirisedlacek na gmail.com
On Tue, 04 Jan 2011 11:29:54 +0100, hanoj <ehanoj na gmail.com> wrote:
zobrazit citaci
>> kdybych to chtěl udělat rychle a jednoduše tak bych z Wikipedie udělal
>> čistý
>> seznam (číslo, jméno na každém řádku) zastávek, a to samé se pokusil
>> vygenerovat z OSM XML (pomocí XSLT, nebo SEDu, případně by to možná šlo
>> v
>> textovém editoru jen pomocí funkcí nahrazování).
> *** to bych si dokazal predstavit, mas na neco takoveho mustr?
Jo, něco mám. Posílám XSLT, které používám ke kontrole duplicit mezi
cyklotrasami - vygeneruje seznam "ref" cyklistických tras. Neměl by to být
problém upravit:
<xsl:stylesheet version="2.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" indent="no"/>
<xsl:template match="/osm">
<xsl:apply-templates select="relation">
<xsl:sort select="@id" data-type="number"/>
</xsl:apply-templates>
</xsl:template>
<xsl:template match="relation[tag/@v = 'bicycle']">
<xsl:value-of select="tag[@k = 'ref']/@v"/>
<xsl:text>
</xsl:text>
<!--
<xsl:text> </xsl:text>
<xsl:value-of select="@id"/>
<xsl:text>
</xsl:text>
-->
</xsl:template>
<xsl:template match="*">
</xsl:template>
</xsl:stylesheet>
zobrazit citaci
>
>
>> Potom už stačí použít sort
>> (nebo seřazení v tabulkovém procesoru) a diff (vimdiff).
> *** ale jak efektivne tento vysledek tj. diff nebo upravenou tabulku
> vratit do vychoziho zdroje? Do wiki je to snadne, ale do OSM XML?
>
Asi by neměl být problém vygenerovat seznam zastávek, které mají stejné
číslo, ale jmenují se jinak (nebo naopak stejná jména a jiná čísla).
Případně zastávek, které v jednom ze seznamů chybí. Nebo také seznam
zastávek u kterých v OSM chybí číslo, ale dají se najít ve Wiki podle
jména.
Neznám lepší způsob, než potom z daného seznamu vygenerovat OSM XML s
danými změnami, nejlépe asi pomocí XSLT.
zobrazit citaci
>
>
> diky
> hanoj
>
> _______________________________________________
> Talk-cz mailing list
> Talk-cz na openstreetmap.org
> http://lists.openstreetmap.org/listinfo/talk-cz
--
Petr Dlouhý
Ahoj,
železniční stanice a zastávky generuji čas od času na tuhle stránku:
http://wiki.openstreetmap.org/wiki/%C5%BDelezni%C4%8Dn%C3%AD_stanice_a_zast%C3%A1vky_v_%C4%8CR
Porovnávání dělám jen podle názvů stanic, čísla by se dala doplnit.
Používám na to přiložený pythoní skript. Je to jenom taková rychlovka, ale
třeba se bude někomu hodit.
Jinak pozor na Wikipedii, jsou tam i neexistující stanice a zastávky, takže
je vždycky lepší používat více zdrojů.
TT
------------- další část ---------------
HTML příloha byla odstraněna...
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20110104/47a662fd/attachment.html>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: osmstations.py
Type: application/octet-stream
Size: 5644 bytes
Desc: [žádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20110104/47a662fd/attachment.obj>
Diky vsem za rady, zkusim si s tim o vejkendu pohrat.
hanoj
2011/1/4 Tomáš Tichý <t.tichy na post.cz>:
zobrazit citaci
> Ahoj,
> železniční stanice a zastávky generuji čas od času na tuhle stránku:
> http://wiki.openstreetmap.org/wiki/%C5%BDelezni%C4%8Dn%C3%AD_stanice_a_zast%C3%A1vky_v_%C4%8CR
>
> Porovnávání dělám jen podle názvů stanic, čísla by se dala doplnit.
> Používám na to přiložený pythoní skript. Je to jenom taková rychlovka, ale
> třeba se bude někomu hodit.
> Jinak pozor na Wikipedii, jsou tam i neexistující stanice a zastávky, takže
> je vždycky lepší používat více zdrojů.
« zpět na výpis měsíce