[Talk-cz] Seznam všech katolických kostelů s bohoslužbami s UUIDs
Vlákno 21.11. - 23.11.2016, počet zpráv: 6
Dobrý den,
dostal jsem od správce serveru https://bohosluzby.cirkev.cz/
(který sdružuje data o bohoslužbách od všech českých diecézí)
seznam všech katolických kostelů v českých s jejich souřadnicemi
a jednoznačným identifikátorem. Původně jsem chtěl získat
přístup přímo do jejich databáze, ale to mi odmítli s tím, že
změny jsou příliš časté a také jim vadilo, že nemají organizaci
kterou by si mohli smluvně zavázat k updatování. Na druhou
stranu, ve chvíli, kdy máme GUID, tak existuje jednoznačné
mapování https://bohosluzby.cirkev.cz/kostel/GUID, které
odkazuje na stránku kostela se všemi údaji (stránka je
responsive, takže funguje i v mobilu), takže mám-li takovýto
záznam v tabulce:
Guid: 73E95D92-EACA-4ADF-9AA2-4B7DFF49C75E
NAME: farní kostel Proměnění Páně
Location: 49.4146025N, 14.6581681E
Latitude: 49.4146025
Longitude: 14.6581681
Obec: Tábor
CastObce Tábor
URL
https://bohosluzby.cirkev.cz/kostel/73E95D92-EACA-4ADF-9AA2-4B7DFF49C75E
vede na stránku s údaji o tomto kostele v Táboře.
Takže předpokládám, že nejlepší cestou je jednak přidat do
nějakého ad-hoc attributu (něco jako máme ref:ruian:*) ten GUID,
a jednak bych pouvažoval jestli by výše uvedené URL nebylo dobré
přidat jako standardní URL kostela (v attributu website). Tiše
si také myslím, že úspěšné začlenění těchto dat do OSM by
vylepšilo úroveň důvěry v OSM ze strany církve, takže by bylo
možné nějak dále pokračovat ve spolupráci.
Představoval jsem si algoritmus nějak následně, ale dříve nežli
vůbec budu uvažovat o provedení nějaké práce, natož o emailu do
imports na openstreetmap.org poprosil bych o feedback (případně
o navrhnutí nějakých nástrojů, kterým je toto možné realizovat;
profesionálně jsem programátor v Pythonu, takže to by mi
vyhovovalo nejvíce, ale jsem ochoten se přizpůsobit).
1) ze vstupního seznamu vyber jeden záznam
2) najdi v OSM bod se zadanými souřadnicemi (zde
http://www.openstreetmap.org/search?query=49.4146025N%2C%2014.6581681E#map=19/49.41460/14.65863&layers=N,
který nalezne
http://www.openstreetmap.org/#map=19/49.4146025/14.6581681 )
3) najdi ve vzdálenosti (řekněme) 100m od daného bodu všechny
objekt amenity:place_of_worship (zde
http://www.openstreetmap.org/way/29201935)
4) jestliže je nalezen a jestliže name odpovídá názvu ze seznamu
(funkce „odpovídá“ může obsahovat nějakou normalizaci,
expanzi sv. na regexp svat[ýá] nebo něco podobného), tak ho
přidej spolu s jeho OSM ID do seznamu k přidání
5) jestliže žádný objekt není nalezen (nebo name nalezeného
objektu neodpovídá názvu ze seznamu), přidej záznam do
seznamu nenalezených objektů.
Seznam nenalezených objektů je potom asi třeba projít ručně
a problémy vyřešit, ale doufejme, že seznam nebude moc
gigantický.
Následný import seznamu k přidání by probíhal asi takto:
1) vyber jeden záznam
2) k objektu OSM ID přidej ref:czrkckostel:guid rovno GUID
atributu ze seznamu
3) pokud atribut website v OSM je prázdný nebo je jeden ze
generických (zejména URL z https://katalog.apha.cz/web/,
která jsem do OSM přidával ručně), nahraď ho URL
https://bohosluzby.cirkev.cz/kostel/${GUID}.
Souhlas se začleněním seznamu do OSM mám (minimálně v emailu).
Co vy na to?
Hezký den,
Matěj
--
https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Monday, December 9th. We skip the bus tour of Stockholm to attend
the economics lecture. Our guest status is again good for front
row seats. We hear about the theory of auctions. There are
integrals and derivatives. It's like physics except physics
works.
On 2016-11-21, 10:58 GMT, Matěj Cepl wrote:
zobrazit citaci
> dostal jsem od správce serveru https://bohosluzby.cirkev.cz/
> (který sdružuje data o bohoslužbách od všech českých diecézí)
> seznam všech katolických kostelů v českých s jejich
> souřadnicemi a jednoznačným identifikátorem. Původně jsem
Zapomněl jsem dodat … jenom pro pořádek, zcela nezpracované
surové tabulky jsou na
https://mcepl.fedorapeople.org/tmp/kostely_XLS.zip
Matěj
--
https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
Dne 21.11.2016 v 11:58 Matěj Cepl napsal(a):
zobrazit citaci
> 4) jestliže je nalezen a jestliže name odpovídá názvu ze seznamu
> (funkce „odpovídá“ může obsahovat nějakou normalizaci,
> expanzi sv. na regexp svat[ýá] nebo něco podobného), tak ho
> přidej spolu s jeho OSM ID do seznamu k přidání
Soundex by mohl být lepší než regxep
https://pypi.python.org/pypi/soundex/
nebo
https://pypi.python.org/pypi/Fuzzy
Mirek
Zdravím,
Dne 21.11.2016 v 11:58 Matěj Cepl napsal(a):
zobrazit citaci
> a jednak bych pouvažoval jestli by výše uvedené URL nebylo dobré
> přidat jako standardní URL kostela (v attributu website).
Ano, pokud tam už není něco jiného. Osobně bych odkazoval především
stránky farnosti a toto dal do opening_hours:url=*, pokud nastane
kolize. Aktuálnost údajů mimo města bývá slabá, jak jsem si vyzkoušel.
Na úrovni farností bývá větší základna "gramotných" kteří dokážou udělat
web a mají zájem aby to tam bylo... myslím...
Hezký den!
Vláďa
On 2016-11-22, 09:34 GMT, Vladimír Slávik wrote:
zobrazit citaci
> Ano, pokud tam už není něco jiného. Osobně bych odkazoval
> především stránky farnosti a toto dal do opening_hours:url=*,
> pokud nastane kolize.
To by bylo skvělé, ale používá nějaký software tento atribut?
zobrazit citaci
> Aktuálnost údajů mimo města bývá slabá, jak jsem si vyzkoušel.
> Na úrovni farností bývá větší základna "gramotných" kteří
> dokážou udělat web a mají zájem aby to tam bylo... myslím...
Tohle by snad teoreticky mělo být zcela nejaktualizovanější,
protože faráři by měli hlásit změny na biskupství. Samozřejmě,
pokud to předtím pan farář sám opraví na webu, tak je to ještě
rychleji.
Best,
Matěj
--
https://matej.ceplovi.cz/blog/, Jabber: mcepl na ceplovi.cz
GPG Finger: 3C76 A027 CA45 AD70 98B5 BC1D 7920 5802 880B C9D8
A day without sunshine is like night.
A non-text attachment was scrubbed...
Name: [žádný popis není k dispozici]
Type: multipart/mixed
Size: 2 bytes
Desc: [žádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20161123/ad73a7c8/attachment.bin>
------------- další část ---------------
A non-text attachment was scrubbed...
Name: [žádný popis není k dispozici]
Type: application/pgp-signature
Size: 836 bytes
Desc: [žádný popis není k dispozici]
URL: <https://lists.openstreetmap.org/pipermail/talk-cz/attachments/20161123/ad73a7c8/attachment.sig>
« zpět na výpis měsíce