Projekt TAČR:
Metodika identifikace kritických úseků pozemních
komunikací v ČR pomocí GIS analýz dopravních nehod

Metoda identifikace shluků dopravních nehod

Identifikace kritických míst spočívá v identifikaci úseků komunikací, na kterých dochází k lokálnímu zvýšení počtu dopravních nehod.

Klasické metody identifikace rizikových úseků (tzv. black spots) pracují s agregovanými daty a pouze hodnotí bezpečnost úseku komunikace jako celku. Již od roku 2006 zaznamenává policie ČR ke každé dopravní nehodě její geografickou polohu pomocí GPS přijímačů. K dispozici jsou tedy podrobné údaje o lokalizaci dopravních nehod, které umožňují přesnou identifikaci kritických míst v jemnějším měřítku, než jaké předpokládají běžně používané metody. Většina metod prostorového shlukování, které tento problém řeší, však naráží na základní limitaci – jejich restrikci na dvojrozměrný prostor, kdežto dopravní nehody jsou vázány na dopravní síť, tedy na jednorozměrný prostor.

Zde navržená metoda využívá tzv. jádrového odhadu hustoty k identifikaci shluků - lokalit se zvýšenou hustotou dopravních nehod - jejichž statistická signifikance je pak hodnocena pomocí Monte Carlo simulací.

Aplikace jádrového odhadu hustoty na linii

Je dán silniční úsek délky L, na kterém se vyskytují dopravní nehody ve vzdálenostech (X1,X2, …,Xn) od počátku úseku (viz obrázek 1). Úkolem je zjistit, zda se dopravní nehody na úseku shlukují, a určit, kde se případné shluky na úseku nacházejí.

girosaf_obr1

Obrázek 1: Silniční úsek délky L s dopravními nehodami v bodech X1, X2, ..., Xn.

Předpokládáme, že dopravní nehody mají náhodné rovnoměrné rozdělení na intervalu <0; L>. Tento předpoklad označíme jako hypotézu H0. Budeme testovat platnost hypotézy H0 proti alternativě, že se dopravní nehody shlukují, pomocí metody jádrového odhadu hustoty.

Popis metody JOH

Na počátku je nutné zvolit typ jádrové funkce K(x) a velikost tzv. okna d. Za jádrovou funkci se často volí Gaussova křivka nebo její aproximace.

Domníváme se, že velikost a tvar okna by měly vyjadřovat rozsah nejistoty polohy DN. V případě Gaussovy funkce však jádro zasahuje celou reálnou osu. To by znamenalo, že DN jsou ovlivněny, i když v některých místech velmi málo, celým úsekem a ne jen svým okolím. Z tohoto důvodu byla pro analýzu zvolena za jádrovou funkci tzv. Epanechnikova kvadratická funkce, která začíná i končí přímo na rozsahu okna (viz obrázek 2, Gaussovo jádro černě, Epanechnikovo šedě).

girosaf_obr2

Obrázek 2: Srovnání Gaussova a Epanechnikova jádra

 Metoda JOH pracuje tím způsobem, že do každého bodu Xi, ve terém se stala nehoda, je umístěna jádrová funkce, potom jsou všechny tyto funkce sečteny a výsledek je vydělen počtem nehod, aby se zajistila vzájemná srovnatelnost funkcí na úsecích s různým počtem nehod.

Výběr jádra nemá na výsleky takový vliv jako volba velikosti okna. V literatuře se uvádí velikost okna od 50 m pro prostředí měst až po 500 m na dálnicích. Menší velikosti okna mají za následek výraznější lokální shlukování, někdy však mohou potlačit globální vzory, které jsou lépe patrné při vyšších hodnotách velikosti jádra. Pro účely analýzy bylo zvoleno jádro 100 m.

Princip statistického testování metodou JOH

Cílem analýzy je rozhodnout o shlukování dopravních nehod a určit, kde se případné shluky nacházejí. Co však znamená, že dopravní nehody tvoří shluk? Definice se mohou lišit a v tomto případě budou hledána taková místa na komunikacích, ve kterých jádrový odhad dosahuje svého maxima. Za shluk považujeme část silnice v okolí tohoto lokálního maxima.

Za významný shluk považujeme takový shluk, v němž je hodnota funkce jádrového odhadu významně vyšší, než očekávaná hodnota podle hypotézy H0, tedy hodnota hustoty rovnoměrného rozdělení. Ke zjištění této hodnoty je použito Monte Carlo simulací.

Metoda Monte Carlo

Metoda Monte Carlo byla vyvinuta již ve 40. letech Johnem von Neumannem a Stanislavem Ulamem v Los Alamos a sloužila k matematickým výpočtům, které by standardní, deterministickou, cestou nebylo možno provést. Původně měla být metoda udržena v tajnosti, a tak dostala své krycí jméno „Monte Carlo“. V 50. letech začala metoda nacházet uplatnění i v dalších oblastech přírodních věd (např. fyzika, chemie) a postupně se tak rozšířila a zpopularizovalo se její použití.

Poněvadž je v dnešní době metoda Monte Carlo široce využívána a často modifikována „na míru“ různým problémům, neexistuje její jednotná definice. Zjednodušeně řečeno se jedná o postup využívající opakovaných náhodných simulací za účelem určit vlastnosti či průběh nějakého jevu.

Stanovení hladiny významnosti

Naší snahou je určit konstantu h, což je sledovaná vlastnost náhodného jevu „rozmístění DN na úseku komunikace“.

Máme-li pevně zadanou délku úseku L, počet nehod na úseku n a hladinu významnosti testu (zpravidla se volí hladina významnosti 5%), můžeme konstantu h odhadnout pomocí metody Monte Carlo následovně:

  1. Vygenerujeme n bodů z náhodného rovnoměrného rozdělení na intervalu <0; L>
  2. Pro takto vygenerované body vypočteme jádrový odhad hustoty

Provedeme dostatečný počet opakování bodů 1 a 2 (například 1000), čímž získáme 1000 odhadů hustoty dopravních nehod za předpokladu jejich náhodného rozdělení

  1. Určíme kvantil ze všech simulací odpovídající hladině významnosti (pro hladinu 5 % to bude 95% kvantil)
  2. Střední hodnotu tohoto kvantilu pro všechny body v intervalu <0; L> stanovíme jako hladinu významnosti

Uvedený postup je demonstrován na obrázku 3. šedě jsou jednotlivé simulace jádrového odhadu hustoty, černě je hustota vypočtená z reálných dat a čárkovaně je označena hladina významnosti.

girosaf_obr3

Obrázek 3: Princip stanovení hladiny významnosti a identifikace významných shluků

Pokud pomocí výše popsané metody zjistíme, že vypočtená křivka hustoty vystoupí nad hladinu h, lokalizujeme tuto část jako významný shluk.

Síla shluku

Síla statisticky významných shluků lze kvantifikovat jako poměr výšky lokálního maxima jádrové funkce k celé výšce v daném bodě. Teoreticky nejvyšší hodnota se bude zespoda blížit k 1,0.

Síla shluku je závislá na délce úseku (při stejném rozmístění nehod se síla s větší délkou úseku zvětšuje) a na počtu nehod (přidávání nehod mimo shluk sílu shluku snižuje). To je demonstrováno na obrázcích 4 a 5, kde po přidání tří, respektive pěti nehod na křižovatky na krajích úseku, identifikovaný shluk zaniká, jeho význam je zastřen výraznějším shlukem na krajích úseku.

 girosaf_obr45

Obrázky 4,5: Vliv absolutního počtu nehod na identifikaci shluku

Omezení metody

Omezení metody plyne ze skutečnosti, že se zabývá pouze vzorem rozdělení dopravních nehod, nikoli jejich počtem. Tato metoda tedy není schopná určit, zda je daný úsek nebezpečný jako celek, jen dokáže identifikovat ty jeho části, kde dochází k nahloučení nehod takovému, že odporuje předpokladu náhodného rovnoměrného rozdělení. Pokud se na daném úseku bude vyskytovat velký počet nehod, které však budou rovnoměrně rozdělené, nebude na úseku identifikován shluk, naproti tomu na úseku s relativně malým počtem nehod shluk být identifikovám může, pokud se tyto nehody nacházejí blízko u sebe, viz obrázky 6 a 7.

girosaf_obr56

Obrázky 6,7: Vliv vzájemné polohy nehod na identifikaci shluků

Závěr

Byla představena metoda pro identifikaci shluků dopravních nehod na komunikacích. Metoda je založena na výpočtu jádrového odhadu hustoty, který v kombinaci s Monte Carlo simulacemi poskytuje objektivní způsob hodnocení tendence ke shlukování, včetně přímé identifikace shluků. Tuto metodu lze tedy použít jak k testování globálního sklonu ke shlukování, tak i k identifikaci konkrétních shluků. Pro každý shluk je možné vypočíst jeho sílu, udávající, nakolik je předpoklad náhodnosti porušen. Kombinace síly shluku s dalšími údaji, jako jsou délka shluku a počet nehod ve shluku může poskytnout podstatné informace pro správce komunikací a organizace působící v oblasti silniční bezpečnosti. Například pro účely investic do infrastruktury bude důležité najít taková místa, kde dochází k významnému shlukování, děje se zde velké množství nehod (a tedy existuje největší předpoklad snížení nehodovosti) a zároveň se jedná o co nejkratší úseky, tedy investice budou co nejnižší.

Ačkoli byla metoda navržena pro účely identifikace kritických míst z hlediska dopravní nehodovosti, lze ji využít obecně pro identifikaci shluků bodových jevů na linii, a to v oblastech tak rozmanitých, jako jsou energetika (místa častého porušení produktovodů), ekologie (shluky výskytů druhů organismů podél řek/ekotonů), archeologie (vyskytují se sídla podél historických cest v pravidelných intervalech?), kriminalita (místa častých loupeží) a další.

řešitelé projektu

poskytovatelé podpory

Logo: Technologická agentura České republiky

 

Logo> Alfa

    kontakty
frantisek.vomacka@cdv.cz