Narzędzia użytkownika

Narzędzia witryny


talk:projects:osobistaheatmapa

Czyszczenie danych

Najbardziej zaintrygowały mnie błędne pomiary. Myślę, że skoncentruję się na automatycznym ich wykrywaniu i usuwaniu. Póki co mam na myśli taką metodę: Pomiędzy każdym punktem będę wyliczał „średnią prędkości” z jaką musiał bym się poruszać, przy takim przemieszczeniu. Jeśli taka prędkość będzie większa niż powiedzmy „200 km/h” to by oznaczało, że to przemieszczenie było prawdopodobnie niemożliwe. Trzeba wyliczyć takie przemieszczenia do i z punktu. Jeśli dany punk będzie miał dwie wartości powyżej tego progu to będzie się na 100% nadawał do wyrzucenia. Problem będzie natomiast jeśli tylko jeden kierunek będzie miał dużą prędkość a drugi nie. Czyli np. wro wro wro, san salvador, san salvador, san salvador, wro. Wtedy wiadomo, że coś jest nie tak, ale nie wiadomo czy poprawny jest bardziej wro czy san salvador. W każdym razie, dopiero po wywaleniu tych punktów zabierał bym się za dalsze analizy. - QuantumDamage

Ale to nie jest zbyt przekombinowane? Jeśli podzielimy punkty na w miarę szczegółowe (tj. bliskie sobie klasy) to błędy się same znajdą - bo będą w osobnej klasie, która jest na mapie w zupełnie innym miejscu. Problem, jaki widzę w Twoim pomyśle to to, że (znając ręczne GPSy) punkty o dwóch wartościach skrajnych będą relatywnie rzadko. Przykład: GPS się włącza i startuje (zaczytuje) pierwszy punkt w San Salvador. Zaczytuje drugi punkt w San Salvador, trzeci punkt w San Salvador, potem czwarty w Hiszpanii, piąty w Berlinie i szósty - poprawny - u Ciebie. Krótko mówiąc, podczas namierzania GPS zaczytuje punkty coraz bliżej pozycji, ale tylko w przypadku kiedy ma jasny sygnał. W przypadku problemów z łączem potrafi zaczytać kilka punktów w jednym miejscu. W powyższym przykładzie punkty „2” i „3” będą miały średnią prędkość w porządku (bo są wszak blisko siebie), ale de facto będą błędne. Skupiłbym się na średnich odległościach lub koordynatach geograficznych (np. ustalił, że z automatu ma wylatywać wszystko, co jest poza granicami Polski etc.) lub po prostu podzielił i odsiał ręcznie, na analizę wizualną. Wiem, że jest to mniej koszerne, ale za to bardziej skuteczne…Metodę „na prędkość” raczej odradzam, ale to Twoje dane :D - nycek

talk/projects/osobistaheatmapa.txt · ostatnio zmienione: 2014/07/31 16:42 przez nycek

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki