blogy logo
login PRIHLÁS SA
BLOG deadawp
ČLÁNKY
DISKUSIE
3
SLEDUJETE BLOG
Programátor
deadawp



Overenie kradnutých vozidiel - Arduino + Ethernet / ESP32 / ESP8266
pridal deadawp 11.11. 2020 o 16:11



Prehlásenie: Predmetom článku je ukázať možnosť web scrapingu mikrokontrolérovou platformou na webstránkach poskytujúcich verejné údaje. Všetky údaje stiahnuté z webovej stránky bežia iba v RAM pamäti mikrokontroléra. Nie sú ukladané do databáz, pamätí tretích strán. Údaje v RAM pamäti existujú iba po dobu výpisu na UART rozhranie.

 

Stránka https://www.minv.sk/?odcudzene-mot-vozidla Ministerstva vnútra Slovenskej republiky poskytuje verejné údaje informatívneho charakteru o kradnutých vozidlách. Využíva HTML formulár, do ktorého je možné zadať EVČ (Evidenčné číslo) vozidla, alebo jeho VIN kód.

Po spracovaní formulára je výstupom informácia o počte nájdených záznamov: Podmienke vyhovuje: 0 záznamov, prípadne Podmienke vyhovuje: 1 záznam. V prípade jedného záznamu sa dané EVČ, alebo VIN kód nachádza v databáze kradnutých vozidiel, stránka vypíše aj ďalšie doplnkové informácie o vozidle a to:

  • Druh vozidla
  • Značka
  • Obchodný názov
  • Farba
  • Číslo duplikátu
  • Štát registrácie
  • VIN
  • Dátum a čas odcudzenia od
  • Dátum a čas odcudzenia do

Pre získanie týchto informácii môžeme využiť mikrokontróler ako parser a zároveň scraper. Parser dokáže prečítať HTML stránku po jednotlivých riadkoch a scraper z nich dokáže získať konkrétne informácie. Mikrokontroléry, ktoré využijeme (Arduino + Ethernet, ESP8266, ESP32) budú stránku používať rovnako, ako človek prostredníctvom prehliadača, ktorý do formulárov zadá informáciu pre hľadanie v podobe EVČ, alebo VIN kódu a načíta si výstup.

V prvom kroku je nutné vyhotoviť HTTP spojenie, prípadne šifrovaný variant - HTTPS. Nakoľko Arduino v spojení s Ethernet modulom / shieldom nepodporuje HTTPS spojenie, vzorovo si ukážeme pripojenie iba pre HTTP pre všetky tri spomenuté platformy . Od mája roka 2020 je na stránke dostupné aj HTTPS variant. Pre toto spojenie je nutné použiť fingerprint certifikátu webservera v SHA1 formáte pre mikrokontróler ESP8266, alebo Root CA certifikát v .pem formáte (CA Disig Root R2) pre mikrokontróler ESP32.

Pre spojenie je možné využiť vstavané príklad pre Webclienta, ktorý umožňuje vytvoriť GET request a získať informácie zo stránky. Pri bližšej analýze kódu HTML stránky je zrejmé, že formulár prijíma dáta POST metódou. Pre EVČ využíva parameter ec, pre VIN kód parameter vin.

Pôvodný sketch je tak nutné poupraviť na prenos dát POST metódou a pridať parameter s hodnotou, ktorú budeme posielať. Potrebné je tiež poupraviť Content-Type na form encoded. Dĺžka requestu závisí od dĺžky payloadu, ktorý posielame. Premenná my_datas obsahuje dáta s EVČ, napríklad "AA123ZZ".

Odpoveďou webservera (v response) je HTTP hlavička a celá HTML stránka, ktorú je možné parsovať po riadkoch a vykonať akciu. V prípade, že mikrokontróler narazí na riadok HTML stránky obsahujúci hodnotu Podmienke vyhovuje: 0 záznamov, informuje mikrokontróler o tom, že po vozidle nie je vyhlásené pátranie a ingoruje zvyšok HTML stránky.

V prípade, že narazí scraper na hodnotu Podmienke vyhovuje: 1 záznam, vypíše o tejto skutočnosti aj informáciu na UART monitor a informuje o hľadanom vozidle. Následne scraper dokáže zo zdrojového kódu vytiahnuť spomínané informácie o vozidle, ktoré sú na HTML stránku vypísané. Scraper očakáva informáciu na určitých miestach zdrojového kódu v HTML tabuľke v jednotlivých riadkoch tabuľky na základe preddefinovaných textov, ktoré obsahujú. 

Aby bolo možné zadávať rôzne EVČ na overenie priamo počas bežiacej aplikácie mikrokontroléra, finálna aplikácia využíva UART monitor aj pre vstup a tým umožňuje načítanie informácie o EVČ, ktoré chce používateľ preveriť. Po prijatí dát mikrokontróler vykoná jednorázový request na predmetnú HTML stránku, kde spustí formulár so zadaným EVČ (odosielaný parameter ec s hodnotou EVČ). 

Zároveň je však možné zadať aj viacero EVČ. Mikrokontróler načítava EVČ po koniec riadia, t.j. po ukončovací znak  '\n'. Ukončenie riadku je nastavené na zadaný reťazec automaticky. Zadaním EVČ v tvare: AA123AA\nXX123XX\nYY123YY\nZZ123ZZ je tak možné zadať 4 EVČ zároveň a mikrokontróler vykoná 4 samostatné requesty s každým zo zadaných EVČ jednotlivo. UART má samostatný buffer. Teda, informáciu príjme aj v príapade, že UART neobsluhuje programovo (neustálym načítaním). 

Pri Arduine Uno má UART buffer veľkosť 64B. Celkovo je tak možné zadať 7 EVČ s ukončovacími znakmi zároveň. Platforma ESP8266 má buffer veľkosti 128B a ESP32 dokáže emulovať buffer softvérovo až na veľksoť 1024B. Zadať je okrem štandardných EVČ aj iné, napríklad C, F značky. Odozva systému závisí aj od použitej platformy. Arduino s Ethernet shieldom stiahne spracovať celú HTML stránku za cca 7 sekúnd od vykonania requestu (načíta 458 riadkov kódu postupne riadok-po-riadku, ktoré prepisuje v RAM pamäti v dynamickej premennej). 

Fragment zdrojového kódu, - scraping Druhu vozidla (osobné, nákladné vozidlo) z riadku HTML kódu:

Informácia z HTML stránky je vypísané a jej premenná zaniká ukončením podmienky. HTML riadok sa prepisuje v slučke cyklickom načítaní. Projekt je možné využiť napríklad s platformou ESP-CAM, ktorá je vybavená kamerou. Načítaním EVČ v reálnom čase je možné vytvoriť POST požiadavku a vypísať si prípadnú informáciu o odcudzení vozidla priamo v premávke. Tento článok má výlučne informatívny charakter!

 

Základom projektu je WebClient program, ktorý dokáže vytvoriť TCP spojenie po HTTP a vypísať payload webservera s ktorým je možné pracovať a cez parser si orezať potrebnú časť z HTML kódu. Testovací program je dostupný na Githube v repozitári projektu pre ESP8266 a ESP32 (implementácia pre Arduino + Ethernet nie je jeho súčasťou): 
https://github.com/martinius96/WebScraper-ESP

Testovacie dáta pre vstup do mikrokontroléra boli použité zo zdroja: 
https://www.cas.sk/spravy/krimi/kradeze-aut/ a https://www.hakasystem.eu/kradeze-automobilov



Prístupov 7198
Kvalita článku
hlasov 0

PRÍSPEVKY
SLEDOVAŤ
Prosím prihláste sa pre možnosť pridania komentáru.
Prihláste sa, alebo použite facebook login facebook login
ĎALŠIE ČLÁNKY V BLOGU
Oplatí sa teplovodivá pasta z Aliexpress...
[ 4.4.2024] (príspevkov 0)
Recenzia 3D podznačky BEZ KOMPRESE
[ 4.4.2024] (príspevkov 0)
GTA IV fix spustenia na Windowse 10 N
[ 24.3.2024] (príspevkov 0)
RFID DOMINATOR licencia na predaj
[ 4.1.2024] (príspevkov 0)
ATtiny85 Digispark - programovanie, použ...
[ 28.12.2023] (príspevkov 0)
Prečo by som si už nekúpil ESPD-35 2.0 /...
[ 26.12.2023] (príspevkov 0)
ATtiny85 - programovanie Arduino as ISP
[ 19.12.2023] (príspevkov 0)
MasterTherm - webscraper ESP32
[ 25.11.2023] (príspevkov 0)
RFID DOMINATOR 2.0 - rozdiely s 1.0
[ 15.11.2023] (príspevkov 0)
Rozšírená realita (AR) - IoT dashboard
[ 29.10.2023] (príspevkov 0)