Data voor logistiek:
Waarom en welke data?
Het Simacan platform bevat een enorme verscheidenheid aan data, wij ontvangen namelijk data van verschillende partijen. Vervolgens creëert het Simacan platform ‘nieuwe data’ door al deze uiteenlopende data slim te combineren en hier wiskundige logica op los te laten. Dit creëert nog meer nieuwe inzichten.
In dit blogartikel gaan wij dieper in op welke data er precies gebruikt wordt en hoe, waarom de kwaliteit van data zo belangrijk is, wanneer is data echt bruikbaar voor analyses en de uitdagingen die je tegenkomt bij data processing en data analyses.
Welke data wordt door Simacan verwerkt en gegenereerd?
In eerdere blog artikelen schreven we al dat data op zichzelf weinig toegevoegde waarde en soms zelfs vrijwel onbruikbaar is. Waardevolle informatie ontstaat pas als de data wordt verwerkt, informatie of data uit meerdere bronnen met elkaar in verband brengen en analyseren. Maar met welke data werkt het Simacan platform?
Simacan ontvangt de volgende informatie van verschillende partijen: planningen, realisatie data en verkeersinformatie. Daarbij genereert het Simacan platform door middel van kunstmatige intelligentie (KI) "nieuwe data" zoals: (voorkeur)routes tussen en naar locaties met de bijbehorende afstanden en rijtijden, de verwachte aankomsttijden (ETA) en de gemeten aankomsttijden en vertrektijden.
Relevante inzichten die gegenereerd worden uit deze complete dataset zijn inzichtelijk op elk gewenst detailniveau. Het Simacan platform maakt hierin onderscheid tussen pre-trip (voor de rit), on-trip (tijdens de rit) en post-trip (na de rit). In dit blog gaan we alleen in op de data inzichten voor on-trip en post-trip.
On-trip kunnen transport operaties real-time gemonitord en gemanaged worden met het Simacan platform.
Post-trip data kan op verschillende manieren verkregen worden: 1. Ruwe data op ritniveau: via Simacan’s Realised Trip Service (onze push service) kan bijna alle ontvangen en gegenereerde data verkregen worden. Meer informatie > 2. Dashboard met inzichten van een transport operatie: denk aan operatie grootte, tijdigheid, accuraatheid van de planning en compleetheid van de geleverde data. Ritgegevens kunnen daarnaast gedownload worden, voor eventuele verdere analyse met andere tools. Meer over Transport Performance Monitor > 3. Kwaliteitsrapportage per rit op dagniveau: hierin worden de redenen van beperkte real-time data per rit inzichtelijk gemaakt. Meer informatie > 4. Historische ritgegevens: ritgegevens op stopniveau. Deze kunnen eveneens gedownload worden. Meer informatie > |
---|
Het Simacan platform biedt dus de mogelijkheid voor gebruikers om zelf alle ritgegevens te analyseren, maar ons platform biedt ook de helpende hand door middel van een gevisualiseerde weergave van uw data in een dashboard.
Kwaliteit van data
Voordat data voor analyses ten behoeve van het Simacan dashboard gebruikt kan worden, wordt eerst de kwaliteit van de data beoordeeld, deze moet namelijk aan bepaalde eisen voldoen. Zo wordt er gekeken naar de data beschikbaarheid en de data compleetheid. Incomplete data wordt namelijk niet gebruikt in analyses voor dit dashboard.
Door de beschikbaarheid, compleetheid en de tijdigheid van de data te controleren wordt de betrouwbaarheid van de data beoordeeld. Onjuiste data wordt zoveel mogelijk afgevangen en niet meegenomen voor analyses. Helaas is het onmogelijk om achter de exacte data waarheid te komen, hiervoor zou elke rit in werkelijkheid door mensen moeten worden waargenomen. Toch kan de data goed beoordeeld worden op betrouwbaarheid. In de loop van de jaren is namelijk ervaring opgedaan met hoe de beste inschattingen gemaakt kunnen worden om de meest betrouwbare data te verkrijgen. Dit gebeurt door onbetrouwbare data te filteren om zo de data te purificeren.
Wat is onbetrouwbare transport data?
De meest voorkomende reden waarom data onbetrouwbaar wordt en waarom filtering is gewenst, is dat de transportplanning niet overeenkomt met de realisatie in de werkelijkheid. Een andere reden is dat de ontvangen realisatie data afwijkingen vertoont of dat de door Simacan gemeten tijden afwijken van de realisatie.
Het komt regelmatig voor dat de planning niet overeenkomt met de realisatie. Soms is bijvoorbeeld de volgorde van stoplocaties, of stops, anders gepland dan gerealiseerd; een andere keer is een voertuig niet bij een locatie geweest die wel in de planning stond of is een voertuig ergens gestopt wat niet voorzien was. Ook komt het voor dat een rit na afronding alsnog is aangepast. Het wordt dan onduidelijk of de info voor of na de aanpassing correct is.
De ontvangen realisatie data bestaat onder andere uit GPS punten. Hiermee weten we waar een voertuig zich bevindt op welk tijdstip. Als de ontvangen locatie afwijkt van de werkelijkheid (je ondervindt dit vast zelf wel eens met je navigatie, je GPS punt bevindt zich naast de snelweg terwijl jij op de snelweg rijdt) weten we niet precies wanneer het voertuig op de plaats van bestemming aankomt of weer vertrekt. Ook kan er een vertraging optreden tussen het signaal vanaf de locatie en de ontvangst van dit signaal in het Simacan platform. Als dit gebeurt dan wordt er door het platform een inschatting van de locatie van het voertuig gemaakt.
Er zitten soms ook afwijkingen in de door Simacan gemeten tijden. Deze afwijkingen zijn vaak het gevolg van een onbetrouwbare planning of onbetrouwbare realisatie data. Dan meet het platform dat een voertuig vertrokken is, maar in werkelijkheid vertrok het voertuig pas minuten later. Hierdoor wordt de gemeten verblijftijd een stuk korter en de rijtijd langer dan de werkelijkheid. Als deze planning versus werkelijkheid erg grote verschillen tonen, worden ze uit de data gefilterd.
Daarnaast zijn er ook onderdelen van de rit die door zijn eigenschappen al minder betrouwbaar zijn. Zoals een voertuig dat start met een rit vanaf een distributiecentrum. We weten niet precies hoe laat dat voertuig op die locatie was, want het stond er al toen het begon aan de rit. We weten alleen hoe laat het vertrok van de locatie. Zo zijn er meerdere redenen voor afkeuring van de data.
Door de kwaliteit te beoordelen op de bovenstaande benoemde punten wordt incomplete en onbetrouwbare data eruit gefilterd. Hieruit volgt een dataset aan bruikbare data waarmee kloppende analyses kunnen worden gemaakt en ritgegevens kunnen worden weergegeven in het dashboard.
Waarom wordt data analyse steeds belangrijker?
De markt is aan het verschuiven, waarbij het enkele jaren terug vooral draaide om de real-time zichtbaarheid van een logistieke operatie, draait het nu steeds meer om het efficiënter maken van de operatie. Hiervoor zijn inzichten nodig, welke verkregen worden door ritdata te analyseren en te interpreteren.
Transport data kan voor verschillende doeleinden gebruikt worden. Denk bijvoorbeeld aan inzicht krijgen in de tijdigheid van operaties, de facturatie van operaties, of het verbeteren van de geplande verblijftijden op een locatie, maar natuurlijk ook de knelpunten snel kunnen herkennen en oplossen. Kortom, met behulp van data kunt u het aantal transportkilometers efficiënter en effectiever inzetten, maar toch levering aan uw klanten optimaliseren.
Welke problematiek speelt bij data-analyse voor transport en logistiek?
Incompleetheid of slechte kwaliteit van data kan zorgen voor onjuiste en onduidelijke resultaten. Ook misinterpretaties door de gebruikers van data kunnen een rol spelen in onjuiste analyses. Denk daarom goed na over de kaders of drempels waarbinnen uw data moet vallen om goedgekeurd te worden. Maar wat bedoelen we hier precies mee? We geven voor de duidelijkheid een aantal voorbeelden:
1. Moeten handmatig geannuleerde ritten ook meegenomen worden in de facturatie? En hoe zit het met ritten die niet geannuleerd zijn maar waarvan onduidelijk is of ze uitgevoerd zijn? 2. Is een voertuig op tijd op een locatie aangekomen als we 15:00 uur ingesteld hebben, maar we weten dat hij er om 14:55 uur nog niet was, maar om 15:05 uur wel? 3. Is een voertuig op tijd als het uiterlijk 15:00 uur bij een locatie moet zijn, maar dat om 15:00 uur geregistreerd is dat het in de buurt van de locatie is? 4. De gemiddelde verblijf- of stoptijd voor een locatie wordt bepaald aan de hand van de historisch gemeten verblijftijden. Stel, houdt de chauffeur van een voertuig regelmatig pauze op deze locatie, is het dan gewenst dat deze pauze meegenomen wordt in het bepalen van de gemiddelde verblijftijd? En is het een probleem dat een verblijftijd meegenomen wordt in een berekening, terwijl de meting 30 minuten afwijkt van de werkelijkheid? 5. Hoe kan geëvalueerd worden of de geplande rijtijd goed is als in de gemeten rijtijd ook wachttijden en pauzetijden zijn meegenomen? Terwijl in de geplande rijtijden dit niet meegenomen wordt? Etcetera... |
---|
Zo heeft iedere transportorganisatie zijn eigen kaders waarbinnen geopereerd moet worden. Deze kaders stelt u zelf in en zijn bepalend voor de uiteindelijke kwaliteit en dus bruikbaarheid van uw data.
Maar Simacan heeft niet voor niets een platform waarbinnen samenwerking met andere belanghebbende uit de leveringsketen gestimuleerd wordt. Kennisoverdracht en samenwerking vinden wij belangrijk en nodig. Wij helpen daarom graag onze gebruikers om de geleverde data goed te begrijpen om de juiste kaders in te kunnen stellen en zo misinterpretaties te voorkomen.
Waarom een kant en klaar dashboard?
Kan dat niet in Excel?
Naast interpretatie en analysering van data op eigen wijze kunnen Simacan gebruikers ook gebruik maken van onze Transport Performance Monitor, ons dashboard met uw transport data. Wij horen u denken, waarom een kant en klaar dashboard, kan ik dit niet gewoon zelf in Excel? Simacan gebruikers kunnen er natuurlijk voor kiezen om hun data zelf te gaan verwerken, maar hier is tijd en expertise voor nodig. Want een analyse in Excel kan lastiger te realiseren zijn, want het gaat om veel data….heel veel data! Dit past vaak niet in één Excel bestand. Voor deze hoeveelheden data heb je uitgebreide analyse tools nodig of er komt een stukje codering aan te pas.
Het combineren van data uit de verschillende bronnen kan daarbij lastig zijn. Daarnaast is de juiste interpretatie van de data zeer belangrijk, ook hier is weer tijd, kennis en ervaring voor nodig. Je moet bijvoorbeeld precies weten welke data velden je moet gebruiken om te zien of een voertuig op tijd is aangekomen. Je moet weten of de gemeten aankomsttijden kloppen. Daarnaast, als er aankomsttijden ontbreken, zal je moeten weten waarom ze ontbreken, voordat je ze er op een veilige wijze uit je analyse laat. Met andere woorden, de kwaliteit van de data speelt een zeer grote (!) rol bij de juiste interpretatie. Wanneer je dit allemaal op orde hebt, is de laatste stap het maken van visueel aantrekkelijke en vooral duidelijke figuren en diagrammen ook een belangrijke stap. Hoe creëer je deze zodat je gemakkelijk conclusies kan trekken?
Simacan begrijpt dat dit alles veel tijd en moeite, geld en expertise kost. Daarom proberen wij met u mee te denken en de eerste stappen alvast voor u te zetten met een kant en klaar dashboard. Wilt u meer weten over hoe Simacan u kan helpen? Neem dan contact met ons op.
Auteurs: Anne Siersema & Marije Gemmink (Simacan Data Scientists)