Veracell kehitti ratkaisun Electro Centerin tuoteluettelossa esiintyvien duplikaattituotteiden aiheuttamiin haasteisiin. Useat eri tuotekoodit – usein tiettyjä asiakkaita varten luodut – viittasivat samaan tuotteeseen, mikä heikensi datan laatua ja vaati huomattavasti manuaalista työtä tietojen yhdenmukaistamiseksi.
Python-algoritmi hyödyntää merkkijonojen vertailua ja klusterointia tuotekopioiden tunnistamiseen.
Yksinkertainen käyttöliittymä mahdollistaa analyysin suorittamisen ja lokitietojen tarkastelun vaivattomasti.
Ratkaisu vähentää merkittävästi manuaalista työtä ja tukee luotettavaa tiedon puhdistusta ja siirtoa.
Duplikaattituotteiden tunnistamiseksi kehitettiin uudelleenkäytettävä Python-pohjainen algoritmi, joka hyödyntää sarakkeiden välistä datan yhdistämistä, merkkijonojen vertailua (fuzzy matching) ja hierarkkista klusterointia. Algoritmin tueksi luotiin myös yksinkertainen käyttöliittymä, jonka avulla analyysin voi suorittaa helposti ja tarkastella prosessin aikana syntyviä lokitietoja.
Ratkaisu tehostaa Electro Centerin tuotetiedon hallintaa. Työkalu tunnistaa ja ryhmittelee duplikaattituotteet järjestelmällisesti, säästää huomattavasti aikaa joka aiemmin kului manuaaliseen etsintään ja tarjoaa luotettavan pohjan tiedon puhdistukselle ja siirtoprosesseille.
Nämä onnistumiset ovat vain jäävuoren huippu. Muutetaan yhdessä ”mitäpä jos” tulevaisuudeksi, josta uskallamme unelmoida.
Ota yhteyttä