Az adat az új olaj
Internet a tanórán - 2019. április 8.
A címben hangoztatott állítás már-már közhellyé kezd válni. Tény, hogy egyre több olyan eszközünk van, ami lehetővé teszi korábban elképzelhetetlen tömegű adat feldolgozását. Eljött a big data korszaka és az adatbányászat jövedelmezőbb, mint az olajfúrás (sőt, ma már az olajfúrás sincs meg a nagy adatelemzések nélkül, ami segít eldönteni, hol érdemes fúrni). Érdekes kérdés, hogy vajon ennek az ismerete hol fér be a klasszikus tantárgyakba, talán a földrajzba vagy az informatikába, esetleg a matematikába? Ezt sajnos most nem fogjuk eldönteni, de minden esetre mutatunk pár nagyszerű eszközt, amit kifejezetten arra találtak ki, hogy diákokat bevezessen az adatelemzés és feldolgozás világába. Az MIT Databasic projektjéről van szó (IDE KATTINTVA). Érdemes azt is észrevenni, minden egyes eszköz további, mélyebb elemzésre való ingyenes eszközöket is felajánl.
Négy eszközt találhatunk meg az oldalon:
- A Word Counter elsődlegesen angol nyelvű szövegek elemzésére használható (nem bánik jól az ékezetes karakterekkel), megmutatja, hogy mik a leggyakoribb szavak és kifejezések egy szövegben. Hasznos lehet, ha valamilyen nagyobb szöveget (pl. történelmi szövegeket) akarunk gyorsan elemezni.
- A SameDiff szintén szövegek elemzésére használható, de itt két szöveget hasonlíthatunk össze megállapítva, hogy mik a leggyakoribb közös és különböző szavak. Kipróbáltam például az Ember Tragédiája egyes színeinek elemzésével és agyon érdekes, a beszélgetést elindító eredményeket kaptam.
- A WTFcsv arra alkalmas, hogy egy táblázatról gyors képet kapjunk, izgalmas elemzések kiindulópontja lehet, ha például a KSH statisztikai táblázatait nézzük meg vele.
- A Connect the dots kapcsolatok feltárására használható. Ha mindenki felsorolja a három kedvenc tantárgyát az osztályban, érdekes összefüggéseket tárhatunk fel.
Ha valakinek kedve támad az adatokkal játszani, érdemes ellátogatnia a ITT BEMUTATOTT oldalra, ahol hatalmas adatbázisok érhetőek el ingyenesen.