2012. december 8., szombat

DW könyvet a karácsonyfa alá

A napokban jelent meg egy új könyv az adattárház építésről, erős hangsúllyal a dimenziós modellezésen. Ráadásul magyarul!

A könyvet Bánné Varga Gabriella írta (ő sokaknak ismerős az Oracle adattárházas tanfolyamairól J), a Typotex kiadó adta ki és most karácsonyi akcióban lehet hozzájutni.

Az adattárház-készítés technológiája
az architektúrától a dimenzionális modellezésen át az üzletiintelligencia-alkalmazásokig Oracle eszközök ismertetésével

Rövid tartalom:
·         Bevezetés
·         Az alapok
·         A dimenzionális modellezés alapjai
·         Dimenziókról részletesen
·         Ténytáblák tervezése és tárolása
·         ETL folyamat
·         BI eszközök és elemzések
·         Oracle eszközök a teljes folyamatban
·         Modellek jelölései és értelmezésük

„A könyv nagyon jó átfogó képet ad a témáról, miközben a fontosabb részterületeket (architektúra, dimenziós adatmodellezés, ETL folyamat, BI eszközök) egészen mélyrehatóan is ismerteti. Mégis sikerült megtalálni az egyensúlyt, hogy „olvasmányos” maradjon, és ne vesszen el a részletekben.”

Szerintem, akit érdekel az adattárház építés, az örülni fog, ha ezt találja a fa alatt J
Itt lehet beszerezni: http://www.typotex.hu/konyv/banne_varga_gabriella_az_adattarhaz-keszites_technologiaja 

Jó olvasást!
 Gábor

2012. szeptember 12., szerda

Táblázatkezelő alapú riportok? Megbízhatunk bennük?

A napokban futottam bele egy nagyon informatív web oldalba, ami kifejezetten a táblázatkezelőkben „elkövetett” hibákkal foglalkozik.
Az oldalt Raymod R. Panko a Hawaii Egyetem professzora készítette Spreadsheet Errors and Governance címmel.

Egy 2008-as cikk (What We Know About Spreadsheet Errors) ragadta meg a figyelmemet, különösen azért, mert nemrég végeztük egy Excel alapú riporting rendszer felmérését és mi is találtunk „érdekes” dolgokat.

A hibák részletes elemzése mellett a legérdekesebb az első táblázat végeredménye volt:
  • A 7 különböző felmérésben vizsgált táblázatok 88%-a tartalmazott hibát!
  • Figyelembe véve, hogy a táblázatok többsége „fontos” vagy „nagyon fontos”, ez az arány több mint aggasztó. 

A hibák néhány oka:
  • a táblázatok fejlesztésében általában nincsenek szigorú fejlesztési szabályok (vagy nem tartják be)
  • túlzott magabiztosság (a táblázatok jóságában) – pl. egy felmérésben a táblázatfejlesztők 18%-os hibaarányt becsültek, miközben 86% volt a valós hibaarány!

Összefoglalva minden kutatás, ahol megpróbálták mérni a hibákat, kivétel nélkül azt mutatta ki, hogy a hibaarány elfogadhatatlanul magas. A legtöbb nagyméretű táblázatban várhatóan több hiba is lesz és még a viszonylag kicsi „móricka” tábláknál is magas a hibák valószínűsége.
Bár egyes szervezetek megpróbál(hat)ják azonosítani a kritikus fontosságú táblázatokat és szigorú követelményeket, szabályokat vezetnek be ezekhez, mégis az üzleti döntések jó részét továbbra is megkérdőjelezhető minőségű elemzések alapján fogják meghozni.
 

Nekem erről egyből az önkiszolgáló BI és a „nem kell nekünk adattárház, hiszen csak néhány riportot fogunk megcsinálni” kockázatai jutottak eszembe.


Akit érdekel, itt olvashatja a teljes cikket. Érdemes rászánni az időt.

Üdv,
 Gábor

2012. augusztus 28., kedd

5 módszer a szórakoztató adatmodellezéshez

A napokban olvastam egy jó blog bejegyzést Kent Graziano (Oracle Data Warrior) tollából arról, hogy hogyan lehet szórakoztatóvá tenni az adatmodellezést.

Persze, a modellezők számára mindig szórakoztató, de a többiek általában hamar megunják. J

Az üzleti felhasználók, elemzők az adatmodellekkel általában a modell review során találkoznak, ami tényleg eléggé unalmas szokott lenni (egy idő után komoly erőfeszítést igényel az is, hogy ne aludjunk el).

Ezen segíthet, ha játékosabbá tudjuk tenni az ilyen gyakorlatokat.

Kent blogján az alábbi tippeket adja:
  • szókereső
  • hiányos mondatok
  • jeopardy (a „fordított kérdezz-felelek” játék)
  • adatmodell haiku
  • adatmodell telefon (a „körben-ülős, fülbe-súgós” játék)

A részletek itt:
Five ways to make data modeling fun

Nekem legjobban az adatmodell telefon tetszik.
Azt hiszem, a legközelebbi adatmodell review-nál én is ki fogom próbálni.

Jó szórakozást! J

2012. június 11., hétfő

On-line Data Vault implementációs tanfolyam

Dan Linstedt weboldalán elérhető az On-line Data Vault implementációs tanfolyam!

A tanfolyam 12 modulból áll, kb. 30 session-el. A jelentkező 1 évig bármikor, bármelyik modult megnézheti, akár többször is, azaz ráérő idejétől vagy kedvétől függő tempóban haladhat az anyaggal.

Minden modulhoz kérdések, válaszok terület kapcsolódik, ahol Dan Linstedt válaszol a feltett kérdésekre.

A tanfolyam rengeteg olyan kérdést tárgyal, melyek minden adattárház építésekor felmerülnek, pl.:
  • Alapvető ETL szabályok (halmazműveletek vs. soronkénti feldolgozás);
  • Javasolt DW architektúra;
  • Hogyan töltsünk hatékonyan;
  • Adatforrások és problémáik kezelése;
  • Null értékű kulcsok és hiányzó értékek;
  • Real-time adat betöltő architektúra;
  • Változáskezelés;
  • Töltési minták;
  • stb.

Ezek mellett a Data Vault hatékony felépítéséről is rengeteg infromációt kapunk és még az új "Super Charge Your Data Warehouse" című könyv elektronikus verziójához is hozzájutunk.

A teljes tanfolyam kb. 3-4 napnyi itthoni tanfolyam árával megegyező összegbe kerül, ami szerintem nagyon jó ár-érték arányt jelent.

Akit érdekelnek a részletek itt megnézheti és jelentkezhet (csak le kell tekerni a lap aljáig és Add to Cart).

Ha kell, én is szívesen segítek bejelentkezni.
Nekem nagyon bejött :-)

Üdv,

 Gábor

2012. május 18., péntek

Adattárház Fórum 2012

Az évek óta nagy sikerrel futó Adattárház Fórum konferencia idei előzetes programja már elérhető.
Újdonságként önálló napra kerültek a workshopok és lesz egy ingyenes nyílt este (DW Open), ahol "mindenki ízelítőt kaphat a konferencián elhangzó előadásokból, és egy sör mellett elbeszélgethet az előadókkal és a hazai adattárházas közösség többi tagjával" - a hivatalos program szerint :-)

Aki még nem regisztrált most tegye meg, szerintem nem érdemes lemaradni!

Ott találkozunk,

 Gábor

2012. május 6., vasárnap

Megjelent az SQL szabvány új verziója, a SQL:2011

2011 végén megjelent az SQL szabvány új verziója, a SQL:2011.
Sok minden más mellett (végre) belekerült az időben változó adatok kezelése is ("Temporal Extensions").
A legfontosabb rész az üzleti érvényesség és a rendszer érvényesség megkülönböztetése és automatikus kezelése, az ún. "bitemporal" időkezelés támogatása.

A "nagy" adatáziskezelő gyártók közül elsőként az IBM DB/2 10-es verzióban érhetőek el az új lehetőségek. Nemrég megjelent a DB/2 10 LUW (Linux/Unix/Windows) verziója is, regisztráció után letölthető az IBM-től, úgyhogy mindenki kipróbálhatja.

Az adattárházas témában dolgozók számára "kötelező" :-)

Az elindulást segítendő érdemes elolvasni ezt a cikket is Best practices: Temporal data management with DB2 az IBM developersWorks oldalról.

Remélem, hamarosan megjelennek a temporal lehetőségek az egyéb adatbáziskezelőkben is.

2012. február 1., szerda

Gyerekjáték az architektúra tervezés :-)

A napokban a gyerekek egy "új" játékot hoztak haza az iskolából.
Egy lapra sorban fel kell írni a következő kérdéseket:
  • Ki?
  • Kivel?
  • Hol?
  • Mikor?
  • Hogyan?
  • Mit csinál?
Körbe kell adni a papírt, a következő üres sorba beírni a választ, majd behajtani a lapot úgy, hogy ne látszódjanak az előző válaszok.
Fontos, hogy mindenki csak egy kérdésre válaszolhat!
Ha az utolsó kérdésre is válaszoltak, akkor jön a lényeg:
   ki kell nyitni a lapot és felolvasni az így összerakott mondatot!

"Érdekes" dolgok jönnek ki :-)

A játékot és a kérdéseket elnézve szembe jutott. hogy hasonló kérdésekre kell válaszolni akkor is, amikor rendszert tervezünk.
Például a Zachman Architecure Framework:

Forrás: www.zachman.com
Ha megnézzük, szinte ugyenezen kérdésekre válaszol a különböző szinteken.
Az egyetlen különbség a Kivel? helyett a Miért? (Why) szerepel.

A játékhoz hasonlóan, az architektúra tervezésnél is egészen "érdekes" eredményeket kaphatunk, ha az egyes kérdésekre önállóan, a többiekre nem figyelve válaszolunk. :-)


Akit érdekelnek a vállalti architektúra tervezés részletei, annak javaslom a  www.zachman.com olvasgatását.

Üdv,

 Gábor

2012. január 3., kedd

Ahol érdemes belekezdeni

Néhány általam nagyrabecsült web oldal, ahol érdemes olvasgatni:
- Dan Linstedt a Data Vault modellezés kidolgozója - http://danlinstedt.com/
- Ralph Kimball és csapata a dimenziós adattárház modellezés "apostolai" - http://www.kimballgroup.com/
- Bill Inmon a normalizált adattárházak és a DW2.0 "apostola" - http://www.inmoncif.com

Néhány adatmodellező eszköz:
- Sybase PowerDesigner (nekem ez tetszik a legjobban :-))
- CA Erwin (szintén elég jó)
- SQL PowerArchitect (open source!)
- Oracle SQL Developer Data Modeler (az Oracle "hívőknek" - folyamatosan bővülő lehetőségekkel)

Stb...

Új év! Új blog!

Kedves barátom és "harcostársam" Arató Bence (www.bi.hu) bíztatására belefogok az adatmodellezéssel kapcsolatos gondolataim, tippjeim megosztásába.
Nem ígérem, hogy hetente lesznek új bejegyzések, de azért igyekszem majd rendszeresen publikálni és remélem lesznek olvasók is :-)

Szívesen várom a véleményeket, kommenteket, kérdéseket vagy akár öteleteket is, hogy milyen téma érdekel benneteket.

Üdv,

 Gábor