Exempel på Data Warehouse och dess databehandling

Vad händer om organisationer behandlade alla sina uppgifter till beslutsstöd? Vad skulle hända om de använde specialiserad programvara som serverade informationen och analyserade dem? Vi kommer att ge några Data Warehouse exempel att svara på dessa frågor.

EXEMPEL-PÅ DATA-LAGER

Data Warehouse Exempel

För det första är det viktigt att skilja mellan två termer som på grund av deras förkortning lätt kan förvirra oss, och från början är avsikten att användaren ska veta vad han kan förvänta sig och att känna till några grundläggande begrepp som de går till att möta. Här kommer vi att visa oändliga exempel som tjänar så att individen har verktygen för att skilja dessa element.

Definition

Med tanke på skillnaden mellan de två termerna kommer vi att fortsätta att definiera dem formellt, eftersom det är en process som extraherar, transformerar, konsoliderar och integrerar data från en organisation, både interna och externa, för att göra dem tillgängliga och användbara i beslut -tillverkning.

På samma sätt kan datalagret också definieras som en bas med elektronisk filsysteminformation, som lagrar de data som är nödvändiga för analys av information och beslutsfattande. Dess skillnad är att den är affärsorienterad, integrerad, tidsvarierande och icke-flyktig.

I grund och botten är Data Warehousing (DWH) en process och Data Warehouse (DW) är en databas.

särdrag

Det finns flera aspekter som kännetecknar datalagret som tillhandahåller nödvändiga verktyg för dess optimala användning, och följaktligen följer programmerade riktlinjer som genererar verktygen för dess användning på bästa möjliga sätt. Vi kommer att beskriva egenskaperna hos ett datalager:

Affärsinriktad

Endast relevant data matas in i datalageret för analys och beslutsfattande. Det vill säga att data som inte har något analytiskt värde, till exempel rumsadresser, postnummer, e -postadresser, inte beaktas. Men de är av varierande intresse som typ av klient, geografisk plats, ålder, etc.

Enheter på hög nivå hanteras, till exempel kunder, produkter, artiklar, områden och andra. Data lagras på ett flerdimensionellt sätt, det vill säga faktiskt och dimensionstabeller.

Integrada

All data från heterogena källor konsolideras för att garantera dess kvalitet och renlighet. De viktigaste datakällorna är:

Enligt användartyp.

    • Operativt: Dagligen producerar stora mängder data, men i sig är de av liten relevans för den erforderliga analysen. Till exempel produktförsäljning.
    • Medium: Genererar data med implikation på kort och medellång sikt, baserat på driftsdata. Ett bra exempel på detta koncept är lagergenerering.
    • Managerial: Använder data som härrör från integrations- och transformationsprocessen. I sin tur genererar den ny information. Det hänvisar i grunden till användaren av Data Warehouse.

Enligt organisationens område eller avdelning

    • Områden: Var och en har ett väldefinierat ansvar. De producerar sin egen data som delas med de andra områdena.
    • Underavdelningar: De är vanligtvis geografiska. De tillhandahåller platsdata, som måste införlivas tillsammans med de andra.

Enligt källan

    • Intern: De genererar sin egen data från företagets dagliga verksamhet.
    • Externt: De kompletterar intern data, till exempel folkräkningar och statistik.

Variant i tid

Det ger åtkomst till olika versioner av samma situation, eftersom nuvarande data lagras tillsammans med historiska data, i datalagerexemplen.

datalagret

Inte flyktig

Det garanterar stabiliteten i informationen, eftersom det inte ändras när uppgifterna kommer in. Det vill säga, data manipuleras endast när de matas in och när de konsulteras.

Sammanfattningsvis är dataklagrets huvudkvaliteter:

Kvaliteter

Hanterar data i volym, en följd av ackumulering av historisk, aktuell och aggregerad data, från olika källor.

Det placerar hela datamängden i en enda centraliserad databas. Strukturera data på ett flerdimensionellt sätt.

fördelar

På grund av dess egenskaper och kvaliteter har Data Warehouse följande fördelar:

  • Det minskar den minsta tid som krävs för att samla all relevant information om ett specifikt ämne.
  • Ger analysverktyg.
  • Många rapporter och analyser är användardefinierade.
  • Det låter dig direkt komma åt, analysera och övervaka organisationens indikatorer.
  • Det hjälper till att identifiera de faktorer som påverkar företagets verksamhet.
  • Det gör det möjligt att avancera och bestämma institutionens framtida beteende.
  • Användare kan snabbt och enkelt söka efter data.

Kort sagt, Data Warehouse hjälper organisationen att svara på viktiga frågor för beslutsfattande. Detta uppnår konkurrensfördelar som optimerar deras position på den marknad där de verkar. Några av dessa frågor är:

  • Vad är kundens profil?
  • Hur är deras beteende?
  • Vad är företagets lönsamhet?
  • Vilken är risken för organisationen?
  • Vilka tjänster och produkter använder du och hur kan du öka dem?

EXEMPEL-PÅ DATA-LAGER

Användningsområde

Ett datavarehus kan anpassas till vilken organisation som helst, oavsett dess storlek och komplexitet. Detta är en konsekvens av agendan för alla institutioner, företag eller organisationer när de fattar relevanta beslut om de data som den producerar.

Applikationsrisker

Det kräver en stor investering från organisationens sida. Fördelarna med dess genomförande ses inte på kort sikt, utan på medellång och lång sikt.

Manipulering av data hotar manipulering av känslig data.

Aspekter att ta hänsyn till

Som nämnts i början finns det flera aspekter som måste beaktas vid tillämpningen av dessa element för användning av en server. Bland dem kan vi nämna följande:

Kostnader för ansökan

Ett datalager bär kostnader för konstruktion, drift och support. Konstruktionskostnaden innebär kostnader för mänskliga resurser, tid och teknik, medan kostnaderna för drift och underhåll tar hänsyn till kostnaderna för utveckling, tillväxt och de som orsakas av förändringar i dataens ursprung.

Påverkan på människor

Tillämpningen av ett datalager genererar alltid förväntningar hos användare, som nödvändigtvis måste skaffa sig nya färdigheter. Framgången för denna typ av data beror på aktiv användning och feedback från användare.

Påverkan på affärs- och beslutsprocesser

Med tillämpningen av ett datalager kan vissa brister i affärsprocesser avslöjas, men samtidigt ökar förtroendet för de beslut som fattas baserat på de resultat som uppnås.

Arkitektur

EXEMPEL-PÅ DATA-LAGER

Den allmänna arkitekturen för ett exempeldatalager visas i figuren ovan. Som kan ses innebär detta system en serie interaktioner mellan dess komponenter. I detta avseende och som en sammanfattning kan dess funktion beskrivas enligt följande:

  • Data hämtas från olika källor, såsom webbtjänster, filer och andra databaser, både interna och externa.
  • När datan har extraherats integreras, transformeras och rengörs den för att senare laddas in i datalageret.
  • För att generera taktisk och strategisk information erhålls rapporter och analyser från laddning av data.
  • Slutligen kan användare konsultera och utforska de rapporter och analyser som genereras.

element

Vi ska nu beskriva några av de element som kan utvärderas i Data Warehouse som bör övervägas.

Datavarehuskällor

I allmänhet är de resultatet av företagets dagliga verksamhet, i vilket fall de kallas interna källor. När data tas från till exempel webbserver betraktas dessa som externa källor. De skiljer sig från varandra eftersom de beror på deras ursprung, format, funktion etc.

Extraktion, transformation och laddning

EXEMPEL-PÅ DATA-LAGER

Känd som ETL, det är processen som inkluderar alla uppgifter som utförs från det att data erhålls tills de laddas in i datalageret. Dessa är: extraktion, manipulation, kontroll, integration, datarensning, laddning och uppdatering.

extraktion

Den innehåller tekniker som är inriktade på att hämta, från olika källor, endast relevant data och förvara den i intern lagring. Denna typ av lagring gör det möjligt att manipulera data utan att ingripa eller ändra källorna eller Data Warehouse med mer data, skapa ett extraheringslager mellan läsning och laddning, lagring och hantering av metadata som genereras i processen och underlättar integration.

Extraktionen baseras på användarnas behov och de krav som definieras för lösningen.

Omvandling

Det här är teknikerna för att göra de olika formaten kompatibla, samt filtrera och klassificera data och relaterade källor.

Denna funktion är ansvarig för att tillämpa alla lämpliga kommandon i förhållande till data, för att marknadsföra dem på ett starkt och rimligt sätt som är kompatibelt och förenligt med datalageret. Dessutom ansvarar det för renheten och kvaliteten på uppgifterna.

fiberomvandling

carga

När det gäller teknikerna för den första inläsningen av data och den periodiska uppdateringen av datalageret.

  • Den initiala belastningen hänvisar till den första laddningen av data som Data Warehouse tar emot. Generellt är det mycket tidskrävande på grund av det stora antalet poster som tillhör långa tidsperioder.
  • Periodisk uppdatering avser infogning av små datamängder. Ditt mål är att bara lägga till data från datalagret som genereras från den senaste uppdateringen. Det beror på användarens behov och krav.

Kort sagt, genom processen för dataladdning garanteras underhållet av datalageret.

Sammanfattningsvis kan man säga att ETL -processen utförs enligt följande:

  • Uppgifterna, när de extraherats från relevanta källor, deponeras i den interna lagringen.
  • Medan data lagras i intern lagring, integreras och transformeras de.
  • När data rensas, efter föregående steg, skickas de till datavarehuset.

Rapporter

Rapporterna är grafiska verktyg som gör det möjligt för användaren att få detaljerade rapporter om informationen om sitt företag. Sättet att interagera med dessa rapporter är ganska enkelt för användaren, eftersom de är enkla att följa instruktioner. I grund och botten måste du välja alternativ från en meny, med hänvisning till villkoren och specifikationerna för det presenterade ämnet.

OLAP

Det är den mest kraftfulla komponenten i Data Warehouse, eftersom den innehåller den specialiserade flerdimensionella sökmotorn i systemet.

Det tillåter analys av organisationen från olika historiska scenarier. Den projicerar sitt beteende och sin utveckling från en flerdimensionell vision, det vill säga genom att kombinera olika perspektiv, ämnen av intresse eller dimensioner. Detta gör att trender kan härledas genom att upptäcka relationer mellan perspektiv som skulle vara svåra att hitta vid första anblicken.

Data Mining

EXEMPEL-PÅ DATA-LAGER

Det är främst ett statistiskt verktyg, genom vilket förutsägelser kan göras. Det handlar om att dra slutsatser om beteenden, utan att det finns förutbestämda regler. Det genererar bland annat rapporter i form av tabeller och grafer som främjar beslutsfattande på ett proaktivt sätt. Det fungerar på grundval av information som redan har behandlats fullständigt.

Skillnad mellan OLAP och Data Mining

När de viktigaste aspekterna av OLAP och Data Minig har beaktats kan en grundläggande skillnad mellan dem fastställas.

  • Med hjälp av OLAP tolkas företagets nuvarande situation, vilket ger snabba svar som underlättar beslutsfattande.
  • Data Minig förutspår situationer, baserat på studier av dold kunskap som framkallar vissa typer av beteenden.

Följaktligen hanterar båda systemen att lösa olika typer av analytiska situationer.

Data Minig och dess relation med Data Warehouse

Ett Data Minig -system är en stödteknik för slutanvändaren, vars mål är att extrahera användbar information från informationen i företagens databas. Med andra ord, ursprunget till den information som används av Data Minig -algoritmerna är vanligtvis historiska data som finns i ett datalager.

Det måste finnas en integration mellan Data Minig -tekniker och processerna som är involverade i datalageret. Det vill säga, för att kunna utföra affärsanalysen måste det finnas överensstämmelse mellan Data Minig, Data Warehouse och OLAP -servern.

Varje gång Data Warehouse ger nya resultat kan företaget åter tillämpa Data Minig för att optimera beslutsfattandet.

Kort sagt, Data Minig och Data Warehouse är fullt kompatibla verktyg. Data Warehouse tillhandahåller minne och Data Minig -intelligens.

Traditionella databaser vs Data Warehouse

Analysen av de aspekter som hittills avslöjats får oss att förstå att ett datavarehus skiljer sig från databaserna som stöder dagliga transaktioner från organisationer. Här är de grundläggande skillnaderna

  • I traditionella databaser är informationen organiserad så att den enkelt kan hämtas och uppdateras. Ett datalager är organiserat och inriktat mot slutanvändaren, som bara kan göra förfrågningar.
  • Transaktionsdatabaser tar hand om den dagliga behandlingen av uppgifterna. Data Warehouse arbetar med historiska data, det vill säga motsvarar långa tidsperioder.
  • Traditionella databaser nås flera gånger under en arbetsdag. I ett datavarehus är avläsningarna och frågorna minimala, eftersom de nås sporadiskt.
  • Datamängden som ett datavarehus hanterar är mycket större än den som hanteras i traditionella databaser.
  • Transaktionsbasernas struktur är stabil. Strukturen i ett datalager varierar beroende på dess egen utveckling och användning.

Därefter kommer vi att etablera några Data Warehouse exempel.

Data Warehouse Exempel

Ett rikstäckande företag, dedikerat till försäljning av rengöringsartiklar på grossist- och detaljhandelsnivå, som också anses vara medelstort på grund av sin försäljningsvolym, har det huvudsakliga målet att maximera sina vinster. På samma sätt vill du expandera till en ny marknadsnivå för att få fler kunder och senare utöka ditt produktsortiment. En av dess huvudpolicyer är att kontinuerligt förbättra för att få en bättre position gentemot sina konkurrenter i datalagerproverna.

EXEMPEL-PÅ DATA-LAGER

Tillämpningen av ett datavarehus erbjuder följande fördelar för organisationen.

  • Det tillåter användare att ha en överblick över verksamheten.
  • Förvandla operativ data till analytisk information, fokuserad på beslutsfattande.
  • Skapa dynamiska rapporter som underlättar din analys.
  • Det underlättar utformningen av strategier för att uppfylla organisationens mål.
  • Det gynnar stabiliteten i företagsstrukturen.

Ett annat exempel på ett dagligt datalager hänvisar till förvaltningen av en utbildningsinstitution, som har brister när det gäller kommunikation med sina studenter. På samma sätt saknar den ett enhetligt informationscenter som har all sin information. Syftet med institutionen är att följa studenter under sin karriär och efter examen, att erbjuda nya förslag som förbättrar organisationens prestanda och utvecklingen av studenter.

Med tillämpningen av ett datavarehus försöker vi svara på universitetets behov. I princip eliminerar duplicering av information och förekomst av felaktiga detaljer om studenterna, liksom all information som i allmänhet anses vara av dålig kvalitet och som inte är relevant. Dessutom är all information integrerad och bildar ett enhetligt register över studenter som fungerar som grund för en korrekt utveckling av institutionens projekt.

Slutligen främjas marknadsföringsaktiviteter, vilket ger universitetet större nytta och hjälper dess tillväxt genom korrekt hantering av information.

Sammanfattningsvis ger det i datalagerexempel möjligheten att veta vad som händer i organisationen, vad som har hänt, vad som kan hända och varför. Du kan se artikeln typer av datavirus.