SQL - Vkladanie záznamov do tabuľky z inej tabuľky s kontrolou na duplicitu.

piatok, 22 november 2013 13:01 Written by Alojz Benďák 4670 times

Rate this item

(3 votes)

SQL - Vkladanie záznamov do tabuľky z inej tabuľky s kontrolou na duplicitu.

Zdravím databázových programátorov.
Programátori, ktorí programujú databázové aplikácie sa už mnohokrát stretli s problémom, ako efektívne vyriešiť problém s vložením viacerých záznamov do "cieľovej" tabuľky z inej "zdrojovej" tabuľky s tým, že pred vložením záznamu do "cieľovej" tabuľky sa skontrolujú záznamy na duplicitu.

Predpokladám, že čitateľ tohto príspevku vie, čo je to duplicita záznamov, ak nie, jednoduché vysvetlenie pre duplicitu: znamená, že sa pokúšame vložiť do "cieľovej" tabuľky rovnaký záznam, ktorý má splnenú podmienku z kľúčov (buď primárneho alebo akéhokoľvek "UNIQUE" - jedinečného kľúča definovaného na "cieľovej" tabuľke). Pretože, ak by sme sa pokúsili vložiť do akejkoľvek tabuľky záznam, ktorého dáta sa zhodujú s hodnotami v spomenutých kľúčoch, databázový systém nám odmietne takýto záznam do tabuľky vložiť.

Ďalej predpokladám, že programátor ovláda základy SQL a PL SQL v prostredí Oracle 11g.

Vytvoríme si príklad.
Úloha: Potrebujeme prekopírovať dnešné záznamy zo "zdrojovej" tabuľky do "cieľovej", s kontrolou na duplicitu na primárny kľúč.

TABLE_SOURCE - "zdrojová" tabuľka z ktorej sa záznamy kopírujú.
TABLE_DEST - "cieľová" tabuľka do ktorej sa záznamy kopírujú zo "zdrojovej" tabuľky.
Stľpec ID_LOG - je primárnym kľučom v obidvoch tabuľkách.
Trocha si príklad zjednodušíme a máme tabuľky s úplne zhodnou štruktúrou.

Jednoduchý príklad, ako by na prvý pokus programátor chcel kód vytvoriť napr. pomocou anonymného PL SQL bloku:

DECLARE 
    ID_LOG_VAR TABLE_SOURCE.ID_LOG%TYPE;
BEGIN
    FOR REC IN (SELECT TS.ID_LOG, TS.NAME_DESC, TS.DATE_TIME FROM TABLE_SOURCE TS WHERE TS.DATE_TIME>TRUNC(SYSDATE))
	/* napríklad takto: */
	BEGIN
	    SELECT TD.ID_LOG INTO ID_LOG_VAR FROM TABLE_DEST TD WHERE TD.ID_LOG=REC.ID_LOG;
        EXCEPTION
            WHEN NO_DATA_FOUND THEN
                ID_LOG_VAR := 0;
        END;
        IF ID_LOG_VAR = 0 THEN
            INSERT INTO TABLE_DEST (ID_LOG, NAME_DESC, DATE_TIME) 
            VALUES (REC.ID_LOG, REC.NAME_DESC, REC.DATE_TIME);
        END IF;
        /* alebo napríklad takto:
	BEGIN
            INSERT INTO TABLE_DEST (ID_LOG, NAME_DESC, DATE_TIME) 
            VALUES (REC.ID_LOG, REC.NAME_DESC, REC.DATE_TIME);		
        EXCEPTION
            WHEN DUP_VAL_ON_INDEX THEN
                CONTINUE;
	END;
        */
    END LOOP;
    COMMIT;
EXCEPTION
    WHWN OTHERS THEN
        ROLLBACK;
END;

Teraz si ukžážeme, ako to môžeme celé zjednodušiť.
V tomto prípade ale vytvoríme jednoduchý SQL kód, ktorý nám urobí toto všetko naraz jedným príkazom.

INSERT /*+ ignore_row_on_dupkey_index(TABLE_DEST, PK_TABLE_DEST) */  
INTO TABLE_DEST (ID_LOG,NAME_DESC,DATE_TIME)
SELECT TS.ID_LOG, TS.NAME_DESC, TS.DATE_TIME FROM TABLE_SOURCE TS WHERE TS.DATE_TIME>TRUNC(SYSDATE);
          
COMMIT;

Hotovo.

Vysvetlenie:
Na celé toto sme zneužili SQL hint "ignore_row_on_dupkey_index".
PK_TABLE_DEST - je názov primárneho indexu (ako objektu) v "namespace" schéme, v ktorej sa tabuľka nachádza.
Týmto hintom sme jednoducho povedali databázovému serveru, že záznamy, ktoré sú duplicitné na hodnotu primárneho kľúča, nemá do "cieľovej" tabuľky vložiť a má ich jednoducho ignorovať. Tento hint funguje aj pre iné indexy, samozrejme aj na nie "UNIQUE" indexy, vtedy ale musíme rátať s tým, že ak hint síce zachytí duplicitu na hodnoty v zadanom indexe, ale potom pre hodnoty v primárnom kľúči alebo iných UNIQUE kľúčoch (ak sú na tabuľke vytvorené) duplicitu nezachytí a SQL príkaz jednoducho zlyhá. Čiže treba mať na pamäti tento fakt.

S pozdravom a prajem veľa kódu bez chýb:)

Last modified on piatok, 22 november 2013 20:03

Published in SQL | Tagged under Oracle

Alojz Benďák

Autor je administrátor webu a venuje sa programovaniu takmer 23 rokov.

prvý kontakt s počítačmi na strednej škole - PMD 1,2,3, PP06, Atari, Sinclair (programovanie v jazyku: strojový kód, basic a pascal): 2 roky
na VŠ - jazyky Turbo pascal a Turbo C: 1rok
programovanie databázového ekonomického širokoškálneho software v Delphi a C++ Borland (databázy Paradox): 8 rokov v Codex s.r.o. Nitra
programovanie webových aplikácií na databázach MySQL a MS SQL server: 1 roky na živnosť (firmy: Hermes Nitra, Schindler v Bratislave)
pracoval ako DBA v Homecredit Brno a vo VÚB Bratislava ako vyvojár + optimalizácie v SQL a PL/SQL na Oracle 11g (firma Accenture)
programoval programy pre súkromné firmy pre HW na skenovanie povrchov nádrží pre skladovanie tekutých palív (pristroj Leica)
momentálne pracuje ako DBA pod Oracle 11g a ako vyvojár vnútropodnikových databázových aplikacií v PHP, SQL, C++, C# a interface v PL/SQL: 11 rokov
ďalej programuje s HTML, CSS, Ajax, Javascript, VBA, MS visual C++ a C# malé podporné aplikácie
certifikát SQL expert for Oracle 11g
spolupracuje a aktívne učí pre počítačové firmy: Lapis, IVIT v Nitre