Podstawy SQL – najważniejsze komendy i zapytania dla początkujących

Niniejszy przewodnik to przejrzyste wprowadzenie do najważniejszych koncepcji i poleceń języka SQL – standardowego języka pracy z relacyjnymi bazami danych. SQL umożliwia pobieranie, modyfikowanie i analizowanie danych, a jego składnia jest zbliżona do języka angielskiego. W materiale omawiamy klauzule SELECT, FROM, WHERE, operatory filtrowania, funkcje agregujące, JOIN, manipulację danymi oraz wybrane techniki zaawansowane, aby szybciej i pewniej budować zapytania oraz raporty.

Treść (pokaż)

Fundamentalne koncepcje i architektura języka SQL

SQL działa według logicznego porządku przetwarzania, niezależnie od tego, jak zapiszesz zapytanie.

Zrozumienie tej sekwencji jest kluczowe do poprawnego przewidywania wyników i skutecznego debugowania zapytań.

Kolejność logicznego przetwarzania zapytania SELECT wygląda następująco:

from,
where,
group by,
having,
select,
order by.

Przykładowo, filtry z WHERE są oceniane przed SELECT, dlatego warunki muszą odnosić się do kolumn dostępnych w FROM, a nie do aliasów z SELECT.

SQL dzieli się na kilka grup poleceń, z których każda pełni inną rolę:

DML – operacje na danych: SELECT, INSERT, UPDATE, DELETE;
DDL – definicja struktury: CREATE TABLE, ALTER TABLE, DROP TABLE;
DCL – kontrola dostępu i uprawnień;
TCL – sterowanie transakcjami: BEGIN, COMMIT, ROLLBACK.

Słowa kluczowe w SQL nie są czułe na wielkość liter, ale konwencja zaleca zapisywanie ich wielkimi literami dla czytelności.

Pobieranie danych – klauzule SELECT i FROM

Najprostsza forma zapytania to SELECT * FROM table, która zwraca wszystkie kolumny z tabeli.

Lepszą praktyką jest wskazywanie konkretnych kolumn, np. SELECT firstname, lastname FROM employees – poprawia to wydajność i czytelność.

Przykład z kolumną obliczeniową: SELECT FirstName, LastName, YEAR(BirthDate) AS BirthYear FROM Employees. Stałe również można zwracać w SELECT, np. SELECT 'Hello World!' AS Kolumna1.

Przydatne, praktyczne nawyki podczas pobierania danych:

wymieniaj tylko potrzebne kolumny – unikniesz przesyłania nadmiarowych danych,
stosuj czytelne aliasy (np. AS) dla kolumn i tabel,
używaj kolumn obliczeniowych z jasnymi aliasami, aby wynik był zrozumiały,
unikaj SELECT * w środowisku produkcyjnym – utrudnia to utrzymanie i indeksowanie.

Filtrowanie danych – klauzula WHERE i operatory porównania

WHERE ogranicza zwracane rekordy do tych spełniających warunki. Bez niej zwrócisz cały zbiór danych.

Najczęstsze operatory porównania:

= – równość;
<> lub != – nierówność;
>, <, >=, <= – relacje większe/mniejsze i nieostre.

Łączenie warunków umożliwiają operatory logiczne AND i OR. AND ma wyższy priorytet niż OR, dlatego w złożonych warunkach stosuj nawiasy: WHERE Title = 'Sales Representative' AND (City = 'London' OR LastName = 'Callahan').

Zaawansowane operatory filtracji:

BETWEEN – zakres domknięty, np. salary BETWEEN 50000 AND 100000;
IN – lista wartości, równoważna wielu OR;
LIKE – dopasowania wzorców (symbol % – dowolny ciąg, _ – pojedynczy znak);
ANY/ALL – porównania względem podzbiorów z podzapytań.

Obsługa wartości NULL – operatory IS NULL i IS NOT NULL

NULL oznacza brak lub nieznaną wartość i nie podlega zwykłym porównaniom, dlatego używaj IS NULL/IS NOT NULL: SELECT * FROM customers WHERE address IS NULL.

Przydatne funkcje do pracy z NULL:

ISNULL(x, substytut) – zamienia NULL na podaną wartość;
COALESCE(x1, x2, …) – zwraca pierwszy nie-NULL z listy;
NULLIF(a, b) – zwraca NULL, jeśli a = b, w przeciwnym razie zwraca a.

Funkcje agregujące ignorują NULL (z wyjątkiem COUNT(*), która liczy wszystkie wiersze).

Funkcje agregujące i grupowanie danych

Agregaty obliczają wartości zbiorcze dla całej tabeli lub grup.

COUNT() – zlicza wiersze (NULL w kolumnie jest ignorowany);
SUM() – sumuje wartości liczbowe;
AVG() – średnia arytmetyczna;
MAX() – największa wartość;
MIN() – najmniejsza wartość.

Grupowanie realizuje GROUP BY, a filtrowanie grup – HAVING. Przykład: SELECT DepartmentID, COUNT(*) AS EmployeeCount FROM Employees GROUP BY DepartmentID.

Kluczowe reguły pracy z grupowaniem:

wszystkie kolumny z SELECT, które nie są w agregatach, muszą znaleźć się w GROUP BY,
HAVING filtruje już utworzone grupy – nie zastępuje WHERE,
WHERE ogranicza wiersze przed grupowaniem, co zwykle daje lepszą wydajność.

Sortowanie wyników – klauzula ORDER BY

ORDER BY sortuje rosnąco (ASC) lub malejąco (DESC). Domyślnie – rosnąco. Przykład: ... ORDER BY StandardCost DESC.

ORDER BY działa na końcu przetwarzania zapytania, dlatego sortuje wynik po selekcji i grupowaniu.

Dobre praktyki sortowania:

sortuj po kolumnach widocznych w wyniku – unikniesz niezgodności z DISTINCT,
dla stabilności wyników przy paginacji zawsze łącz ORDER BY z LIMIT/OFFSET,
przy wielu kolumnach określaj jawnie kierunek dla każdej z nich.

Ograniczanie wyników – klauzule LIMIT i OFFSET

LIMIT i OFFSET pobierają fragment wyników, co jest niezbędne przy paginacji: SELECT * FROM Employees ORDER BY FirstName LIMIT 5 OFFSET 10.

W MySQL skrót LIMIT 100, 10 oznacza OFFSET 100 i LIMIT 10.

Praktyczne wskazówki przy paginacji:

zawsze używaj ORDER BY, aby zapewnić przewidywalną kolejność,
przy dużych offsetach rozważ keyset pagination (paginację „po kluczu”) dla lepszej wydajności,
łącz sortowanie po kolumnie unikalnej (np. ID), aby uniknąć niejednoznaczności.

Usuwanie duplikatów – klauzula DISTINCT

DISTINCT usuwa duplikaty całych wierszy w zestawie wynikowym: SELECT DISTINCT Country, City FROM Customers zwróci unikalne pary kraj–miasto.

Wskazówki dotyczące DISTINCT:

NULL traktowany jest jako jedna jednakowa wartość – wiele NULL zredukuje się do jednego,
stosuj DISTINCT oszczędnie – może maskować problemy z modelem danych lub błędami w JOIN,
jeśli często potrzebujesz unikalności, rozważ indeksy unikalne lub poprawę projektu danych.

Łączenie tabel – operacje JOIN

JOIN łączy wiersze z wielu tabel na podstawie relacji. Najpopularniejsze typy złączeń różnią się zakresem zwracanych danych:

Typ JOIN	Co zwraca	Wiersze bez dopasowania
INNER JOIN	tylko dopasowania obecne w obu tabelach	pomijane
LEFT JOIN	wszystkie wiersze z lewej tabeli + dopasowania z prawej	w kolumnach prawej tabeli dostają NULL
RIGHT JOIN	wszystkie wiersze z prawej tabeli + dopasowania z lewej	w kolumnach lewej tabeli dostają NULL
FULL OUTER JOIN	wszystkie wiersze z obu tabel, niezależnie od dopasowania	brakujące strony uzupełnione NULL

Przykład INNER JOIN: SELECT Orders.OrderID, Customers.CustomerName FROM Orders INNER JOIN Customers ON Orders.CustomerID = Customers.CustomerID.

Zawsze podawaj warunek ON – brak warunku prowadzi do kosztownego iloczynu kartezjańskiego.

Manipulowanie danymi – INSERT, UPDATE i DELETE

INSERT dodaje dane: INSERT INTO Customers (FirstName, LastName, Email) VALUES ('Anna', 'Nowak', '[email protected]'). Możesz wstawiać wiele wierszy naraz: ..., ('Jan','Kowalski','[email protected]').

UPDATE modyfikuje dane: UPDATE Customers SET City = 'Warsaw' WHERE ID = 1. Bez WHERE zmienisz wszystkie wiersze.

DELETE usuwa dane: DELETE FROM Customers WHERE ID = 5. Bez WHERE usuniesz cały zbiór.

Zasady bezpieczeństwa przy modyfikacji danych:

najpierw uruchom zapytanie SELECT z tym samym WHERE, aby upewnić się, co zmienisz,
krytyczne operacje wykonuj w transakcji (BEGIN/COMMIT/ROLLBACK),
rozważ ograniczenia (FOREIGN KEY) i kaskady – wpływają na propagację zmian.

Tworzenie i modyfikacja struktury tabel

CREATE TABLE definiuje nową tabelę i jej kolumny z typami: CREATE TABLE Persons (PersonID INT, LastName VARCHAR(255), FirstName VARCHAR(255), Address VARCHAR(255), City VARCHAR(255)).

Najczęściej używane typy danych:

INT – liczby całkowite;
VARCHAR(n) – tekst o zmiennej długości;
DATE/DATETIME – wartości daty i czasu;
DECIMAL(p, s) – liczby dziesiętne o kontrolowanej precyzji.

ALTER TABLE zmienia strukturę: ALTER TABLE Customers ADD Email VARCHAR(255), ALTER TABLE Customers DROP COLUMN Email. Operacje DDL wykonuj ostrożnie, szczególnie w produkcji.

Ograniczenia i integralność danych

Ograniczenia (constraints) zapewniają spójność i poprawność danych w bazie:

PRIMARY KEY – jednoznacznie identyfikuje wiersz, nie dopuszcza NULL;
FOREIGN KEY – pilnuje zgodności z kluczem głównym w tabeli nadrzędnej (integralność referencyjna);
UNIQUE – wymusza unikalność wartości w kolumnie lub zestawie kolumn;
NOT NULL – kolumna musi mieć zawsze wartość;
DEFAULT – wartość domyślna, gdy nie podano innej;
CHECK – waliduje wartości względem warunku, np. CHECK (Age >= 18).

Definiuj ograniczenia już na etapie projektu – błędy łatwiej zapobiegać w bazie niż łatać w aplikacji.

Podzapytania i zaawansowane zapytania

Podzapytania (subqueries) można umieszczać w SELECT, WHERE, HAVING czy FROM. Główne typy:

skalarne – zwracają pojedynczą wartość (1 wiersz, 1 kolumna), np. średnia cena w SELECT;
zwracające listę – wykorzystywane z IN/ANY/ALL w WHERE i HAVING;
w klauzuli FROM – tworzą wirtualną tabelę będącą wejściem dla zapytania zewnętrznego.

Operacje na zbiorach łączą wyniki wielu SELECT-ów:

UNION – scala zbiory i usuwa duplikaty;
UNION ALL – scala zbiory i pozostawia duplikaty;
INTERSECT – zwraca część wspólną zbiorów;
EXCEPT – zwraca wiersze z pierwszego zbioru, których nie ma w drugim.

Najczęstsze błędy i dobre praktyki

Najczęstsze błędy początkujących warto rozpoznać i eliminować:

używanie SELECT * zamiast konkretnych kolumn,
brak WHERE w UPDATE/DELETE i masowe, niezamierzone zmiany,
JOIN bez warunku ON – iloczyn kartezjański i lawinowy wzrost wierszy,
nadmierne stosowanie DISTINCT do „leczenia” duplikatów,
niekompletne GROUP BY (brak wszystkich kolumn nienagregowanych).

Sprawdzone dobre praktyki pracy z SQL:

formatuj kod i stosuj aliasy tabel/kolumn dla czytelności,
testuj zapytania na mniejszych zbiorach zanim uruchomisz na produkcji,
używaj transakcji przy operacjach krytycznych (BEGIN/COMMIT/ROLLBACK),
indeksuj kolumny używane w WHERE i JOIN,
analizuj plany wykonania (EXPLAIN) w celu optymalizacji.

Wdrożenie warunkowych operacji – CASE WHEN

CASE WHEN pozwala warunkowo wyznaczać wartości w SELECT, WHERE, ORDER BY oraz GROUP BY.

simple CASE – porównuje jedną wartość do wielu wariantów; składnia: CASE kolumna WHEN wartosc1 THEN wynik1 ... ELSE wynik END;
searched CASE – sprawdza dowolne warunki logiczne; składnia: CASE WHEN warunek1 THEN wynik1 ... ELSE wynik END.

Przykład kategoryzacji: CASE WHEN Age < 18 THEN 'nieletni' WHEN Age >= 18 AND Age < 65 THEN 'dorosły' ELSE 'senior' END.

Zaawansowane techniki – MERGE i transakcje

MERGE (np. w SQL Server) łączy INSERT/UPDATE/DELETE w jedną, atomową instrukcję: MERGE target USING source ON ... WHEN MATCHED THEN UPDATE ... WHEN NOT MATCHED THEN INSERT ....

Zalety MERGE w odpowiednich scenariuszach:

jednokrotny odczyt i porównanie danych zamiast wielu przebiegów,
spójność operacji i prostsza obsługa warunków dopasowania,
łatwiejsze utrzymanie logiki „upsert” (aktualizuj lub wstaw).

Transakcje gwarantują właściwości ACID:

Atomicity – całość albo nic;
Consistency – po zakończeniu transakcji baza pozostaje spójna;
Isolation – równoległe transakcje nie wpływają na swoje wyniki;
Durability – zatwierdzone zmiany są trwałe.

Operacje krytyczne zawsze wykonuj w transakcjach z przemyślanym poziomem izolacji.