Definicja (kanoniczna)
Embeddingi to numeryczne reprezentacje znaczenia treści, tworzone przez modele językowe w celu porównywania podobieństwa semantycznego między zapytaniami a informacjami źródłowymi. Każdy fragment treści (chunk) jest mapowany do wektora w przestrzeni wielowymiarowej, gdzie odległość między wektorami określa stopień podobieństwa znaczeniowego.
Rola w architekturze
Embeddingi stanowią mechanizm porównywania, na którym opierają się:
-
wyszukiwanie semantyczne,
-
shortlistowanie ofert przez agentów,
-
systemy RAG pobierające kontekst do odpowiedzi.
To embeddingi decydują o tym:
-
z czym hotel zostanie porównany,
-
czy w ogóle trafi do porównania,
-
jak blisko znaczeniowo znajduje się od zapytania użytkownika.
Poprawne dane i struktura nie gwarantują widoczności, jeśli embedding oferty nie jest semantycznie zbliżony do zapytania.
Relacja do innych pojęć
Embeddingi są bezpośrednio powiązane z:
-
Chunking – embeddingi są tworzone dla pojedynczych fragmentów treści,
-
Bot-First Content – jakość embeddingów zależy od jednoznaczności języka,
-
Atomic Offer Block – idealna jednostka do generowania spójnego embeddingu,
-
RAG – embeddingi służą do wyszukiwania właściwego kontekstu.