Embeddingi

Definicja (kanoniczna)

Embeddingi to numeryczne reprezentacje znaczenia treści, tworzone przez modele językowe w celu porównywania podobieństwa semantycznego między zapytaniami a informacjami źródłowymi. Każdy fragment treści (chunk) jest mapowany do wektora w przestrzeni wielowymiarowej, gdzie odległość między wektorami określa stopień podobieństwa znaczeniowego.

Rola w architekturze

Embeddingi stanowią mechanizm porównywania, na którym opierają się:

  • wyszukiwanie semantyczne,

  • shortlistowanie ofert przez agentów,

  • systemy RAG pobierające kontekst do odpowiedzi.

To embeddingi decydują o tym:

  • z czym hotel zostanie porównany,

  • czy w ogóle trafi do porównania,

  • jak blisko znaczeniowo znajduje się od zapytania użytkownika.

Poprawne dane i struktura nie gwarantują widoczności, jeśli embedding oferty nie jest semantycznie zbliżony do zapytania.

Relacja do innych pojęć

Embeddingi są bezpośrednio powiązane z:

  • Chunking – embeddingi są tworzone dla pojedynczych fragmentów treści,

  • Bot-First Content – jakość embeddingów zależy od jednoznaczności języka,

  • Atomic Offer Block – idealna jednostka do generowania spójnego embeddingu,

  • RAG – embeddingi służą do wyszukiwania właściwego kontekstu.