Tokenomics of Large Language Models - Gradient Street #003
A practical tour of tokenisation for LLMs. Why word-level fails, how subwords and BPE work, and what modern tokenisers look like, with tips and resources. Plus a brief personal update.
Konsultant ds. AI & LLM | Data Scientist | Mentor
Poznaj swojego konsultanta AI i LLM oraz data scientist'ę z ponad dekadą doświadczenia w analitycznych okopach.
W trakcie mojej kariery kierowałem interdyscyplinarnymi zespołami, dostarczając projekty wykorzystujące AI w bankowości, ubezpieczeniach i nie tylko. Moje rozwiązania skróciły czas odpowiedzi o połowę, zwiększyły dokładność wykrywania oszustw powyżej 85% i wygenerowały ponad 200 udanych kampanii klienckich.
I tak, zawsze dbam o nutę dobrej zabawy. Niezależnie od tego, czy wdrażam duże modele językowe w Twoje procesy, czy tłumaczę zawiłości analityki interesariuszom biznesowym, stawiam na praktyczne, zorientowane na wyniki podejście do data science — z odrobiną humoru. Przeanalizujmy, zoptymalizujmy i zobaczmy, jak Twój biznes rośnie w siłę.
Napisz do mnie: [email protected]
Moją pasją jest analiza danych i przekuwanie ich w praktyczne wnioski. Spełniam się wdrażając kompleksowe systemy uczenia maszynowego. Powoływanie do życia innowacyjnych rozwiązań AI i pomaganie firmom skutecznie się rozwijać w dzisiejszym, zdominowanym przez dane świecie, to moja misja.
Obecnie zgłębiam możliwości dużych modeli językowych (LLM) i tworzę rozwiązania oparte na architekturach transformerów i logikę agentów. Budowałem już pipeline'y analityczne oceniające zdarzenia w czasie rzeczywistym, wdrażałem zaawansowane modele oceniające ryzyko kredytowe. Zarządzałem międzynarodowymi zespołami w pełni zdalnie.
Odezwij się do mnie na LinkedIn, rzuć okiem na mój kod na GitHubie, poznaj najnowsze wpisy na blogu.
Starszy Konsultant Analityczny
SCS Expert Sp. z o.o., Warszawa, Polska
01.2022 - Obecnie
Konsultant Analityczny
SAS Poland Sp. z o.o., Warszawa, Polska
01.2020 - 12.2021
Manager ds. Rozwoju Kompetencji Analitycznych (Assistant Vice-President)
Citi UK, Londyn, Wielka Brytania
07.2018 - 06.2019
Szef Zespołu Analiz Danych
Citi Indonesia, Dżakarta, Indonezja
01.2018 - 06.2018
Kierownik ds. CRM i Kampanii
Citi UK, Londyn, Wielka Brytania
09.2015 - 06.2018
Ekspert ds. Analityki Klienta i CRM
Citi Poland, Warszawa, Polska
06.2014 - 08.2015
Specjalista ds. CRM
Compensa Vienna Insurance Group, Warszawa, Polska
10.2012 - 05.2014
Ekonomia Przedsiębiorczości
Uniwersytet Warszawski (21/22, 2024 - 2025)
Data Science w Biznesie
Uniwersytet Warszawski (2019 - 2020)
Członek Klubu
Toastmasters Leaders (2013 - 2014)
Informatyka i Ekonometria
Uniwersytet Warszawski (2008 - 2014)
Wybrane zrealizowane projekty, weryfikacje założeń i prototypy.
Masz trudności z dokładną wyceną nieruchomości lub tracisz przychody przez nieprecyzyjne prognozy? Ten projekt pokazuje, jak zastosowanie odpornego modelu regresji Theil-Sen może usprawnić wycenę nieruchomości, skutecznie radząc sobie z wartościami odstającymi i zapewniając bardziej wiarygodne przewidywania cen sprzedaży domów. Wykorzystanie zaawansowanej inżynierii cech (takich jak Weight-of-Evidence czy transformacje Box-Cox) pozwala profesjonalistom z branży nieruchomości, inwestorom i analitykom podejmować decyzje oparte na danych, doskonalić strategie cenowe, lepiej zrozumieć rynek i zredukować ryzyko finansowe.
Przeprowadziłem pełen cykl wytworzenia modelu — od czyszczenia i transformacji danych po strojenie hiperparametrów. Możesz bez obaw sprawdzić to praktyczne rozwiązanie regresyjne. W zakres prac wchodziła też dogłębna eksploracja danych, systematyczny wybór cech i solidne ramy oceny modelu, które gwarantują wysoką dokładność oraz praktyczne wnioski dla Twojego portfela nieruchomości.
Masz wrażenie, że Twoje projekty data science zamieniają się w chaotyczny bałagan kodów i folderów? Smart Structuring to przewodnik, który krok po kroku uczy, jak organizować kod, zarządzać zależnościami i wdrażać kontrolę wersji. Niezależnie od tego, czy prowadzisz startup i zależy Ci na budowaniu skalowalnych procesów, czy pracujesz w dużej firmie i chcesz usprawnić współpracę - ten e-book dostarcza praktycznych wskazówek i sprawdzonych porad. Pomoże Ci ograniczyć błędy, przyśpieszyć cykl wytwarzania kodu oraz dbać o potencjał skalowania twoich rozwiązań.
Korzystając z moich doświadczeń jako data scientist i autor techniczny zebrałem konkretne wskazówki, które pomogą uniknąć typowych pułapek — od niespójnego nazewnictwa plików po nieśledzone zmiany w danych. Ten e-book zapewnia solidny plan działania umożliwiający budowanie niezawodnych, łatwych w utrzymaniu projektów, które sprostają wymaganiom nowoczesnej, szybko zmieniającej się data science i pozwolą zespołowi skupić się na wynikach.
Zmęczony/a drętwymi, szablonowymi chatbotami, które nudzą Twoich użytkowników? Ten wesoły bot-komik tchnie nowe życie w obsługę klienta, kampanie marketingowe czy demonstracje produktów, serwując zabawne żarty i spontaniczne komentarze. Wykorzystanie zaawansowanego NLP i deep learningu — konkretnie modelu LLama 3.1 Instruct z 8 miliardami parametrów — pokazuje, jak wciągające interakcje mogą zwiększać zadowolenie użytkowników i wspierać zaangażowanie w markę.
Zająłem się pełnym wdrożeniem (full-stack), łącząc technologię dużych modeli językowych z intuicyjnym front-endem, by zapewnić działanie w czasie rzeczywistym i wciągające doświadczenie użytkownika. Wprowadzenie humoru do rozmowy zwiększa zaangażowanie klienta i może też służyć za kreatywne narzędzie marketingowe. Nowoczesne AI wychodzi poza czysto użytkowe funkcje i może budować zapadające w pamięć doświadczenia z marką i lojalność klientów.
Chcesz sprawdzić, co możesz osiągnąć z pomocą AI? Skontaktuj się ze mną! Niezależnie od tego, czy stawiasz pierwsze kroki w data science, tworzysz prototypy, optymalizujesz pipeline’y ML czy chcesz sięgnąć po innowacje z wykorzystaniem LLM-ów — tylko jedna rozmowa dzieli Cię od szybszej realizacji Twoich celów!
Odkryj różnorodne artykuły o AI i data science, z praktycznymi wskazówkami, rzeczywistymi przykładami i najlepszymi praktykami. Bądź na bieżąco!
A practical tour of tokenisation for LLMs. Why word-level fails, how subwords and BPE work, and what modern tokenisers look like, with tips and resources. Plus a brief personal update.
An accessible tour of word embeddings, from Word2Vec to GloVe, with intuition, a touch of maths, and practical notes on training and using them. Includes caveats, examples, and where modern models fit.
Do machines understand words? And if not exactly, do they use Google Translate?
What can I do to learn better? What ways can I expose myself? And are we really lucky that we are born in Europe in modern times?