W połowie marca Elon Musk obiecał opublikować kod źródłowy Twittera dla swojego algorytmu rekomendacji-a teraz dostarczył to i więcej.
Twitter will open source all code used to recommend tweets on March 31st
— Elon Musk (@elonmusk) March 17, 2023
Oprócz udostępnienia kodu na GitHub, Twitter opublikował również krótką notatkę o tym, dlaczego zespół opublikował dane, z bardziej szczegółowymi informacjami na temat działania algorytmu udostępnionymi na blogu inżynieryjnym platformy.
Według Twittera algorytmy rekomendacji działają poprzez próbę „odpowiedzi na ważne pytania…takie jak:” Jakie jest prawdopodobieństwo interakcji z innym użytkownikiem w przyszłości?”lub” jakie są Społeczności na Twitterze i jakie są w nich popularne Tweety?’”
Twitter wykorzystuje informacje, które Wyodrębnia z danych tweetów, użytkowników i zaangażowania, aby pozyskiwać tweety, oceniać je i odfiltrowywać treści, które są mniej prawdopodobne.
„Okej”, myślisz, ” w pewnym sensie to założyłem. Ale jak to właściwie działa?”Zapnij pasy — zajmiemy się tym.
Jak skonstruowana jest Twoja oś czasu
Twitter nazywa mechanizm stojący za osią czasu For You ” mikserem domowym.”Jest to proces pozyskiwania, rankingu i filtrowania tweetów, który tworzy zalecane treści.

Źródła kandydujące
Twitter wybiera tweety z dwóch głównych źródeł. Pierwsze to osoby, które obserwujesz (źródła w sieci). Drugie to użytkownicy, których nie śledzisz (źródła poza siecią).
Tweety w sieci Twitter porządkuje za pomocą modelu Real Graph. Model ten przewiduje, jak duże jest prawdopodobieństwo interakcji między użytkownikami.
Jeśli algorytm uzna, że możesz zainteresować się danym autorem, pokaże więcej jego tweetów na Twojej osi czasu.
Tweety spoza sieci wymagają bardziej zaawansowanej analizy. Twitter sam ocenia, czy treści danego użytkownika mogą Cię zainteresować.
W tym celu platforma analizuje aktywność innych użytkowników. Sprawdza między innymi:
- jakie posty były ostatnio popularne
- z jakimi tweetami wchodzą w interakcję osoby, które obserwujesz
- kto lubi podobne treści
Tweety poza siecią są również pozyskiwane przez osadzanie podejść kosmicznych. Służą do grupowania Ciebie i Twoich treści za pomocą tweetów i użytkowników podobnych do Twoich zainteresowań.
Jedna z tych przestrzeni osadzania, SimClusters, grupuje użytkowników w „społeczności” lub kategorie tematów zakotwiczone przez wpływowych użytkowników. Możesz należeć do wielu społeczności jednocześnie i mogą one mieć różne rozmiary, od niszowych kręgów przyjaciół po gigantyczne globalne grupy.

Jeśli tweet jest popularny w określonej społeczności, zostanie pokazany większej liczbie osób w tej społeczności.
Ranking
Gdy Twitter wyciągnie ~1500 potencjalnych tweetów na Twoją oś czasu, korzystając zarówno ze źródeł w sieci, jak i poza siecią, musi je uszeregować.
Twitter był trochę bardziej tajemniczy, w jaki sposób, konkretnie, klasyfikuje tweety, powiedzenie:
Ranking Twittera opiera się na sieci neuronowej o około 48 milionach parametrów. System ten stale analizuje interakcje użytkowników z tweetami.
Dzięki temu algorytm optymalizuje treści pod kątem pozytywnego zaangażowania, takiego jak polubienia, retweety i odpowiedzi.
Mechanizm rankingowy uwzględnia tysiące czynników. Co więcej, przypisuje każdemu tweetowi zestaw etykiet, które określają prawdopodobieństwo interakcji. Uszeregujemy tweety z tych wyników.”
Jednak ludzie już zaczęli zagłębiać się w kod, aby dowiedzieć się, jak ważone są te sygnały.
Twitter algo 101
— Peter Yang (@petergyang) April 1, 2023
Boosts
– Likes 30x
– Retweets 20x
– Twitter Blue 2-4x
– Trusted circle 3x
– Images/videos 2x
– Replies 1x
Negatives
– URL only
– No text
– Mute
– Block
– Unfollow
– Report pic.twitter.com/mrCuGXB2gJ
Wygląda na to, że nasze przypuszczenia były trafne. Tweety zawierające wyłącznie linki mają mniejszy zasięg. Z kolei polubienia i retweety wyraźnie zwiększają widoczność treści.
Heurystyka, filtry i cechy produktu
Po wstępnym rankingu Twitter filtruje treści. Platforma bierze pod uwagę Twoje działania, takie jak blokowanie lub wyciszanie użytkowników.
Dodatkowo algorytm analizuje, kogo ostatnio oglądałeś oraz z jakimi treściami wchodziłeś w interakcję. Usuwa także materiały spoza Twojej sieci, jeśli nie interesują osób, które obserwujesz.
Ostateczna oś czasu
Na końcu Twitter tworzy finalny feed. W tym celu łączy rekomendowane treści z sugestiami obserwowania nowych kont.
W rezultacie otrzymujesz spersonalizowaną oś czasu dopasowaną do Twoich zainteresowań.
Według Twittera cały proces trwa około 1,5 sekundy i przebiega 5 miliardów razy dziennie.


