W połowie marca Elon Musk obiecał opublikować kod źródłowy Twittera dla swojego algorytmu rekomendacji-a teraz dostarczył to i więcej.
Twitter will open source all code used to recommend tweets on March 31st
— Elon Musk (@elonmusk) March 17, 2023
Oprócz udostępnienia kodu na GitHub, Twitter opublikował również krótką notatkę o tym, dlaczego zespół opublikował dane, z bardziej szczegółowymi informacjami na temat działania algorytmu udostępnionymi na blogu inżynieryjnym platformy.
Według Twittera algorytmy rekomendacji działają poprzez próbę „odpowiedzi na ważne pytania…takie jak:” Jakie jest prawdopodobieństwo interakcji z innym użytkownikiem w przyszłości?”lub” jakie są Społeczności na Twitterze i jakie są w nich popularne Tweety?’”
Twitter wykorzystuje informacje, które Wyodrębnia z danych tweetów, użytkowników i zaangażowania, aby pozyskiwać tweety, oceniać je i odfiltrowywać treści, które są mniej prawdopodobne.
„Okej”, myślisz, ” w pewnym sensie to założyłem. Ale jak to właściwie działa?”Zapnij pasy — zajmiemy się tym.
Jak skonstruowana jest Twoja oś czasu
Twitter nazywa mechanizm stojący za osią czasu For You ” mikserem domowym.”Jest to proces pozyskiwania, rankingu i filtrowania tweetów, który tworzy zalecane treści.
Źródła kandydujące
Twitter zaczyna się od wyciągania tweetów od osób, które obserwujesz (Źródła W Sieci) i osób, których nie obserwujesz (źródła poza siecią).
Tweety w sieci są uszeregowane według modelu o nazwie Real Graph, który ” przewiduje prawdopodobieństwo zaangażowania dwóch użytkowników.”Jeśli Real Graph uważa, że stosunkowo prawdopodobne jest, że skontaktujesz się z autorem tweeta (i odwrotnie), zobaczysz więcej jego tweetów na swojej osi czasu.
Tweety poza siecią są nieco trudniejsze do pozyskania, ponieważ wymagają algorytmów Twittera, aby odgadnąć, czy uważasz, że czyjeś treści są interesujące, nawet jeśli ich nie śledzisz.
Twitter dokonuje tych prognoz, używając wykresu społecznościowego do zadawania pytań typu: „Z jakimi tweetami ostatnio współpracowały osoby, które obserwujesz?”i” kto lubi te same (lub podobne) tweety co ty i co jeszcze Ostatnio mu się podobało?”
Tweety poza siecią są również pozyskiwane przez osadzanie podejść kosmicznych. Służą do grupowania Ciebie i Twoich treści za pomocą tweetów i użytkowników podobnych do Twoich zainteresowań.
Jedna z tych przestrzeni osadzania, SimClusters, grupuje użytkowników w „społeczności” lub kategorie tematów zakotwiczone przez wpływowych użytkowników. Możesz należeć do wielu społeczności jednocześnie i mogą one mieć różne rozmiary, od niszowych kręgów przyjaciół po gigantyczne globalne grupy.
Jeśli tweet jest popularny w określonej społeczności, zostanie pokazany większej liczbie osób w tej społeczności.
Ranking
Gdy Twitter wyciągnie ~1500 potencjalnych tweetów na Twoją oś czasu, korzystając zarówno ze źródeł w sieci, jak i poza siecią, musi je uszeregować.
Twitter był trochę bardziej tajemniczy, w jaki sposób, konkretnie, klasyfikuje tweety, powiedzenie:
„Ranking osiąga się dzięki sieci neuronowej o parametrze ~48m, która jest stale szkolona w zakresie interakcji z tweetami w celu optymalizacji pod kątem pozytywnego zaangażowania (np. polubień, retweetów i odpowiedzi). Ten mechanizm rankingowy uwzględnia tysiące funkcji i wyświetla dziesięć etykiet, aby dać każdemu Tweetowi wynik, gdzie każda etykieta reprezentuje prawdopodobieństwo zaangażowania. Uszeregujemy tweety z tych wyników.”
Jednak ludzie już zaczęli zagłębiać się w kod, aby dowiedzieć się, jak ważone są te sygnały.
Twitter algo 101
— Peter Yang (@petergyang) April 1, 2023
Boosts
– Likes 30x
– Retweets 20x
– Twitter Blue 2-4x
– Trusted circle 3x
– Images/videos 2x
– Replies 1x
Negatives
– URL only
– No text
– Mute
– Block
– Unfollow
– Report pic.twitter.com/mrCuGXB2gJ
W tej chwili wygląda na to, że mieliśmy rację co do jednego: tweety tylko z adresami URL są obniżane, a Polubienia i retweety znacznie zwiększają widoczność.
Heurystyka, filtry i cechy produktu
Po rankingu algorytmy Twittera zaczynają filtrować treści na podstawie takich rzeczy, jak to, kogo zablokowałeś lub wyciszyłeś, kogo ostatnio widziałeś, oraz wszelkie treści poza siecią, z którymi nie był zaangażowany ktoś, kogo obserwujesz.
Ostateczna oś czasu
Po przejściu przez mikser Domowy zalecane treści są mieszane z takimi rzeczami, jak dodawanie i przestrzeganie zaleceń, aby utworzyć ostateczną oś czasu.
Według Twittera cały proces trwa około 1,5 sekundy i przebiega 5 miliardów razy dziennie.