亚洲国产成人精品无码一区二区_亚洲国产成人久久精品APP_亚洲精品成人网久久久久久_亚洲精品午夜无码电影网_亚洲另类欧美综合久久图片区_亚洲人成人无码网WWW电影首页_亚洲午夜福利AV一区二区无码_亚洲伊人久久精品影院_一本加勒比HEZYO无码人妻_怡红院精品久久久久久久高清,自拍偷在线精品自拍偷99,久久精品国产77777蜜臀,娇妻穿丁字裤被领导玩弄

網(wǎng)站地圖 - 關于我們
您的當前位置: 首頁 > 科技 正文

推特開源了,,馬斯克說到做到

作者:用戶投稿 時間:2023-04-04 06:30 點擊:次
導讀:編者按:本文來自微信公眾號“機器之心”(ID:almosthuman2014),,創(chuàng)業(yè)邦經(jīng)授權發(fā)布。如何振興推特,,馬斯克選擇「流量最大」的打法,。?馬斯克曾把特斯拉

編者按:本文來自微信公眾號“機器之心”(ID:almosthuman2014),,創(chuàng)業(yè)邦經(jīng)授權發(fā)布。

如何振興推特,,馬斯克選擇「流量最大」的打法,。?

馬斯克曾把特斯拉的專利開源,現(xiàn)在推特的算法也被他開源了,。?

首富伊隆?馬斯克去年收購推特前就曾表示,,推特的代碼應該在 GitHub 上公開,以便公眾對其進行檢查,,這樣才算得上健全,。在這不久后,馬斯克宣布收購推特,,推特的 GitHub 主頁上很快新增了一個「the-algorithm」倉庫,,不過這個倉庫很快就 404 了。?

前幾天他又表示,,推特會在 3 月 31 日開源推薦代碼,。這一次,他終于兌現(xiàn)了,。?

推特開源了,,馬斯克說到做到

馬斯克在推特上表示,,目前發(fā)布的是「大部分推薦算法」,,其余的將在未來發(fā)布,。?

短短幾個小時,該項目就收獲了 13.5K Github Star:?

推特開源了,,馬斯克說到做到

開源地址:https://github.com/twitter/the-algorithm?

在 Twitter Spaces 會議上,馬斯克解釋道:「最初發(fā)布的算法會非常尷尬,,人們會發(fā)現(xiàn)很多錯誤,,但我們會很快修復它們…… 即使你不同意某件事,至少你會知道它為什么在那里,,并且你沒有被秘密操縱...... 我們的參照物是 Linux ,,一個很好的開源操作系統(tǒng)樣本…… 理論上,人們可以發(fā)現(xiàn) Linux 的許多漏洞,,但實際上社區(qū)會識別并修復這些漏洞,。」?

既然開源,,那就表示接受修改建議,。馬斯克又表示了,每過 24 小時到 48 小時,,推特會根據(jù)用戶建議對推薦算法進行一次更新,。?

推特開源了,馬斯克說到做到

不僅接受人們的監(jiān)督,,還可以提升技術實力,看起來是一舉多得的好事,。?

有趣的是,,外媒 Gizmodo 的一篇報道指出, 推特向用戶推送的 VIP 列表似乎沒有公開,。本周 Platformer 報道稱,,推特有一份值得關注的用戶輪換名單,包括 YouTuber Mr. Beast 和 Daily Wire 創(chuàng)始人 Ben Shapiro,,它通過看似隨意地增加這些「高級用戶」的可見性來監(jiān)控推薦算法的變化,。?

還有更多證據(jù)表明,推特的算法可能會根據(jù)來源不同地對待推文,。研究人員 Jane Manchun Wong 指出,,推特的算法專門標記了「推文作者是否是 Elon Musk」,還有其他標簽表明作者是否是「高級用戶」等,。?

推特開源了,,馬斯克說到做到

對此,推特在今天下午的 Spaces 會議上也有回應,,一位推特工程師表示,,這些標簽僅用于衡量指標。而馬斯克說自己在今天之前不知道這些標簽,,并表示「它們不應該在那里」,。?

推特是如何選擇推文的?

在推特同期發(fā)布的技術博客上,,工程師們對推薦系統(tǒng)算法進行了一番解釋,。?

推特推薦系統(tǒng)的基礎是一套核心模型和功能,從推文,、用戶和相關數(shù)據(jù)中提取潛在的信息,。這些模型旨在回答關于 Twitter 網(wǎng)絡的重要問題,例如,,「你未來與另一個用戶互動的概率是多少,?」或者,「Twitter 上有哪些社區(qū),,其中有哪些流行的推文,?」準確地回答這些問題使 Twitter 能夠提供更相關的推薦。?

推薦流程由三個主要階段組成: ?

1. 從不同的推薦源中獲取最佳推文,,這個過程被稱為候選搜尋(candidate sourcing),。?

2. 使用機器學習模型對每條推文進行排名,。?

3. 應用啟發(fā)式方法和過濾器,,例如過濾掉你已經(jīng)屏蔽的用戶的推文、NSFW 內容,,以及你已經(jīng)看過的推文,。?

負責構建和服務 For You 時間線的服務被稱為 Home Mixer。Home Mixer 建立在 Product Mixer 上,,這是推特定制的 Scala 框架,,可以方便地構建內容提要。這項服務作為軟件主干,,連接不同的候選推文來源,、評分功能、啟發(fā)式方法和過濾器,。?

下面這張圖說明了用于構建時間線的主要組件:?

推特開源了,,馬斯克說到做到

接下來探討一下這個系統(tǒng)的關鍵部分,,大致按照在一次時間線請求中的調用順序,,從檢索候選推文源開始。?

候選推文源

Twitter 有幾個候選推文源,,他們用這些候選源來為用戶檢索最近的相關推文,。對于每個請求,,他們試圖通過這些來源從數(shù)以億計的推文池中提取最好的 1500 條推文。他們從你關注的人(網(wǎng)絡內)和你不關注的人(網(wǎng)絡外)中找到候選推文,。今天,,F(xiàn)or You 時間線平均由 50% 的網(wǎng)絡內(In-Network)推文和 50% 的網(wǎng)絡外(Out-of-Network)推文組成,盡管這可能因用戶而異,。?

網(wǎng)絡內推文源

網(wǎng)絡內推文源是最大的候選推文來源,,旨在提供你所關注的用戶的最相關、最近的推文,。它使用一個邏輯回歸模型,,根據(jù)相關性對你所關注的人的推文進行有效排名。然后,,排名靠前的推文被送到下一個階段,。?

對網(wǎng)絡內推文進行排名的最重要的組件是 Real Graph。Real Graph 是一個預測兩個用戶之間接觸的可能性的模型,。你和推文作者之間的 Real Graph 得分越高,,推薦內容中就會包含更多他們的推文。?

網(wǎng)絡內推文源一直是推特最近工作的主題,。他們最近停止了 Fanout 服務的使用,,這是一項有 12 年歷史的服務,以前用來從每個用戶的推文緩存中提供網(wǎng)絡內推文,。他們也正在重新設計邏輯回歸排名模型,,該模型最后一次更新和訓練是在幾年前!?

網(wǎng)絡外推文源

在用戶網(wǎng)絡之外尋找相關的推文是一個比較棘手的問題:如果你不關注作者,,推特怎么能知道某條推文是否與你有關,?為了解決這個問題,推特采取了兩種方法:?

1,、社交圖譜(Social Graph)?

第一個方法是通過分析你所關注的人或有類似興趣的人的參與情況,,來估計與你相關的內容。?

推特遍歷上述分析內容的圖,,以回答以下問題:?

我關注的人最近參與了哪些推文,?

誰喜歡與我相似的推文,他們最近還喜歡什么,?

推特會根據(jù)這些問題的答案生成候選推文,,并使用邏輯回歸模型對生成的推文進行排名。這種類型的圖遍歷對于網(wǎng)絡外推薦至關重要,。團隊開發(fā)了 GraphJet 圖處理引擎,,以維護用戶和推文之間的實時交互圖,以執(zhí)行這些遍歷。雖然這種用于搜索推特參與度和關注網(wǎng)絡的啟發(fā)式方法已被證明是有用的(這些目前服務于大約 15% 的主頁時間線推文),,但嵌入空間方法已成為網(wǎng)絡外推文的更大來源,。?

2、嵌入空間?

嵌入空間方法旨在回答一個關于內容相似度的普遍問題:「哪些推文和用戶與我的興趣相似,?」?

嵌入的工作原理是生成用戶興趣和推文內容的數(shù)字表征,,然后推特就可以計算該嵌入空間中任意兩個用戶、推文或用戶 - 推文對之間的相似度,。如果生成了準確的嵌入,,推特可以使用這種相似性作為相關性的替代。?

推特最有用的嵌入空間之一是 SimClusters,。SimClusters 使用自定義的矩陣因子化算法,,發(fā)現(xiàn)由有影響力的用戶集群錨定的社區(qū)。這里有 14.5 萬個社區(qū),,每三周更新一次,。用戶和推特在社區(qū)的空間中被表示出來,并且可以屬于多個社區(qū),。社區(qū)的規(guī)模從個人朋友圈的幾千個用戶到新聞或流行文化的幾億個用戶不等,。這些是一些最大的社區(qū):?

推特開源了,馬斯克說到做到

此外,,推特還可以通過查看推文在每個社區(qū)中的當前流行度來將推文嵌入到這些社區(qū)中。喜歡推文的社區(qū)用戶越多,,推文與該社區(qū)的關聯(lián)度就越高,。?

排序

「For you」時間線的目標是為用戶提供相關的推文。在 pipeline 的這一點上,,有大約 1500 個可能是相關的候選項,。分數(shù)會直接預測每個候選推文的相關性,是在用戶時間線上對推文進行排序的主要信號,。在這個階段,所有的候選項都被平等對待,,而不考慮它來自哪個候選來源,。?

排序是通過一個約 4800 萬參數(shù)的神經(jīng)網(wǎng)絡實現(xiàn)的,該網(wǎng)絡在推特互動數(shù)據(jù)上不斷訓練,,以優(yōu)化積極的參與(例如,,贊、轉發(fā)和回復),。這個排序機制考慮到了成千上萬的特征,,并輸出十個標簽來給每條推文打分,其中每個標簽代表了參與的概率。然后,,推特根據(jù)這些分數(shù)對推文進行排名,。?

啟發(fā)式、濾波器和產品功能

在排序階段之后,,推特應用啟發(fā)式和濾波器來實現(xiàn)各種產品功能,。這些功能會協(xié)同工作以創(chuàng)建平衡且多樣化的提要。一些例子包括:?

可見性過濾:根據(jù)內容和用戶偏好過濾掉推文,。例如,,刪除其屏蔽或靜音的帳戶的推文。?

作者多樣性:避免來自同一作者的太多連續(xù)推文,。

內容平衡:確保推特提供網(wǎng)絡內和網(wǎng)絡外推文的公平和平衡,。

基于反饋的疲勞分析:如果用戶提供了負面反饋,則降低某些推文的分數(shù),。

社會證明:排除與推文沒有二級關聯(lián)的網(wǎng)絡外推文作為質量保障,。換句話說,確保你關注的人參與了這條推文或關注了推文的作者,。

對話:通過將回復與原始推文串連在一起,,為回復提供更多上下文。

已編輯的推文:確定設備上當前的推文是否過時,,并發(fā)送指令以將其替換為已編輯的版本,。

混合與服務

至此,Home Mixer 已準備好發(fā)送到用戶設備的一組推文,。作為流程的最后一步,,系統(tǒng)將推文與其他非推文內容(如廣告、關注推薦和 Onboarding prompt)混合在一起,,這些內容將返回到用戶設備上進行顯示,。 ?

上述 pipeline 每天運行大約 50 億次,平均完成時間不到 1.5 秒,。單個 pipeline 執(zhí)行需要 220 秒的 CPU 時間,,幾乎是在應用程序上看到的延遲的 150 倍。?

推特開源了,,馬斯克說到做到

推特正在開發(fā)更多新功能,為用戶提供更多的透明度,。下一步計劃包括:?

為創(chuàng)作者提供更好的推特分析平臺,,提供更多關于影響力和參與度的信息;

提高應用到用戶推文或帳戶的任何安全標簽的透明度,;

更好地了解推文出現(xiàn)在時間線上的原因,。

最后,,在代碼公開的幾個小時內,已經(jīng)有人在推特代碼中找到了一些「奇怪」的地方,。?

比如馬斯克在推特算法中有自己的特征類:?

推特開源了,,馬斯克說到做到

或許馬斯克在神經(jīng)網(wǎng)絡中也有自己的特殊嵌入向量,。?

另外還有專屬的變量:?

推特開源了,,馬斯克說到做到

畢竟人家是公司老板,。?

推特開源了,,馬斯克說到做到

不知在網(wǎng)友的挖掘之下,,還能發(fā)現(xiàn)推特代碼里哪些有趣之處,??

參考鏈接:https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm?

本文(含圖片)為合作媒體授權創(chuàng)業(yè)邦轉載,不代表創(chuàng)業(yè)邦立場,,轉載請聯(lián)系原作者,。如有任何疑問,請聯(lián)系

打賞

取消

感謝您的支持,,我會繼續(xù)努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,,即可進行掃碼打賞哦

相關推薦:

網(wǎng)友評論:

推薦使用友言、多說,、暢言(需備案后使用)等社會化評論插件

Copyright ? 2021 早報網(wǎng) 版權所有

蘇ICP備19042297號-4
本網(wǎng)站所刊載信息,,不代表早報網(wǎng)觀點,。如您發(fā)現(xiàn)內容涉嫌侵權違法立即與我們聯(lián)系客服 106291126@qq.com 對其相關內容進行刪除。
早報網(wǎng)登載文章只用于傳遞更多信息之目的,,并不意味著贊同其觀點或證實其描述,。文章內容僅供參考,不構成投資建議,。投資者據(jù)此操作,,風險自擔。
《早報網(wǎng)》官方網(wǎng)站:xzxyjj.com互聯(lián)網(wǎng)違法和不良信息舉報中心
Top