🎉 親愛的廣場小夥伴們,福利不停,精彩不斷!目前廣場上這些熱門發帖贏獎活動火熱進行中,發帖越多,獎勵越多,快來 GET 你的專屬好禮吧!🚀
🆘 #Gate 2025年中社区盛典# |廣場十強內容達人評選
決戰時刻到!距離【2025年中社區盛典】廣場達人評選只剩 1 天,你喜愛的達人,就差你這一票衝進 C 位!在廣場發帖、點讚、評論就能攢助力值,幫 Ta 上榜的同時,你自己還能抽大獎!iPhone 16 Pro Max、金牛雕塑、潮流套裝、合約體驗券 等你抱走!
詳情 👉 https://www.gate.com/activities/community-vote
1️⃣ #晒出我的Alpha积分# |曬出 Alpha 積分&收益
Alpha 積分黨集合!帶話題曬出你的 Alpha 積分圖、空投中獎圖,即可瓜分 $200 Alpha 代幣盲盒,積分最高直接抱走 $100!分享攢分祕籍 / 兌換經驗,中獎率直線上升!
詳情 👉 https://www.gate.com/post/status/12763074
2️⃣ #ETH百万矿王争霸赛# |ETH 鏈上挖礦曬收益
礦工集結!帶話題曬出你的 Gate ETH 鏈上挖礦收益圖,瓜分 $400 曬圖獎池,收益榜第一獨享 $200!誰才是真 ETH 礦王?開曬見分曉!
詳情 👉 https://www.gate.com/pos
GPT-5不遠了! OpenAI推出網絡爬蟲GPTBot,自動抓取數據,可選擇性關閉
編輯:桃子好困
來源:新智元
**導讀:**就在剛剛,OpenAI推出了GPTBot——一個可以自動從整個互聯網抓取數據的網絡爬蟲。得到的這些數據則會被用來訓練像GPT-4和GPT-5這樣的AI模型!
前段時間,抓取平台用戶數據風波,Reddit網友吵翻了天。
今天,OpenAI推出了一個網絡爬蟲工具GPTBot,能夠自動抓取網站的數據。
**如何使用? **
OpenAI在發布的文檔中表示,網絡爬蟲將過濾刪除需要付費強訪問的來源,同時也會刪除個人身份信息(PII)或違反其政策的文本。
GPTBot抓取的數據,被用來訓練GPT-4或GPT-5,能夠提升未來人工智能係統的準確性和能力。
可通過以下代碼識別該工具:
用戶代理令牌:GPTBotFull 用戶代理字符串:Mozilla/5.0 AppleWebKit/537.36(KHTML,如 Gecko;兼容;GPTBot/1.0;+
禁止GPTBot訪問
另一方面,你也可以通過將GPTBot添加到站點robots. txt,來禁止其訪問網站。
這意味著,網站所有者必須自願採取措施,禁止OpenAI對自己的網站訪問,不將自己的數據用來訓練。
用戶代理:GPTBotDisallow:/
自定義GPTBot訪問
你還可以通過以下代碼,來控制GPTBot對網站部分內容的訪問。
用戶代理:GPTBotAllow:/directory-1/Disallow:/directory-2/
IP出口
對於OpenAI的爬蟲,將從OpenAI網站上記錄的IP地址塊調用網站。
網友熱議
OpenAI此舉引發了網友對用於訓練AI模型的網絡爬蟲的道德問題的討論。
「OpenAI甚至沒有適度引用。它是在製作衍生作品,卻沒有引用,從而掩蓋了它的事實。」
參考資料: