Hugging Face 每週速遞: Chatbot Hackathon;FLAN-T5 XL 微調;構建更安全的 LLM
每一週,我們的同事都會向社區的成員們發佈一些關於 Hugging Face 相關的更新,包括我們的產品和平台更新、社區活動、學習資源和內容更新、開源庫和模型更新等,我們將其稱之為「Hugging News」,本期 Hugging News 有哪些有趣的消息,快來看看吧!
🚀HACKATHON🚀 造個 🤖️ 去瀛海威廣場聚會啦!
百姓 AI 和 Hugging Face 聯合推出,就在下週末。大夥兒造/燥起來呀
使用 DeepSpeed 和 HuggingFace Transformers 對 FLAN-T5 XL/XXL 進行微調
《Scaling Instruction-Finetuned Language Models》論文中發佈的 FLAN-T5 是 T5 的增強版本,它已經在多種任務中進行了微調。相同參數數量下,FLAN-T5 的表現比 T5 提高了兩位數。Google 已經在 Hugging Face 上開源了 5 個版本,參數範圍從 80M 到 11B 不等。本文介紹瞭如何使用 Transformers 對其進行微調。
https://www.philschmid.de/fine-tune-flan-t5-deepspeed
Composable T2I-Adapter demo 更新了。一鍵風格遷移
demo: https://huggingface.co/spaces/Adapter/T2I-Adapter
阿里同學的山水畫風格文生圖模型
Demo: https://huggingface.co/spaces/hysts/cv_diffusion_text-to-image-synthesis_tiny
構建一個更加安全和友好的大語言模型
我們發佈了一篇博文,討論了一種名為“紅隊”(red-teaming)的方法,通過測試語言模型的脆弱性和潛在的有害行為,從而開發出指導模型生成的策略,以使其產生的內容更符合要求。我們探討了紅隊和對抗攻擊之間的相似之處和不同之處,並提供了一些紅隊測試的例子。希望 LLM 研究人員與我們共同合作,將紅隊方法應用到 LLM 的開發中,以創造一個更加安全友好的世界。
查看博客文章: https://hf.co/blog/red-teaming
Diffusers for Mac 1.1 發佈
新版本我們提供了更好的質量、更高的性能,以及對用户界面方面的改進。你可以更快的生成更高質量的圖片,以及在界面上可以做更多的配置、禁用安全檢查器、顯示模型下載狀態等。
Diffusers 的 Mac 版本是開源的,歡迎提交問題報告或 貢獻代碼。
在 Gradio Blocks 中使用事件監聽器
你可以使用事件監聽器的 every
參數定期重複運行某個事件,當客户端連接打開時,每隔指定的秒數就會運行一次該事件。如果連接關閉,事件將在下一次迭代後停止運行。請注意,這不考慮事件本身的運行時間。因此,如果一個運行時間為 1 秒且 every=5 的函數,實際上將每隔 6 秒運行一次。
查看詳細文檔: https://gradio.app/blocks-and-event-listeners/#running-events-continuously
ChatRWKV v2 發佈
ChatRWKV v2 最新 prompt 的用户對話效果如下圖
代碼 https://github.com/BlinkDL/ChatRWKV
運行 v2 / chat.py 就可以體驗
以上就是本期的 Hugging News,期待看到大家用 AI 構建的精彩應用!
- 在一張 24 GB 的消費級顯卡上用 RLHF 微調 20B LLMs
- 如何評估大語言模型
- 千億參數開源大模型 BLOOM 背後的技術
- Kakao Brain 的開源 ViT、ALIGN 和 COYO 文字-圖片數據集
- AI 影評家: 用 Hugging Face 模型打造一個電影評分機器人
- 我的語言模型應該有多大?
- Hugging Face 每週速遞: Chatbot Hackathon;FLAN-T5 XL 微調;構建更安全的 LLM
- AI 大戰 AI,一個深度強化學習多智能體競賽系統
- Hugging Face 每週速遞: ChatGPT API 怎麼用?我們幫你搭好頁面了
- 深入瞭解視覺語言模型
- CPU推理|使用英特爾 Sapphire Rapids 加速 PyTorch Transformers
- 大語言模型: 新的摩爾定律?
- 從 PyTorch DDP 到 Accelerate 到 Trainer,輕鬆掌握分佈式訓練
- 從 PyTorch DDP 到 Accelerate 到 Trainer,輕鬆掌握分佈式訓練
- 在低代碼開發平台 ILLA Cloud 中使用 Hugging Face 上的模型
- 瞭解 Transformers 是如何“思考”的
- 第 1 天|基於 AI 進行遊戲開發:5 天創建一個農場遊戲!
- 加速 Document AI (文檔智能) 發展
- 一文帶你入門圖機器學習
- 解讀 ChatGPT 背後的技術重點:RLHF、IFT、CoT、紅藍對抗