Hugging Face 每週速遞: Chatbot Hackathon;FLAN-T5 XL 微調;構建更安全的 LLM

語言: CN / TW / HK

每一週,我們的同事都會向社區的成員們發佈一些關於 Hugging Face 相關的更新,包括我們的產品和平台更新、社區活動、學習資源和內容更新、開源庫和模型更新等,我們將其稱之為「Hugging News」,本期 Hugging News 有哪些有趣的消息,快來看看吧!

🚀HACKATHON🚀 造個 🤖️ 去瀛海威廣場聚會啦!

百姓 AI 和 Hugging Face 聯合推出,就在下週末。大夥兒造/燥起來呀

使用 DeepSpeed 和 HuggingFace Transformers 對 FLAN-T5 XL/XXL 進行微調

《Scaling Instruction-Finetuned Language Models》論文中發佈的 FLAN-T5 是 T5 的增強版本,它已經在多種任務中進行了微調。相同參數數量下,FLAN-T5 的表現比 T5 提高了兩位數。Google 已經在 Hugging Face 上開源了 5 個版本,參數範圍從 80M 到 11B 不等。本文介紹瞭如何使用 Transformers 對其進行微調。

http://www.philschmid.de/fine-tune-flan-t5-deepspeed

Composable T2I-Adapter demo 更新了。一鍵風格遷移

demo: http://huggingface.co/spaces/Adapter/T2I-Adapter

阿里同學的山水畫風格文生圖模型

Demo: http://huggingface.co/spaces/hysts/cv_diffusion_text-to-image-synthesis_tiny

構建一個更加安全和友好的大語言模型

我們發佈了一篇博文,討論了一種名為“紅隊”(red-teaming)的方法,通過測試語言模型的脆弱性和潛在的有害行為,從而開發出指導模型生成的策略,以使其產生的內容更符合要求。我們探討了紅隊和對抗攻擊之間的相似之處和不同之處,並提供了一些紅隊測試的例子。希望 LLM 研究人員與我們共同合作,將紅隊方法應用到 LLM 的開發中,以創造一個更加安全友好的世界。

查看博客文章: http://hf.co/blog/red-teaming

Diffusers for Mac 1.1 發佈

新版本我們提供了更好的質量、更高的性能,以及對用户界面方面的改進。你可以更快的生成更高質量的圖片,以及在界面上可以做更多的配置、禁用安全檢查器、顯示模型下載狀態等。

Diffusers 的 Mac 版本是開源的,歡迎提交問題報告或 貢獻代碼

在 Gradio Blocks 中使用事件監聽器

你可以使用事件監聽器的 every 參數定期重複運行某個事件,當客户端連接打開時,每隔指定的秒數就會運行一次該事件。如果連接關閉,事件將在下一次迭代後停止運行。請注意,這不考慮事件本身的運行時間。因此,如果一個運行時間為 1 秒且 every=5 的函數,實際上將每隔 6 秒運行一次。

查看詳細文檔: http://gradio.app/blocks-and-event-listeners/#running-events-continuously

ChatRWKV v2 發佈

ChatRWKV v2 最新 prompt 的用户對話效果如下圖

代碼 http://github.com/BlinkDL/ChatRWKV

模型 http://huggingface.co/BlinkDL/rwkv-4-pile-14b/blob/main/RWKV-4-Pile-14B-20230228-ctx4096-test663.pth

運行 v2 / chat.py 就可以體驗

以上就是本期的 Hugging News,期待看到大家用 AI 構建的精彩應用!